OCR ImageToText
WARNING
Crie a tarefa com o createTask.
Esta interface não precisa obter os resultados separadamente, retornará diretamente os resultados do reconhecimento de imagem!
O campo type
da tarefa é o seguinte
ImageToTextTask
Criar Tarefa
Crie a tarefa com o createTask.
Estrutura do Objeto Tarefa
Observe que este tipo de tarefa retorna o resultado da execução da tarefa diretamente após createTask, em vez de obtê-lo assincronamente através do getTaskResult.
Propriedades | Tipo | Obrigatório | Descrição |
---|---|---|---|
type | String | Sim | ImageToTextTask |
websiteURL | String | Não | URL da página de origem para melhorar a precisão |
body | String | Sim | Conteúdo codificado em base64 da imagem (sem novas linhas, sem data:image/***;charset=utf-8;base64,) |
images | List[string] | Não | Apenas para o módulo number , suporta até 9 imagens codificadas em base64 por vez |
module | String | Não | Especifica o módulo. Todos os modelos suportados são mostrados na tabela abaixo |
Suporte a módulo independente
Module | Questions | Samples | Accuracy | LastUpdate |
---|
Exemplo de Requisição
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
// Você pode escolher o módulo que precisa usar
// modelo de imagem única ocr, comum padrão
"module": "common",
// imagem codificada em base64
"body": "/9j/4AAQSkZJRgABA......"
}
}
Se houver apenas números na imagem, recomenda-se que você use o módulo number
. Exemplo de Requisição:
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
"module": "number",
// Coloque até 9 imagens
"images": [
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA..."
]
}
}
Exemplo de Resposta
{
"errorId": 0,
"errorCode": "",
"errorDescription": "",
"status": "ready",
"solution": {
"text": "44795sds",
// módulo number:
"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
},
"taskId": "..."
}
Usar Requisição SDK
# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
import capsolver
capsolver.api_key = "..."
solution = capsolver.solve({
"type": "ImageToTextTask",
"module": "common",
"body": "/9j/4AAQSkZJRgABA......"
})
print(solution)