Guia
Tarefa (Reconhecimento)
ImageToText

OCR ImageToText

WARNING

Crie a tarefa com o createTask.

Esta interface não precisa obter os resultados separadamente, retornará diretamente os resultados do reconhecimento de imagem!

O campo type da tarefa é o seguinte

  • ImageToTextTask

Criar Tarefa

Crie a tarefa com o createTask.

Estrutura do Objeto Tarefa

Observe que este tipo de tarefa retorna o resultado da execução da tarefa diretamente após createTask, em vez de obtê-lo assincronamente através do getTaskResult.

PropriedadesTipoObrigatórioDescrição
typeStringSimImageToTextTask
websiteURLStringNãoURL da página de origem para melhorar a precisão
bodyStringSimConteúdo codificado em base64 da imagem (sem novas linhas, sem data:image/***;charset=utf-8;base64,)
imagesList[string]NãoApenas para o módulo number, suporta até 9 imagens codificadas em base64 por vez
moduleStringNãoEspecifica o módulo. Todos os modelos suportados são mostrados na tabela abaixo

Suporte a módulo independente

ModuleQuestionsSamplesAccuracyLastUpdate

Exemplo de Requisição

POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    // Você pode escolher o módulo que precisa usar
    // modelo de imagem única ocr, comum padrão
    "module": "common",
    // imagem codificada em base64
    "body": "/9j/4AAQSkZJRgABA......"
  }
}

Se houver apenas números na imagem, recomenda-se que você use o módulo number. Exemplo de Requisição:

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    "module": "number",
    // Coloque até 9 imagens
    "images": [
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA..."
    ]
  }
}

Exemplo de Resposta

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "",
  "status": "ready",
  "solution": {
    "text": "44795sds",
    // módulo number:
	"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
  },
  "taskId": "..."
}

Usar Requisição SDK

# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
 
import capsolver
 
capsolver.api_key = "..."
solution = capsolver.solve({
    "type": "ImageToTextTask",
    "module": "common",
    "body": "/9j/4AAQSkZJRgABA......"
})
print(solution)