Guide
Tâche (Reconnaissance)
ImageToText

OCR ImageToText

WARNING

Créez la tâche avec la fonction createTask.

Cette interface ne nécessite pas d’obtenir les résultats séparément, elle renverra directement les résultats de la reconnaissance d’image !

Le champ type de la tâche est le suivant :

  • ImageToTextTask

Créer une tâche

Créez la tâche avec la fonction createTask.

Structure de l’objet tâche

Notez que ce type de tâche renvoie le résultat d’exécution de la tâche directement après createTask, plutôt que de l’obtenir de manière asynchrone via getTaskResult.

PropriétésTypeObligatoireDescription
typeStringObligatoireImageToTextTask
websiteURLStringFacultatifURL de la source de la page pour améliorer la précision
bodyStringObligatoireContenu encodé en base64 de l’image (pas de nouvelles lignes, pas de data:image/***;charset=utf-8;base64,)
imagesList[string]FacultatifUniquement pour le module number, prend en charge jusqu’à 9 images codées en base64 à la fois
moduleStringFacultatifSpécifie le module. Tous les modèles pris en charge sont indiqués dans le tableau ci-dessous

Support des modules indépendants

ModuleQuestionsSamplesAccuracyLastUpdate

Exemple de requête

POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    // Vous pouvez choisir le module que vous souhaitez utiliser
    // modèle d'image unique ocr, commun par défaut
    "module": "common",
    // image codée en base64
    "body": "/9j/4AAQSkZJRgABA......"
  }
}

S’il n’y a que des nombres sur l’image, il est recommandé d’utiliser le module number. Exemple de requête :

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    "module": "number",
    // Insérer jusqu'à 9 images
    "images": [
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA..."
    ]
  }
}

Exemple de réponse

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "",
  "status": "ready",
  "solution": {
    "text": "44795sds",
    // module number :
	"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
  },
  "taskId": "..."
}

Utiliser la requête SDK

# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
 
import capsolver
 
capsolver.api_key = "..."
solution = capsolver.solve({
    "type": "ImageToTextTask",
    "module": "common",
    "body": "/9j/4AAQSkZJRgABA......"
})
print(solution)