OCR ImageToText

WARNING

Créez la tâche avec la fonction createTask.

Cette interface ne nécessite pas d’obtenir les résultats séparément, elle renverra directement les résultats de la reconnaissance d’image !

Le champ type de la tâche est le suivant :

ImageToTextTask

Créer une tâche

Créez la tâche avec la fonction createTask.

Structure de l’objet tâche

Notez que ce type de tâche renvoie le résultat d’exécution de la tâche directement après createTask, plutôt que de l’obtenir de manière asynchrone via getTaskResult.

Propriétés	Type	Obligatoire	Description
type	String	Obligatoire	ImageToTextTask
websiteURL	String	Facultatif	URL de la source de la page pour améliorer la précision
body	String	Obligatoire	Contenu encodé en base64 de l’image (pas de nouvelles lignes, pas de data:image/***;charset=utf-8;base64,)
images	List[string]	Facultatif	Uniquement pour le module `number`, prend en charge jusqu’à 9 images codées en base64 à la fois
module	String	Facultatif	Spécifie le module. Tous les modèles pris en charge sont indiqués dans le tableau ci-dessous

Support des modules indépendants

Module	Questions	Samples	Accuracy	LastUpdate

Exemple de requête

POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    // Vous pouvez choisir le module que vous souhaitez utiliser
    // modèle d'image unique ocr, commun par défaut
    "module": "common",
    // image codée en base64
    "body": "/9j/4AAQSkZJRgABA......"
  }
}

S’il n’y a que des nombres sur l’image, il est recommandé d’utiliser le module number. Exemple de requête :

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    "module": "number",
    // Insérer jusqu'à 9 images
    "images": [
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA..."
    ]
  }
}

Exemple de réponse

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "",
  "status": "ready",
  "solution": {
    "text": "44795sds",
    // module number :
	"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
  },
  "taskId": "..."
}

Utiliser la requête SDK

# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
 
import capsolver
 
capsolver.api_key = "..."
solution = capsolver.solve({
    "type": "ImageToTextTask",
    "module": "common",
    "body": "/9j/4AAQSkZJRgABA......"
})
print(solution)

Codes d'erreur reCAPTCHA v2