OCR ImageToText
WARNING
Créez la tâche avec la fonction createTask.
Cette interface ne nécessite pas d’obtenir les résultats séparément, elle renverra directement les résultats de la reconnaissance d’image !
Le champ type
de la tâche est le suivant :
ImageToTextTask
Créer une tâche
Créez la tâche avec la fonction createTask.
Structure de l’objet tâche
Notez que ce type de tâche renvoie le résultat d’exécution de la tâche directement après createTask, plutôt que de l’obtenir de manière asynchrone via getTaskResult.
Propriétés | Type | Obligatoire | Description |
---|---|---|---|
type | String | Obligatoire | ImageToTextTask |
websiteURL | String | Facultatif | URL de la source de la page pour améliorer la précision |
body | String | Obligatoire | Contenu encodé en base64 de l’image (pas de nouvelles lignes, pas de data:image/***;charset=utf-8;base64,) |
images | List[string] | Facultatif | Uniquement pour le module number , prend en charge jusqu’à 9 images codées en base64 à la fois |
module | String | Facultatif | Spécifie le module. Tous les modèles pris en charge sont indiqués dans le tableau ci-dessous |
Support des modules indépendants
Module | Questions | Samples | Accuracy | LastUpdate |
---|
Exemple de requête
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
// Vous pouvez choisir le module que vous souhaitez utiliser
// modèle d'image unique ocr, commun par défaut
"module": "common",
// image codée en base64
"body": "/9j/4AAQSkZJRgABA......"
}
}
S’il n’y a que des nombres sur l’image, il est recommandé d’utiliser le module number
. Exemple de requête :
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
"module": "number",
// Insérer jusqu'à 9 images
"images": [
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA..."
]
}
}
Exemple de réponse
{
"errorId": 0,
"errorCode": "",
"errorDescription": "",
"status": "ready",
"solution": {
"text": "44795sds",
// module number :
"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
},
"taskId": "..."
}
Utiliser la requête SDK
# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
import capsolver
capsolver.api_key = "..."
solution = capsolver.solve({
"type": "ImageToTextTask",
"module": "common",
"body": "/9j/4AAQSkZJRgABA......"
})
print(solution)