OCR Bild-zu-Text
WARNUNG
Erstellen Sie die Aufgabe mit createTask.
Diese Schnittstelle muss die Ergebnisse nicht separat abrufen, sondern gibt die Bilderkennungsergebnisse direkt zurück!
Das Aufgabenfeld type
lautet wie folgt:
ImageToTextTask
Aufgabe erstellen
Erstellen Sie die Aufgabe mit createTask.
Struktur des Aufgabenobjekts
Beachten Sie, dass diese Art von Aufgabe das Ergebnis der Aufgabenausführung direkt nach createTask zurückgibt, anstatt es asynchron über getTaskResult abzurufen.
Eigenschaften | Typ | Erforderlich | Beschreibung |
---|---|---|---|
type | String | Erforderlich | ImageToTextTask |
websiteURL | String | Optional | Seiten-Quell-URL zur Verbesserung der Genauigkeit |
body | String | Erforderlich | Base64-codierter Inhalt des Bildes (keine Zeilenumbrüche, kein data:image/***;charset=utf-8;base64,) |
images | List[string] | Optional | Nur für das Modul number , unterstützt bis zu 9 base64-codierte Bilder gleichzeitig |
module | String | Optional | Gibt das Modul an. Alle unterstützten Modelle sind in der Tabelle unten aufgeführt |
Unterstützung unabhängiger Module
Module | Questions | Samples | Accuracy | LastUpdate |
---|
Beispielanfrage
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
// Sie können das Modul auswählen, das Sie verwenden möchten
// ocr Einzelbildmodell, Standard common
"module": "common",
// base64-codiertes Bild
"body": "/9j/4AAQSkZJRgABA......"
}
}
Wenn das Bild nur Zahlen enthält, wird empfohlen, das Modul number
zu verwenden. Beispielanfrage:
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
"module": "number",
// Bis zu 9 Bilder einfügen
"images": [
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA..."
]
}
}
Beispielantwort
{
"errorId": 0,
"errorCode": "",
"errorDescription": "",
"status": "ready",
"solution": {
"text": "44795sds",
// number Modul:
"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
},
"taskId": "..."
}
SDK-Anfrage verwenden
# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
import capsolver
capsolver.api_key = "..."
solution = capsolver.solve({
"type": "ImageToTextTask",
"module": "common",
"body": "/9j/4AAQSkZJRgABA......"
})
print(solution)