Anleitung
Aufgabe (Erkennung)
ImageToText

OCR Bild-zu-Text

WARNUNG

Erstellen Sie die Aufgabe mit createTask.

Diese Schnittstelle muss die Ergebnisse nicht separat abrufen, sondern gibt die Bilderkennungsergebnisse direkt zurück!

Das Aufgabenfeld type lautet wie folgt:

  • ImageToTextTask

Aufgabe erstellen

Erstellen Sie die Aufgabe mit createTask.

Struktur des Aufgabenobjekts

Beachten Sie, dass diese Art von Aufgabe das Ergebnis der Aufgabenausführung direkt nach createTask zurückgibt, anstatt es asynchron über getTaskResult abzurufen.

EigenschaftenTypErforderlichBeschreibung
typeStringErforderlichImageToTextTask
websiteURLStringOptionalSeiten-Quell-URL zur Verbesserung der Genauigkeit
bodyStringErforderlichBase64-codierter Inhalt des Bildes (keine Zeilenumbrüche, kein data:image/***;charset=utf-8;base64,)
imagesList[string]OptionalNur für das Modul number, unterstützt bis zu 9 base64-codierte Bilder gleichzeitig
moduleStringOptionalGibt das Modul an. Alle unterstützten Modelle sind in der Tabelle unten aufgeführt

Unterstützung unabhängiger Module

ModuleQuestionsSamplesAccuracyLastUpdate

Beispielanfrage

POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    // Sie können das Modul auswählen, das Sie verwenden möchten
    // ocr Einzelbildmodell, Standard common
    "module": "common",
    // base64-codiertes Bild
    "body": "/9j/4AAQSkZJRgABA......"
  }
}

Wenn das Bild nur Zahlen enthält, wird empfohlen, das Modul number zu verwenden. Beispielanfrage:

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    "module": "number",
    // Bis zu 9 Bilder einfügen
    "images": [
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA..."
    ]
  }
}

Beispielantwort

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "",
  "status": "ready",
  "solution": {
    "text": "44795sds",
    // number Modul:
	"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
  },
  "taskId": "..."
}

SDK-Anfrage verwenden

# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
 
import capsolver
 
capsolver.api_key = "..."
solution = capsolver.solve({
    "type": "ImageToTextTask",
    "module": "common",
    "body": "/9j/4AAQSkZJRgABA......"
})
print(solution)