OCR Bild-zu-Text

WARNUNG

Erstellen Sie die Aufgabe mit createTask.

Diese Schnittstelle muss die Ergebnisse nicht separat abrufen, sondern gibt die Bilderkennungsergebnisse direkt zurück!

Das Aufgabenfeld type lautet wie folgt:

ImageToTextTask

Aufgabe erstellen

Erstellen Sie die Aufgabe mit createTask.

Struktur des Aufgabenobjekts

Beachten Sie, dass diese Art von Aufgabe das Ergebnis der Aufgabenausführung direkt nach createTask zurückgibt, anstatt es asynchron über getTaskResult abzurufen.

Eigenschaften	Typ	Erforderlich	Beschreibung
type	String	Erforderlich	ImageToTextTask
websiteURL	String	Optional	Seiten-Quell-URL zur Verbesserung der Genauigkeit
body	String	Erforderlich	Base64-codierter Inhalt des Bildes (keine Zeilenumbrüche, kein data:image/***;charset=utf-8;base64,)
images	List[string]	Optional	Nur für das Modul `number`, unterstützt bis zu 9 base64-codierte Bilder gleichzeitig
module	String	Optional	Gibt das Modul an. Alle unterstützten Modelle sind in der Tabelle unten aufgeführt

Unterstützung unabhängiger Module

Module	Questions	Samples	Accuracy	LastUpdate

Beispielanfrage

POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    // Sie können das Modul auswählen, das Sie verwenden möchten
    // ocr Einzelbildmodell, Standard common
    "module": "common",
    // base64-codiertes Bild
    "body": "/9j/4AAQSkZJRgABA......"
  }
}

Wenn das Bild nur Zahlen enthält, wird empfohlen, das Modul number zu verwenden. Beispielanfrage:

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    "module": "number",
    // Bis zu 9 Bilder einfügen
    "images": [
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA..."
    ]
  }
}

Beispielantwort

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "",
  "status": "ready",
  "solution": {
    "text": "44795sds",
    // number Modul:
	"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
  },
  "taskId": "..."
}

SDK-Anfrage verwenden

# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
 
import capsolver
 
capsolver.api_key = "..."
solution = capsolver.solve({
    "type": "ImageToTextTask",
    "module": "common",
    "body": "/9j/4AAQSkZJRgABA......"
})
print(solution)

Fehlercodes reCAPTCHA v2