ガイド
タスク(認識)
ImageToText

OCR ImageToText

WARNING

createTask を使用してタスクを作成します。

このインターフェースは、結果を個別に取得する必要がなく、画像認識の結果を直接返します!

タスクのtypeフィールドは以下のとおりです

  • ImageToTextTask

タスクの作成

createTask を使用してタスクを作成します。

タスクオブジェクトの構造

このタイプのタスクは、createTaskの後、非同期でgetTaskResultを通して取得するのではなく、タスク実行結果を直接返します。

プロパティタイプ必須説明
typeString必須ImageToTextTask
websiteURLStringオプション精度向上のためのページソースURL
bodyString必須base64エンコードされた画像の内容(改行なし、data:image/***;charset=utf-8;base64,なし)
imagesList[string]オプションnumber モジュールのみ、最大9枚のbase64エンコードされた画像を一度にサポート
moduleStringオプションモジュールを指定します。サポートされているすべてのモデルは下の表に示されています

独立モジュールのサポート

ModuleQuestionsSamplesAccuracyLastUpdate

要求例

POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    // 必要に応じてモジュールを選択できます
    // ocr単一画像モデル、デフォルトはcommon
    "module": "common",
    // base64エンコードされた画像
    "body": "/9j/4AAQSkZJRgABA......"
  }
}

画像に数字のみが含まれる場合は、numberモジュールを使用することをお勧めします。要求例:

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    "module": "number",
    // 最大9枚の画像を指定
    "images": [
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA..."
    ]
  }
}

応答例

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "",
  "status": "ready",
  "solution": {
    "text": "44795sds",
    // numberモジュール:
	"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
  },
  "taskId": "..."
}

SDKを使ったリクエスト

# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
 
import capsolver
 
capsolver.api_key = "..."
solution = capsolver.solve({
    "type": "ImageToTextTask",
    "module": "common",
    "body": "/9j/4AAQSkZJRgABA......"
})
print(solution)