ガイド
タスク(認識)
画像からテキストへのタスク

OCR イメージからテキストへの変換

WARNING

createTaskを使用してタスクを作成します。

このインターフェースでは、結果を別途取得する必要はありません。画像認識の結果を同期的に返します!

タスクの作成

createTaskを使用してタスクを作成します。

タスクオブジェクトの構造

このタイプのタスクは、createTaskの直後にタスクの実行結果を直接返します。タスクの実行結果を非同期に取得する必要はありません。

プロパティタイプ必須説明
typeStringRequiredImageToTextTask
bodyStringRequired画像のbase64エンコードされたコンテンツ(改行なし)(data:image/*********; base64、コンテンツは含まれません)
moduleStringOptionalモジュールを指定します。現在、サポートされているモジュールはcommonとqueueitのみです
scoreFloatOptional0.8 ~ 1、一致度を識別します。認識率がこの範囲内でない場合、減点はありません。
caseBooleanOptional大文字と小文字を区別するかどうか

独立したモジュールのサポート

ModuleQuestionsSamplesAccuracyLastUpdate

例のリクエスト

POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
 
{
   "clientKey": "YOUR_API_KEY",
   "task":{
        "type":"ImageToTextTask",
        "module":"queueit", // ocr single image model,
        "body": "/9j/4AAQSkZJRgABA......" # base64エンコードされた画像
   }
}

例のレスポンス

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "",
  "status": "ready",
  "solution": {
    "text": "44795sds"
  },
  "taskId": "2376919c-1863-11ec-a012-94e6f7355a0b",
}

SDKリクエストの使用

# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
 
import capsolver
 
# capsolver.api_key = "..."
 
img_path = os.path.join(Path(__file__).resolve().parent, "queue-it.jpg")
with open(img_path, 'rb') as f:
    solution = capsolver.solve({
        "type": "ImageToTextTask",
        "module": "queueit",
        "body": "/9j/4AAQSkZJRgABA......"
    })
    print(solution)