OCR ImageToText
WARNING
createTask を使用してタスクを作成します。
このインターフェースは、結果を個別に取得する必要がなく、画像認識の結果を直接返します!
タスクのtype
フィールドは以下のとおりです
ImageToTextTask
タスクの作成
createTask を使用してタスクを作成します。
タスクオブジェクトの構造
このタイプのタスクは、createTask
の後、非同期でgetTaskResult
を通して取得するのではなく、タスク実行結果を直接返します。
プロパティ | タイプ | 必須 | 説明 |
---|---|---|---|
type | String | 必須 | ImageToTextTask |
websiteURL | String | オプション | 精度向上のためのページソースURL |
body | String | 必須 | base64エンコードされた画像の内容(改行なし、data:image/***;charset=utf-8;base64,なし) |
images | List[string] | オプション | number モジュールのみ、最大9枚のbase64エンコードされた画像を一度にサポート |
module | String | オプション | モジュールを指定します。サポートされているすべてのモデルは下の表に示されています |
独立モジュールのサポート
Module | Questions | Samples | Accuracy | LastUpdate |
---|
要求例
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
// 必要に応じてモジュールを選択できます
// ocr単一画像モデル、デフォルトはcommon
"module": "common",
// base64エンコードされた画像
"body": "/9j/4AAQSkZJRgABA......"
}
}
画像に数字のみが含まれる場合は、number
モジュールを使用することをお勧めします。要求例:
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
"module": "number",
// 最大9枚の画像を指定
"images": [
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA..."
]
}
}
応答例
{
"errorId": 0,
"errorCode": "",
"errorDescription": "",
"status": "ready",
"solution": {
"text": "44795sds",
// numberモジュール:
"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
},
"taskId": "..."
}
SDKを使ったリクエスト
# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
import capsolver
capsolver.api_key = "..."
solution = capsolver.solve({
"type": "ImageToTextTask",
"module": "common",
"body": "/9j/4AAQSkZJRgABA......"
})
print(solution)