OCR イメージからテキストへの変換
WARNING
createTaskを使用してタスクを作成します。
このインターフェースでは、結果を別途取得する必要はありません。画像認識の結果を同期的に返します!
タスクの作成
createTaskを使用してタスクを作成します。
タスクオブジェクトの構造
このタイプのタスクは、createTaskの直後にタスクの実行結果を直接返します。タスクの実行結果を非同期に取得する必要はありません。
プロパティ | タイプ | 必須 | 説明 |
---|---|---|---|
type | String | Required | ImageToTextTask |
body | String | Required | 画像のbase64エンコードされたコンテンツ(改行なし)(data:image/*********; base64、コンテンツは含まれません) |
module | String | Optional | モジュールを指定します。現在、サポートされているモジュールはcommonとqueueitのみです |
score | Float | Optional | 0.8 ~ 1 、一致度を識別します。認識率がこの範囲内でない場合、減点はありません。 |
case | Boolean | Optional | 大文字と小文字を区別するかどうか |
独立したモジュールのサポート
Module | Questions | Samples | Accuracy | LastUpdate |
---|
例のリクエスト
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
"clientKey": "YOUR_API_KEY",
"task":{
"type":"ImageToTextTask",
"module":"queueit", // ocr single image model,
"body": "/9j/4AAQSkZJRgABA......" # base64エンコードされた画像
}
}
例のレスポンス
{
"errorId": 0,
"errorCode": "",
"errorDescription": "",
"status": "ready",
"solution": {
"text": "44795sds"
},
"taskId": "2376919c-1863-11ec-a012-94e6f7355a0b",
}
SDKリクエストの使用
# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
import capsolver
# capsolver.api_key = "..."
img_path = os.path.join(Path(__file__).resolve().parent, "queue-it.jpg")
with open(img_path, 'rb') as f:
solution = capsolver.solve({
"type": "ImageToTextTask",
"module": "queueit",
"body": "/9j/4AAQSkZJRgABA......"
})
print(solution)