OCR イメージからテキストへの変換
タスクの作成
createTaskを使用してタスクを作成します。
タスクオブジェクトの構造
このタイプのタスクは、createTaskの直後にタスクの実行結果を直接返します。タスクの実行結果を非同期に取得する必要はありません。
プロパティ | タイプ | 必須 | 説明 |
---|---|---|---|
type | String | Required | ImageToTextTask |
body | String | Required | 画像のbase64エンコードされたコンテンツ(改行なし)(data:image/*********; base64、コンテンツは含まれません) |
module | String | Optional | モジュールを指定します。現在、サポートされているモジュールはcommonとqueueitのみです |
score | Float | Optional | 0.8 ~ 1 、一致度を識別します。認識率がこの範囲内でない場合、減点はありません。 |
case | Boolean | Optional | 大文字と小文字を区別するかどうか |
独立したモジュールのサポート
- mtcaptcha
- dell
- queueit
- amazon
- amazon-gif
- web-de-login
- web-de-register
- web-de-imap
- io-bs-mou
- cargo
- common
例のリクエスト
json
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
"clientKey": "YOUR_API_KEY",
"task":{
"type":"ImageToTextTask",
"module":"queueit", // ocr single image model,
"body": "/9j/4AAQSkZJRgABA......" # base64エンコードされた画像
}
}
例のレスポンス
json
{
"errorId": 0,
"errorCode": "",
"errorDescription": "",
"status": "ready",
"solution": {
"text": "44795sds"
},
"taskId": "2376919c-1863-11ec-a012-94e6f7355a0b",
}
SDKリクエストの使用
python
# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
import capsolver
# capsolver.api_key = "..."
img_path = os.path.join(Path(__file__).resolve().parent, "queue-it.jpg")
with open(img_path, 'rb') as f:
solution = capsolver.solve({
"type": "ImageToTextTask",
"module": "queueit",
"body": "/9j/4AAQSkZJRgABA......"
})
print(solution)
go
package main
import (
"fmt"
capsolver_go "github.com/capsolver/capsolver-go"
"log"
)
func main() {
// first you need to install sdk
//go get github.com/capsolver/capsolver-go
//export CAPSOLVER_API_KEY='...' or
//capSolver := CapSolver{ApiKey:"..."}
capSolver := capsolver_go.CapSolver{}
solution, err := capSolver.Solve(map[string]any{
"type": "ImageToTextTask",
"module": "queueit",
"body": "/9j/4AAQSkZJRgABA......",
})
if err != nil {
log.Fatal(err)
return
}
fmt.Println(solution)
}