Nhận dạng ảnh thành văn bản (OCR)
CẢNH BÁO
Tạo tác vụ với createTask.
Giao diện này không cần lấy kết quả riêng biệt, sẽ trả về kết quả nhận dạng ảnh trực tiếp!
Trường type
của tác vụ như sau
ImageToTextTask
Tạo tác vụ
Tạo tác vụ với createTask.
Cấu trúc đối tượng tác vụ
Lưu ý rằng loại tác vụ này trả về kết quả thực thi tác vụ trực tiếp sau createTask, thay vì lấy nó bất đồng bộ thông qua getTaskResult.
Thuộc tính | Kiểu dữ liệu | Bắt buộc | Mô tả |
---|---|---|---|
type | String | Bắt buộc | ImageToTextTask |
websiteURL | String | Tùy chọn | URL nguồn trang để cải thiện độ chính xác |
body | String | Bắt buộc | Nội dung được mã hóa base64 của ảnh (không có dòng mới, không có data:image/***;charset=utf-8;base64,) |
images | List[string] | Tùy chọn | Chỉ dành cho module number , Hỗ trợ tối đa 9 ảnh được mã hóa base64 mỗi lần |
module | String | Tùy chọn | Chỉ định module. Tất cả các mô hình được hỗ trợ được hiển thị trong bảng bên dưới |
Hỗ trợ module độc lập
Module | Questions | Samples | Accuracy | LastUpdate |
---|
Ví dụ yêu cầu
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
// Bạn có thể chọn module cần sử dụng
// mô hình ảnh đơn OCR, mặc định là common
"module": "common",
// ảnh được mã hóa base64
"body": "/9j/4AAQSkZJRgABA......"
}
}
Nếu hình ảnh chỉ chứa số, bạn nên sử dụng module number
. Ví dụ yêu cầu:
{
"clientKey": "YOUR_API_KEY",
"task": {
"type": "ImageToTextTask",
"websiteURL": "https://xxxx.com",
"module": "number",
// Đưa tối đa 9 ảnh
"images": [
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA...",
"/9j/4AAQSkZJRgABAQA..."
]
}
}
Ví dụ phản hồi
{
"errorId": 0,
"errorCode": "",
"errorDescription": "",
"status": "ready",
"solution": {
"text": "44795sds",
// module number:
"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
},
"taskId": "..."
}
Sử dụng yêu cầu SDK
# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
import capsolver
capsolver.api_key = "..."
solution = capsolver.solve({
"type": "ImageToTextTask",
"module": "common",
"body": "/9j/4AAQSkZJRgABA......"
})
print(solution)