Hướng dẫn
Nhiệm vụ (Nhận dạng)
ImageToText

Nhận dạng ảnh thành văn bản (OCR)

CẢNH BÁO

Tạo tác vụ với createTask.

Giao diện này không cần lấy kết quả riêng biệt, sẽ trả về kết quả nhận dạng ảnh trực tiếp!

Trường type của tác vụ như sau

  • ImageToTextTask

Tạo tác vụ

Tạo tác vụ với createTask.

Cấu trúc đối tượng tác vụ

Lưu ý rằng loại tác vụ này trả về kết quả thực thi tác vụ trực tiếp sau createTask, thay vì lấy nó bất đồng bộ thông qua getTaskResult.

Thuộc tínhKiểu dữ liệuBắt buộcMô tả
typeStringBắt buộcImageToTextTask
websiteURLStringTùy chọnURL nguồn trang để cải thiện độ chính xác
bodyStringBắt buộcNội dung được mã hóa base64 của ảnh (không có dòng mới, không có data:image/***;charset=utf-8;base64,)
imagesList[string]Tùy chọnChỉ dành cho module number, Hỗ trợ tối đa 9 ảnh được mã hóa base64 mỗi lần
moduleStringTùy chọnChỉ định module. Tất cả các mô hình được hỗ trợ được hiển thị trong bảng bên dưới

Hỗ trợ module độc lập

ModuleQuestionsSamplesAccuracyLastUpdate

Ví dụ yêu cầu

POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    // Bạn có thể chọn module cần sử dụng
    // mô hình ảnh đơn OCR, mặc định là common
    "module": "common",
    // ảnh được mã hóa base64
    "body": "/9j/4AAQSkZJRgABA......"
  }
}

Nếu hình ảnh chỉ chứa số, bạn nên sử dụng module number. Ví dụ yêu cầu:

{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "ImageToTextTask",
    "websiteURL": "https://xxxx.com",
    "module": "number",
    // Đưa tối đa 9 ảnh
    "images": [
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA...",
      "/9j/4AAQSkZJRgABAQA..."
    ]
  }
}

Ví dụ phản hồi

{
  "errorId": 0,
  "errorCode": "",
  "errorDescription": "",
  "status": "ready",
  "solution": {
    "text": "44795sds",
    // module number:
	"answers": ["100", "1330", "147", "248", "303", "439", "752", "752", "752"],
  },
  "taskId": "..."
}

Sử dụng yêu cầu SDK

# pip install --upgrade capsolver
# export CAPSOLVER_API_KEY='...'
 
import capsolver
 
capsolver.api_key = "..."
solution = capsolver.solve({
    "type": "ImageToTextTask",
    "module": "common",
    "body": "/9j/4AAQSkZJRgABA......"
})
print(solution)