Docs/OCR

OCR

Chi tiết về upload file, OCR status và kết quả trích xuất.

Định dạng được hỗ trợ

PDF, PNG, JPG, WEBP, GIF. Giới hạn tối đa 100MB mỗi file.

OCR pipeline

  1. File được upload lên S3 tạm thời.
  2. API OCR gọi công nghệ M-ocr-lastest.
  3. Kết quả OCR được trả về để tiếp tục luồng xử lý.

Trạng thái OCR

  • uploading: đang tải file lên.
  • ocr: đang nhận dạng văn bản.
  • done: hoàn tất.

Kết quả OCR

Nội dung OCR được hiển thị ở tab Markdown và JSON, có thể copy hoặc tải xuống.

Mục trước

Giới thiệu

Mục tiếp theo

OCR-RAG