Docs/OCR-RAG

OCR-RAG

Cách kết hợp OCR và RAG để phục vụ truy vấn chính xác hơn.

Bật insert to RAG

Bật tùy chọn Insert to RAG trong Config hoặc Document để đưa tài liệu vào hệ thống truy vấn.

Vòng đời trạng thái

  1. OCR hoàn tất.
  2. Hệ thống gửi yêu cầu index vào RAG.
  3. Trạng thái RAG chuẩn từ backend:
    • Xếp hàng: queued
    • Chờ OCR: waiting_ocr
    • Đang gửi dữ liệu: submitting
    • Đã gửi và đang theo dõi: submitted
    • Đang thử lại: retrying
    • Thành công: success
    • Thất bại: failed
    • Bỏ qua: skipped_disabled, skipped_opt_out, skipped_ocr_failed, skipped_no_markdown, skipped_empty_text

Khi nào nên bật

  • Nên bật khi cần chat/research trên bộ tài liệu.
  • Có thể tắt nếu chỉ cần OCR văn bản để xem nhanh.

Lưu ý vận hành

Theo dõi lỗi RAG tại trang Detail để retry nếu cần.

Mục trước

OCR

Mục tiếp theo

Dữ liệu nghiên cứu