Docs/OCR-RAG
OCR-RAG
Cách kết hợp OCR và RAG để phục vụ truy vấn chính xác hơn.
Bật insert to RAG
Bật tùy chọn Insert to RAG trong Config hoặc Document để đưa tài liệu vào hệ thống truy vấn.
Vòng đời trạng thái
- OCR hoàn tất.
- Hệ thống gửi yêu cầu index vào RAG.
- Trạng thái RAG chuẩn từ backend:
- Xếp hàng:
queued - Chờ OCR:
waiting_ocr - Đang gửi dữ liệu:
submitting - Đã gửi và đang theo dõi:
submitted - Đang thử lại:
retrying - Thành công:
success - Thất bại:
failed - Bỏ qua:
skipped_disabled,skipped_opt_out,skipped_ocr_failed,skipped_no_markdown,skipped_empty_text
- Xếp hàng:
Khi nào nên bật
- Nên bật khi cần chat/research trên bộ tài liệu.
- Có thể tắt nếu chỉ cần OCR văn bản để xem nhanh.
Lưu ý vận hành
Theo dõi lỗi RAG tại trang Detail để retry nếu cần.
Mục trước
OCR
Mục tiếp theo
Dữ liệu nghiên cứu