Chuyển tới nội dung chính

3 bài viết được gắn thẻ "OCR"

Công nghệ nhận dạng ký tự quang học.

Xem tất cả thẻ

EraX-VL-7B-V2.0-Preview: Model mã nguồn mở mạnh mẽ từ team người Việt

· 2 phút để đọc

Mình mới thấy một model mã nguồn mở cực xịn do team người Việt mình (bác Nguyễn Anh Nguyên và cộng sự của team EraX AI) phát triển. Đặc biệt, model này hỗ trợ tiếng Việt rất tốt nên muốn giới thiệu với mọi người ngay: EraX-VL-7B-V2.0-Preview!

MinerU: Công cụ trích xuất tài liệu miễn phí tuyệt vời cho kỷ nguyên AI

· 5 phút để đọc

Mình vừa được trải nghiệm một công cụ miễn phí tuyệt vời, hiện đang đứng top 1 trên GitHub, đó chính là MinerU. Về cơ bản, MinerU là một công cụ trích xuất và chuyển đổi tài liệu thông minh, kết quả sẽ ở dạng markdown, JSON,... đặc biệt hữu ích để làm đầu vào huấn luyện AI thay vì ném cả 1 file PDF không có động tác nào khác để xử lý.