EraX-VL-7B-V2.0-Preview: Model mã nguồn mở mạnh mẽ từ team người Việt
Mình mới thấy một model mã nguồn mở cực xịn do team người Việt mình (bác Nguyễn Anh Nguyên và cộng sự của team EraX AI) phát triển. Đặc biệt, model này hỗ trợ tiếng Việt rất tốt nên muốn giới thiệu với mọi người ngay: EraX-VL-7B-V2.0-Preview!
Đây là phiên bản "nhá hàng" cho bản 2.0 chính thức (sẽ ra mắt sau Tết Âm lịch) của dòng model EraX-VL. Hoàn toàn FREE và cực kỳ mạnh mẽ, EraX-VL-7B-V2.0-Preview là mô hình đa phương thức có thể xử lý cả OCR (nhận dạng ký tự quang học) lẫn VQA (trả lời câu hỏi hình ảnh), hoạt động mượt mà trên nhiều ngôn ngữ, đặc biệt là tiếng Việt của chúng ta 🇻🇳.
Điểm nổi bật của EraX-VL-7B-V2.0-Preview
1. EraX Radiology
Tính năng này "đọc vị" ảnh X-Quang, CT, MRI để chẩn đoán các bệnh về:
- Tim, phổi, thận, gan, mật, não, răng miệng, tay chân,...
Không chỉ "bắt bệnh" thông minh, model này còn "soi" xe cộ (xe du lịch), chẩn đoán tình trạng xe, gợi ý cách sửa chữa, và thậm chí ước tính sơ bộ chi phí sửa chữa! 🚗🛠️
2. Nâng cấp từ EraX-VL-7B-V1.5
Phiên bản này kế thừa nền tảng vững chắc của EraX-VL-7B-V1.5 và cải tiến hơn nữa. Điều này giúp model trở nên cực kỳ hữu ích trong:
- Các bệnh viện 🏥, phòng khám 💉
- Công ty bảo hiểm 🛡️
- Ứng dụng xử lý biểu mẫu y tế 🩺, hóa đơn 🧾, hồ sơ bệnh án 💊,...
EraX-VL không chỉ là một công cụ OCR "cổ điển" như Tesseract, mà là mô hình LLM đa phương thức tiên tiến. Để tận dụng tối đa sức mạnh của nó, anh em nhớ "biến hóa" prompt cho phù hợp với từng nhiệm vụ nhé!