Anthropic ra mắt tính năng Citations (Trích dẫn) mới cho API: Tăng cường tính minh bạch và độ chính xác
1. Citations trong Anthropic API là gì?
Citations (Trích dẫn) là một tính năng mới được giới thiệu để nâng cao tính minh bạch và độ chính xác trong các phản hồi do AI tạo ra. Khi Claude tham khảo các tài liệu, nguồn hoặc điểm dữ liệu cụ thể, giờ đây nó có thể tự động tạo ra các trích dẫn để ghi rõ nguồn gốc của thông tin. Điều này đặc biệt hữu ích cho các trường hợp sử dụng trong học thuật, pháp lý hoặc doanh nghiệp, nơi đòi hỏi các kết quả có thể kiểm chứng được.
2. Các tính năng chính của hệ thống Citations
Các loại tài liệu được hỗ trợ:
- Tài liệu văn bản thuần túy (Plain Text Documents): Claude có thể trích dẫn văn bản từ các đầu vào văn bản thuần túy phi cấu trúc.
- Tài liệu nội dung tùy chỉnh (Custom Content Documents): Người dùng có thể tải lên các tài liệu có cấu trúc (ví dụ: PDF, bài nghiên cứu) để Claude tham khảo và trích dẫn.
Tích hợp với Messages API: Các trích dẫn được nhúng trực tiếp vào định dạng phản hồi của API Messages, cho phép các nhà phát triển phân tích cú pháp và hiển thị chúng cùng với nội dung được tạo ra.
Ghi nguồn động (Dynamic Attribution): Các trích dẫn tự điều chỉnh theo ngữ cảnh của truy vấn. Ví dụ: nếu Claude trích xuất dữ liệu từ một tệp PDF, trích dẫn sẽ bao gồm tiêu đề tài liệu và phần liên quan.
3. Cách sử dụng Citations
Để bật tính năng Citations, các nhà phát triển cần:
- Chỉ định nguồn tài liệu (Specify Document Sources): Bao gồm metadata tài liệu (ví dụ: tiêu đề, URL) khi gửi yêu cầu đến Messages API.
- Kích hoạt chế độ Citations (Activate Citation Mode): Sử dụng tham số
enable_citations: true
trong các lệnh gọi API. - Phân tích cú pháp phản hồi (Parse Responses): Các trích dẫn xuất hiện dưới dạng các đối tượng có cấu trúc trong phản hồi API, được định dạng như sau:
{
"text": "Biến đổi khí hậu đang gia tăng .",
"citations": [
{
"id": 1,
"document": "Báo cáo IPCC 2024",
"section": "Chương 3",
"url": "https://example.com/ipcc-2024"
}
]
}
4. Các trường hợp sử dụng
-
Nghiên cứu học thuật: Tự động trích dẫn các bài báo hoặc bộ dữ liệu được bình duyệt.
-
Cơ sở tri thức doanh nghiệp: Xác thực câu trả lời dựa trên tài liệu nội bộ.
-
Tuân thủ pháp lý: Đảm bảo các kết quả đầu ra tham khảo các tiền lệ hoặc quy định pháp lý đã được phê duyệt.
5. Giới hạn và Cân nhắc
-
Trạng thái Beta: Tính đến ngày 23 tháng 1 năm 2025, Citations đang ở giai đoạn phát hành sớm (beta) và có thể chưa bao phủ tất cả các loại tài liệu hoặc ngôn ngữ.
-
Độ chính xác: Độ chính xác của trích dẫn phụ thuộc vào độ rõ ràng của metadata nguồn do người dùng cung cấp.
-
Chi phí: Mức sử dụng token tăng nhẹ do việc tạo trích dẫn, nhưng prompt caching có thể bù đắp chi phí lên đến 90%.
Để biết chi tiết triển khai, hãy tham khảo tài liệu của Anthropic phía dưới nhé.