🤖 Mẹo dùng XML trên các Reasoning model AI như DeepSeek R1 và GPT O1/O3 Series
-Facebook: "https://www.facebook.com/frank.t96/"
Để tối ưu hiệu suất của các reasoning model khi dùng XML, bạn có thể áp dụng các mẹo sau dựa trên nguyên tắc xử lý prompt có cấu trúc:

📝 Cách tổ chức prompt với XML
🔍 Phân tách input thành phần rõ ràng
Sử dụng thẻ XML để phân định các thành phần:
<context>
[Thông tin nền/đầu vào cần xử lý]
</context>
<task>
[Yêu cầu cụ thể cho model]
</task>
Ví dụ thực tế từ Reddit cho thấy định dạng này giúp O1 xử lý logic chính xác hơn 39% so với prompt thông thường.
🎯 Kết hợp với các chỉ dẫn định dạng
<format>
<output_type>JSON</output_type>
<structure>
<field name="result" type="string"/>
<field name="reasoning" type="array"/>
</structure>
</format>
O3-mini đặc biệt mạnh trong việc parse XML schema và trả kết quả đúng định dạng yêu cầu.
✅ Luôn đóng thẻ đầy đủ: Các model reasoning nhạy cảm với cú pháp XML lỗi. Sử dụng tools như XML validator trước khi gửi prompt.
🏷️ Tận dụng attribute mô tả: Thêm metadata vào thẻ qua attributes để hướng dẫn model:
<data source="WHO_2024" type="statistical">
[Nội dung dữ liệu]
</data>
👥 Kết hợp role instructions: Định nghĩa vai trò xử lý trong system message khi dùng API:
messages = [
{"role": "system", "content": "Parse XML input as senior data analyst"},
{"role": "user", "content": xml_prompt}
]
Các lỗi thường gặp cần tránh khi sử dụng XML với reasoning AI models:
🔄 Dùng nested tags quá 3 lớp (gây confusion cho model)
🏷️ XML không có namespace cho các task phức tạp
📊 Theo benchmark từ OpenAI, prompt XML được tổ chức tốt giúp tăng 28% độ chính xác trên các task parse dữ liệu so với định dạng tự do.