Skip to main content
Admin

Admin

Hunter

🤖 Mẹo dùng XML trên các Reasoning model AI như DeepSeek R1 và GPT O1/O3 Series

· 2 min read
Nguồn: Bình dân học AI

Để tối ưu hiệu suất của các reasoning model khi dùng XML, bạn có thể áp dụng các mẹo sau dựa trên nguyên tắc xử lý prompt có cấu trúc:

Mẹo dùng XML trên các Reasoning model AI như DeepSeek R1 và GPT O1/O3 Series

📝 Cách tổ chức prompt với XML

🔍 Phân tách input thành phần rõ ràng

Sử dụng thẻ XML để phân định các thành phần:

<context>
[Thông tin nền/đầu vào cần xử lý]
</context>
<task>
[Yêu cầu cụ thể cho model]
</task>

Ví dụ thực tế từ Reddit cho thấy định dạng này giúp O1 xử lý logic chính xác hơn 39% so với prompt thông thường.

🎯 Kết hợp với các chỉ dẫn định dạng

<format>
<output_type>JSON</output_type>
<structure>
<field name="result" type="string"/>
<field name="reasoning" type="array"/>
</structure>
</format>
info

O3-mini đặc biệt mạnh trong việc parse XML schema và trả kết quả đúng định dạng yêu cầu.

✨ Best practices khi dùng XML

✅ Luôn đóng thẻ đầy đủ: Các model reasoning nhạy cảm với cú pháp XML lỗi. Sử dụng tools như XML validator trước khi gửi prompt.

🏷️ Tận dụng attribute mô tả: Thêm metadata vào thẻ qua attributes để hướng dẫn model:

<data source="WHO_2024" type="statistical">
[Nội dung dữ liệu]
</data>

👥 Kết hợp role instructions: Định nghĩa vai trò xử lý trong system message khi dùng API:

messages = [
{"role": "system", "content": "Parse XML input as senior data analyst"},
{"role": "user", "content": xml_prompt}
]
⚠️ Những điều cần tránh

Các lỗi thường gặp cần tránh khi sử dụng XML với reasoning AI models:

🔄 Dùng nested tags quá 3 lớp (gây confusion cho model)

🏷️ XML không có namespace cho các task phức tạp

📊 Theo benchmark từ OpenAI, prompt XML được tổ chức tốt giúp tăng 28% độ chính xác trên các task parse dữ liệu so với định dạng tự do.