🤖 Mẹo dùng XML trên các Reasoning model AI như DeepSeek R1 và GPT O1/O3 Series

February 8, 2025 · 2 min read

Nguồn: Bình dân học AI

-Facebook: "https://www.facebook.com/frank.t96/"

Để tối ưu hiệu suất của các reasoning model khi dùng XML, bạn có thể áp dụng các mẹo sau dựa trên nguyên tắc xử lý prompt có cấu trúc:

Mẹo dùng XML trên các Reasoning model AI như DeepSeek R1 và GPT O1/O3 Series

📝 Cách tổ chức prompt với XML

🔍 Phân tách input thành phần rõ ràng

Sử dụng thẻ XML để phân định các thành phần:

<context>
  [Thông tin nền/đầu vào cần xử lý]
</context>
<task>
  [Yêu cầu cụ thể cho model]
</task>

Ví dụ thực tế từ Reddit cho thấy định dạng này giúp O1 xử lý logic chính xác hơn 39% so với prompt thông thường.

🎯 Kết hợp với các chỉ dẫn định dạng

<format>
  <output_type>JSON</output_type>
  <structure>
    <field name="result" type="string"/>
    <field name="reasoning" type="array"/>
  </structure>
</format>

info

O3-mini đặc biệt mạnh trong việc parse XML schema và trả kết quả đúng định dạng yêu cầu.

✨ Best practices khi dùng XML

✅ Luôn đóng thẻ đầy đủ: Các model reasoning nhạy cảm với cú pháp XML lỗi. Sử dụng tools như XML validator trước khi gửi prompt.

🏷️ Tận dụng attribute mô tả: Thêm metadata vào thẻ qua attributes để hướng dẫn model:

<data source="WHO_2024" type="statistical">
  [Nội dung dữ liệu]
</data>

👥 Kết hợp role instructions: Định nghĩa vai trò xử lý trong system message khi dùng API:

messages = [
    {"role": "system", "content": "Parse XML input as senior data analyst"},
    {"role": "user", "content": xml_prompt}
]

⚠️ Những điều cần tránh

Các lỗi thường gặp cần tránh khi sử dụng XML với reasoning AI models:

🔄 Dùng nested tags quá 3 lớp (gây confusion cho model)

🏷️ XML không có namespace cho các task phức tạp

📊 Theo benchmark từ OpenAI, prompt XML được tổ chức tốt giúp tăng 28% độ chính xác trên các task parse dữ liệu so với định dạng tự do.

Admin

📝 Cách tổ chức prompt với XML​

🔍 Phân tách input thành phần rõ ràng​

🎯 Kết hợp với các chỉ dẫn định dạng​

📝 Cách tổ chức prompt với XML

🔍 Phân tách input thành phần rõ ràng

🎯 Kết hợp với các chỉ dẫn định dạng