One post tagged with "Long CoT"

Nguyên Tắc Tạo Prompt 'Long Chain-of-Thought' (Long CoT) Hiệu Quả Cho LLMs

February 11, 2025 · 6 min read

Nguồn: Bình dân học AI

-Facebook: "https://www.facebook.com/frank.t96/"

Chain-of-Thought (CoT) đã nổi lên như một phương pháp đột phá để tăng cường khả năng lý luận của Large Language Models (LLM), đặc biệt trong các tác vụ phức tạp đòi hỏi lý luận đa bước. Nghiên cứu khoa học "Demystifying Long Chain-of-Thought Reasoning in LLMs" đã làm sáng tỏ cách LLM phát triển khả năng lý luận mở rộng thông qua Supervised Fine-Tuning (SFT) và Reinforcement Learning (RL), nhấn mạnh tầm quan trọng của dữ liệu Long CoT. Bài viết này tổng hợp các nguyên tắc cốt lõi từ nghiên cứu này và các nguồn khác để cung cấp hướng dẫn toàn diện về cách tạo Long CoT hiệu quả.