6 bài viết được gắn thẻ "DeepSeek"

DeepSeek-R1: GRPO - Kỷ Nguyên LLM Tự Chủ Reasoning, Thay Thế Prompt Engineering

10 tháng 2, 2025 · 8 phút để đọc

Nguồn: Bình dân học AI

-Facebook: "https://www.facebook.com/frank.t96/"

DeepSeek-R1 không chỉ gây ấn tượng bởi khả năng reasoning vượt trội mà còn bởi cách tiếp cận huấn luyện hoàn toàn mới, tập trung vào cơ chế GRPO (Group Relative Policy Optimization). GRPO không chỉ tối ưu hóa mô hình thông qua RL mà còn tự động hóa hàng loạt các kỹ thuật prompt vốn được coi là thiết yếu. Bài viết này sẽ đi sâu vào cơ chế hoạt động của DeepSeek-R1, khám phá cách RL – thông qua GRPO – đang mở ra một paradigm mới cho LLM reasoning, nơi prompt engineering dần trở nên lỗi thời. ⏳

Hướng dẫn cách prompting cho các Reasoning AI model như O1/O3 series & DeepSeek

5 tháng 2, 2025 · 3 phút để đọc

Nguồn: Bình dân học AI

-Facebook: "https://www.facebook.com/frank.t96/"

Để tối ưu hiệu suất của các mô hình lý luận (Reasoning AI), cần áp dụng các kỹ thuật prompting khác biệt so với các model truyền thống. Dưới đây là hướng dẫn chi tiết dựa trên nghiên cứu mới nhất:

6 bài viết được gắn thẻ "DeepSeek"

DeepSeek-R1: GRPO - Kỷ Nguyên LLM Tự Chủ Reasoning, Thay Thế Prompt Engineering

Hướng dẫn cách prompting cho các Reasoning AI model như O1/O3 series & DeepSeek

Tiêu chí đầu tư Startup AI của YC và xu hướng tương lai

Review nhanh Kimi 1.5: Mô hình AI ngang ngửa DeepSeek R1, cũng đến từ các pháp sư Trung Hoa

Hướng dẫn chạy DeepSeek R1 Distill (Qwen/Llama) trên máy tính miễn phí, bảo mật dữ liệu

So sánh DeepSeek R1 và Kimi 1.5: Hai mô hình AI "khủng" ngang tầm "o1-style" từ các pháp sư Trung Hoa