9 bài viết được gắn thẻ "DeepSeek R1"

🧠 Guided Reasoning Process cho RLMs

6 tháng 3, 2025 · 6 phút để đọc

Nguồn: Bình dân học AI

Facebook: "https://www.facebook.com/frank.t96/"

ghi chú

Có thể áp dụng cho các models như DeepSeek-R1 / R1-1776 (có thể dùng trên Perplexity), Grok-3, O1 pro, O3 mini,...

Mô Hình Ngôn Ngữ Suy Luận (RLMs) là gì?

Định Nghĩa RLMs

Mô hình ngôn ngữ suy luận (Reasoning Language Models - RLMs) là các mô hình AI tiên tiến đã vượt xa khả năng của LLMs truyền thống. Chúng kết hợp các cấu trúc suy luận rõ ràng với các chiến lược tìm kiếm tiên tiến như Monte Carlo Tree Search (MCTS) và Beam Search để đạt được khả năng giải quyết vấn đề hiệu quả hơn.

🔄 Hướng Dẫn Tích Hợp Causal Chain Expansion khi search với Perplexity (R1-1776)

6 tháng 3, 2025 · 5 phút để đọc

Nguồn: Bình dân học AI

Facebook: "https://www.facebook.com/frank.t96/"

🌟 Giới thiệu

Về hướng dẫn này

Tài liệu này trình bày phương pháp kết hợp kỹ thuật Causal Chain Expansion (Mở rộng chuỗi nhân quả) với Perplexity x R1-1776 (phiên bản DeepSeek-R1 tại Mỹ) để tạo ra phân tích nhân quả đa tầng mạnh mẽ và chi tiết.

R1-1776 là 1 RLM với khả năng suy luận tự nhiên và Causal Chain Expansion với cấu trúc phân tích đa chiều tạo thành bộ đôi hoàn hảo cho việc phân tích hệ thống phức hợp. Hướng dẫn này sẽ giúp bạn tối ưu hóa việc sử dụng cả hai công nghệ này cùng nhau.

DeepSeek-R1: GRPO - Kỷ Nguyên LLM Tự Chủ Reasoning, Thay Thế Prompt Engineering

10 tháng 2, 2025 · 8 phút để đọc

Nguồn: Bình dân học AI

-Facebook: "https://www.facebook.com/frank.t96/"

DeepSeek-R1 không chỉ gây ấn tượng bởi khả năng reasoning vượt trội mà còn bởi cách tiếp cận huấn luyện hoàn toàn mới, tập trung vào cơ chế GRPO (Group Relative Policy Optimization). GRPO không chỉ tối ưu hóa mô hình thông qua RL mà còn tự động hóa hàng loạt các kỹ thuật prompt vốn được coi là thiết yếu. Bài viết này sẽ đi sâu vào cơ chế hoạt động của DeepSeek-R1, khám phá cách RL – thông qua GRPO – đang mở ra một paradigm mới cho LLM reasoning, nơi prompt engineering dần trở nên lỗi thời. ⏳

🤖 Mẹo dùng XML trên các Reasoning model AI như DeepSeek R1 và GPT O1/O3 Series

8 tháng 2, 2025 · 2 phút để đọc

Nguồn: Bình dân học AI

-Facebook: "https://www.facebook.com/frank.t96/"

Để tối ưu hiệu suất của các reasoning model khi dùng XML, bạn có thể áp dụng các mẹo sau dựa trên nguyên tắc xử lý prompt có cấu trúc:

MÙNG 1 CHẠY DEEPSEEK-R1 LOCAL

29 tháng 1, 2025 · 3 phút để đọc

Nguồn: Bình dân học AI

-Facebook: "https://www.facebook.com/wincreator1/"

Mùng 1 Nhân tặng quà cho các anh em là một hướng dẫn đơn giản nhất để có thể chạy các model thu gọn [distilled] của DeepSeek-R1 ngay trên máy tính của mình, không cần kết nối internet, và có giao diện dễ dùng, đính kèm được file nhé.

Facebook: "https://www.facebook.com/frank.t96/"

Bài viết này hướng dẫn cách khai thác khả năng suy luận đa tầng của DeepSeek-R1 khi sử dụng Perplexity.

9 bài viết được gắn thẻ "DeepSeek R1"

🧠 Guided Reasoning Process cho RLMs

Mô Hình Ngôn Ngữ Suy Luận (RLMs) là gì?

🔄 Hướng Dẫn Tích Hợp Causal Chain Expansion khi search với Perplexity (R1-1776)

DeepSeek-R1: GRPO - Kỷ Nguyên LLM Tự Chủ Reasoning, Thay Thế Prompt Engineering

🤖 Mẹo dùng XML trên các Reasoning model AI như DeepSeek R1 và GPT O1/O3 Series

MÙNG 1 CHẠY DEEPSEEK-R1 LOCAL

Review nhanh Kimi 1.5: Mô hình AI ngang ngửa DeepSeek R1, cũng đến từ các pháp sư Trung Hoa

Hướng dẫn chạy DeepSeek R1 Distill (Qwen/Llama) trên máy tính miễn phí, bảo mật dữ liệu

So sánh DeepSeek R1 và Kimi 1.5: Hai mô hình AI "khủng" ngang tầm "o1-style" từ các pháp sư Trung Hoa

🧠 Khai Thác Suy Luận Đa Tầng trong Perplexity với DeepSeek-R1 🔍

Mô Hình Ngôn Ngữ Suy Luận (RLMs) là gì?​

Mô Hình Ngôn Ngữ Suy Luận (RLMs) là gì?