Think Fast & Think Deep với AI: Kinh nghiệm làm việc song song hai dòng tư duy
-Tác giả: Nguyễn Duy Tùng - Chuyên gia nghiên cứu ứng dụng AI tại Trung tâm BIM & AI
-Facebook: "https://facebook.com/gabeo166991"

Trong quá trình làm việc với các mô hình ngôn ngữ lớn, mình nhận ra rằng cách tiếp cận "đa mô hình" mang lại hiệu quả vượt trội so với việc chỉ phụ thuộc vào một công cụ duy nhất. Đặc biệt là khi làm việc song song với Claude và Gemini (trên Google AI Studio), hai mô hình có cách thức xử lý ngôn ngữ và tư duy hoàn toàn khác biệt. Sự khác biệt này không chỉ nằm ở cấu trúc kỹ thuật, mà còn ở chính cách thức "suy nghĩ" của từng mô hình.
Hai cách tiếp cận xử lý ngôn ngữ
Claude: Cơ chế "Đọc lại toàn bộ" (Reread)
-
Cách hoạt động:
Claude của Anthropic hoạt động với cơ chế "đọc lại toàn bộ" context trước đó trong mỗi lần tương tác, bao gồm cả các file đính kèm, để đảm bảo tính nhất quán trong câu trả lời. -
Lợi ích:
Tương tự như làm việc với một đơn vị tư vấn chuyên nghiệp, Claude luôn xem xét lại toàn bộ tài liệu trước khi đưa ra ý kiến, tạo nên sự ổn định và logic trong phản hồi. -
Hạn chế:
Tiêu tốn nhiều tài nguyên và có giới hạn khoảng 200 câu tiếng Anh mỗi phiên làm việc, reset sau mỗi 5 giờ để duy trì hiệu suất.
Gemini: Cơ chế "Trí nhớ ngắn hạn"
-
Cách hoạt động:
Gemini (và nhiều chatbot AI khác) tập trung vào context gần nhất và dần quên đi những tương tác xa hơn. -
Lợi ích:
Xử lý nhanh, linh hoạt, phù hợp với các tác vụ cần phản hồi tức thời như viết nội dung hay brainstorming ý tưởng. -
Hạn chế:
Có thể xuất hiện mâu thuẫn trong các câu trả lời nếu cuộc hội thoại kéo dài.
Tối ưu hóa quy trình làm việc theo đặc thù mô hình
Chiến lược "Think Deep & Think Fast"
-
Think Deep với Claude:
Sử dụng Claude như một cố vấn chiến lược để phân tích yêu cầu phức tạp, thiết kế system prompt, hoặc review tài liệu kỹ thuật.- Ví dụ: Claude hỗ trợ gợi ý, phân tích và xây dựng system prompt cho chatbot chuyên biệt.
-
Think Fast với Gemini:
Sau khi có system prompt từ Claude, mình đưa chúng vào Google AI Studio để triển khai chatbot chuyên biệt với Gemini.- Lợi ích:
- Tương tác nhanh nhạy, linh hoạt.
- Dễ dàng tuning parameters và điều chỉnh temperature để thử nghiệm nhanh.
- Hiệu quả:
Chỉ trong một buổi sáng, mình đã tạo được 5 phiên bản chatbot khác nhau nhờ khả năng xử lý nhanh của Gemini.
- Lợi ích:
Chiến lược tối ưu hóa chi phí và hiệu suất
Phương pháp làm việc kiểu "Tetris"
Với Claude, thay vì đưa toàn bộ yêu cầu vào một lúc, mình chia nhỏ dự án thành các khối (blocks) độc lập có tính kết nối:
- Phân tích requirement
- Thiết kế system prompt core
- Xây dựng logic xử lý edge cases
Mỗi khối được phát triển trong một phiên chat riêng biệt với Claude. Điều này:
- Giảm chi phí: Claude không phải đọc lại các context không liên quan.
- Đảm bảo chất lượng: Mỗi block đạt độ hoàn thiện cao nhất.
Sau khi hoàn thiện các block với Claude, mình chuyển sang Gemini để:
- Vận hành thử nghiệm: Kiểm tra cách các module hoạt động cùng nhau.
- Tinh chỉnh nhanh: Thử nghiệm nhiều kịch bản và điều chỉnh tham số linh hoạt.
Xu hướng phát triển và góc nhìn tương lai
Chuyên biệt hóa mô hình AI
- Claude của Anthropic: Tập trung vào phân tích chuyên sâu và tính nhất quán.
- Gemini của Google: Tập trung vào tốc độ xử lý và khả năng tích hợp hệ sinh thái.
Sự ra đời của AI Orchestration
- Khái niệm:
Nền tảng "điều phối AI" cho phép người dùng kết hợp nhiều mô hình AI trong một quy trình làm việc thống nhất.- Ví dụ: Giống như sử dụng nhiều công cụ phần mềm trong một dự án, việc sử dụng đa mô hình AI sẽ trở nên phổ biến hơn.
Tư duy chiến lược cho tương lai
- Kỹ năng quan trọng nhất:
Không chỉ thành thạo một công cụ, mà là khả năng phối hợp nhiều công cụ khác nhau.- Giống như một nhạc trưởng: Biết khi nào nên sử dụng "nhạc cụ" nào để tạo nên một "bản nhạc" hoàn chỉnh.
P/S:
Ảnh minh họa được tạo bởi prompt do chatbot tư vấn viết prompt. Chatbot này được mình thiết kế nhờ Claude và Gemini 1.5 Flash trên Google AI Studio.