🤖 AI Agents & Workflow Automation 101 cho người mới

January 8, 2025 · 13 min read

Nguồn: Group Giải pháp 3A - Automation, AI, Affiliate

-Tác giả: Võ Quốc Cường - Admin nhóm Giải pháp 3A - Automation, AI, Affiliate"

-Facebook: "https://www.facebook.com/voquoccuong007"

- bài dài, mong được anh em góp cho tí gạch

Hôm qua nay có 2 bức ảnh khá viral là:

Agentic AI của bác Jensen Huang ở CES 2025 có chia sẻ (góc trái)
AI Agents của Huyền Chip viết trên blog cá nhân (góc phải)

Mình thấy thích 2 từ khóa này nên lưu lại để đọc, tìm hiểu dần và kết hợp với hiểu biết của mình về Workflow Automation để so sánh luôn cho dễ hiểu, đặc biệt với những người chỉ mới chơi Make, n8n... như mình 😃

✍️ GIẢI THÍCH ĐƠN GIẢN

Workflow Automation:

Là quy trình tự động hóa các tác vụ lặp đi lặp lại mà không cần sự can thiệp của con người. Thường được thiết kế theo một chuỗi các bước cố định, nơi mỗi bước thực hiện một nhiệm vụ cụ thể.

Anh em hay dùng Make hay n8n để thiết kế các quy trình tự động này.

Đặc điểm:

Kết nối các API hoặc node có sẵn theo quy trình cố định
Luồng công việc được lập trình sẵn
Logic xử lý được định nghĩa trước
Không thể hoặc Khó thay đổi động nếu gặp trở ngại
Yêu cầu anh em ta phải cấu hình chi tiết

Hạn chế: Ít linh hoạt, không thể tự xử lý khi gặp lỗi hoặc tình huống ngoài kịch bản.

Ví dụ: Nếu một API trong workflow gặp sự cố, toàn bộ quy trình sẽ dừng lại

AI Agents

Là hệ thống AI có khả năng tự động lập kế hoạch, thực hiện hành động và điều chỉnh dựa trên phản hồi từ môi trường. Các agent trong hệ thống này có thể nhận biết môi trường xung quanh và thực hiện các hành động để đạt được mục tiêu cụ thể.

Đặc điểm:

Có khả năng suy luận và thích ứng
Tự chọn công cụ phù hợp
Điều chỉnh kế hoạch khi gặp vấn đề
Học hỏi từ những lần thực hiện trước
Giải quyết các nhiệm vụ không được lập trình sẵn

Ví dụ: SWE-agent (trong bài blog của Huyen Chip) có thể điều hướng, tìm kiếm, xem và chỉnh sửa file trên máy tính.

ChatGPT cũng là một agent, sử dụng các công cụ như tìm kiếm web, thực thi code Python và tạo hình ảnh. Nếu gặp lỗi khi thực thi code, agent sẽ tự động phân tích lỗi, tìm giải pháp thay thế và tiếp tục thực hiện nhiệm vụ.

Đại khái Make, n8n anh em xài như máy in công nghiệp, lặp đi lặp lại rất chính xác và nhanh chóng theo kịch bản cố định. Còn AI Agent như một nhân viên của mình, có thể linh hoạt giải quyết vấn đề, học hỏi & phát triển giải pháp tốt hơn.

Ví dụ khác:

Workflow Automation: Tự động gửi email xác nhận đơn hàng
AI Agents: Trợ lý ảo, chatbot, robot tự hành

🤔 ỦA.. Nếu dùng Make .com mà trước node API gì đó, Tui thêm node AI để đánh giá rồi mới chọn API phù hợp xử lý thì có được gọi là AI Agent không?

Cái này mô tả anh em có trình độ xíu sẽ có thể nâng cấp tự động hóa truyền thống lên Proto-agent.

Điểm Gần Giống AI Agent:

Có logic phán đoán
Khả năng chuyển đổi nguồn API
Tự động xử lý lỗi

Mình nhờ AI vẽ lại đoạn này để mô tả cho mọi người hình dung cái giả thuyết mình đặt cho nó trả lời dưới đây

[Trigger] → [API Call 1]
↓
├── Thành Công → Tiếp Tục
└── Lỗi → [AI Phân Tích Lỗi]
    ├── Đánh Giá Nguyên Nhân
    ├── Chọn API Thay Thế
    ├── Ghi Nhận Pattern
    └── Điều Chỉnh Chiến Lược

Nhưng thực tế vẫn còn giới hạn suy luận vì logic được "lập trình" sẵn, vẫn còn tự động hóa dựa trên luật (rule-based automation), có sự hỗ trợ của AI trong việc ra quyết định.

Chưa khả năng suy luận động và học hỏi như AI Agent thực thụ.

🥴 Thấy các bác lúc thì agent, lúc thì agentic, lúc system, lú quá thì làm sao?

Cái này không liên quan lắm nhưng mình thấy anh em khi chat, cmt cũng hay dùng nên mình listing ra luôn:

AI Agent là một thực thể cụ thể có khả năng thực hiện nhiệm vụ.
Agentic System là một hệ thống bao gồm nhiều agent hoạt động cùng nhau.
Agentic AI nhấn mạnh vào khả năng tự động hóa và ra quyết định của AI.

ĐOẠN NÀY Cho luôn cơm thêm, các loại AI Agents thường gặp:

Reactive Agents: Đơn giản nhất, chỉ phản ứng với input hiện tại.
Model-based reflex agents: Dựa trên mô hình môi trường để đưa ra quyết định.
Goal-based agents: Hành động dựa trên mục tiêu được đặt ra.
Utility-based agents: Tối ưu hóa một hàm tiện ích để đạt được mục tiêu tốt nhất.
Learning agents: Có khả năng học hỏi từ kinh nghiệm để cải thiện hiệu suất.

--> anh em Google đọc thêm nhe, nó hơi dài

🔀 Còn cái ảnh biểu đồ mà Huyền Chip vẽ nói về cái gì?

Các Thành Phần Trong Sơ Đồ

Query: Đây là yêu cầu hoặc câu hỏi mà người dùng đưa ra cho hệ thống. Ví dụ: "Tôi muốn biết thời tiết hôm nay."
Planner: Đây là phần lập kế hoạch, nơi hệ thống nhận yêu cầu và tạo ra một kế hoạch để thực hiện. Kế hoạch này có thể bao gồm các bước cụ thể cần thực hiện để trả lời yêu cầu.
Generated Plan: Kế hoạch được tạo ra từ Planner. Kế hoạch này sẽ được gửi đến Evaluator để kiểm tra tính khả thi và hợp lệ.
Evaluator: Phần này đánh giá kế hoạch đã được tạo ra. Nó kiểm tra xem kế hoạch có khả thi hay không, có thể thực hiện được với các công cụ hiện có hay không. Nếu kế hoạch không hợp lệ, nó có thể yêu cầu Planner tạo lại kế hoạch.
Tools: Đây là các công cụ mà hệ thống có thể sử dụng để thực hiện các bước trong kế hoạch. Ví dụ: API để lấy dữ liệu thời tiết, công cụ phân tích dữ liệu, v.v.
Tool Outputs: Kết quả từ các công cụ được sử dụng. Những kết quả này sẽ được gửi đến Evaluator để đánh giá.
Executor: Phần thực thi, nơi kế hoạch đã được xác thực sẽ được thực hiện. Nếu kế hoạch đã được đánh giá là hợp lệ, Executor sẽ thực hiện các bước trong kế hoạch.
Finish: Điểm kết thúc của quy trình, nơi mà yêu cầu đã được hoàn thành và kết quả được trả về cho người dùng.

Đại khái, nó sẽ:

Tách Biệt Lập Kế Hoạch (Planner) và Thực Hiện (Executor): Quy trình này nhấn mạnh việc tách biệt giữa việc lập kế hoạch và thực hiện. Điều này giúp đảm bảo rằng chỉ những kế hoạch đã được xác thực mới được thực hiện, giảm thiểu rủi ro và sai sót.
Đảm Bảo Tính Hợp Lệ: Bằng cách có một bước đánh giá (Evaluator), hệ thống có thể kiểm tra tính khả thi của kế hoạch trước khi thực hiện, giúp tiết kiệm thời gian và tài nguyên.
Tăng Cường Hiệu Quả: Quy trình này giúp tối ưu hóa việc sử dụng các công cụ và tài nguyên, đảm bảo rằng hệ thống hoạt động hiệu quả hơn.

Quy trình "Decoupling planning and execution" là một cách tiếp cận thông minh trong thiết kế hệ thống AI, giúp đảm bảo rằng các hành động được thực hiện dựa trên các kế hoạch đã được xác thực, từ đó nâng cao độ tin cậy và hiệu quả của hệ thống.

Chắc nhiều bạn cũng sẽ lú như mình khi lần đầu nhìn thấy, không biết đoạn Evaluator nó sẽ đi đâu về đâu mà Finish được hay vậy.

Mình lại tiếp tục tìm ví dụ để dễ hiểu hơn ở bên dưới.

✅ ĐI TỪNG BƯỚC ĐỂ DỄ HÌNH DUNG

Giả dụ mình quăng cho cái task "Tao muốn đi từ VN sang chơi Châu Âu chỉ với 10 triệu đồng"

Bước 1: Nhận Yêu Cầu (Query)

Hành Động: Người dùng đưa ra yêu cầu, ví dụ: "Tao muốn đi từ VN sang chơi Châu Âu chỉ với 10 triệu đồng"
Kết Quả: Hệ thống nhận yêu cầu và chuẩn bị để lập kế hoạch.

Bước 2: Lập Kế Hoạch (Planner)

Hành Động: Hệ thống sử dụng Planner để tạo ra một kế hoạch. Kế hoạch này có thể bao gồm:
- Tìm kiếm vé máy bay giá rẻ từ Việt Nam đến Châu Âu.
- Tìm kiếm khách sạn giá rẻ ở Châu Âu.
- Tính toán chi phí ăn uống và di chuyển.
Kết Quả: Kế hoạch được tạo ra và gửi đến Evaluator.

Bước 3: Đánh Giá Kế Hoạch (Evaluator)

Hành Động: Evaluator kiểm tra kế hoạch đã được tạo ra:
- Kiểm Tra Tính Hợp Lệ: Nếu kế hoạch yêu cầu hành động không khả thi (ví dụ: tìm kiếm thông tin mà không ra hoặc bị chặn vì lý do gì đó éo biết), kế hoạch sẽ bị đánh giá là không hợp lệ.
- Nếu kế hoạch có quá nhiều bước (ví dụ: hơn 10 bước), nó có thể bị loại bỏ.
Kết Quả:
Nếu kế hoạch hợp lệ, nó sẽ được gửi đến Executor để thực hiện.
- Nếu kế hoạch không hợp lệ, Evaluator sẽ yêu cầu Planner tạo lại kế hoạch.

Bước 4: Thực Hiện Kế Hoạch (Executor)

Hành Động: Nếu kế hoạch đã được xác thực, Executor sẽ thực hiện các hành động theo kế hoạch.
- Ví dụ:
  - Gọi API để tìm kiếm vé máy bay.
  - Gọi API để tìm kiếm khách sạn.
Kết Quả: Kết quả từ các hành động này sẽ được thu thập và gửi trở lại cho Evaluator.

Bước 5: Đánh Giá Kết Quả (Evaluator)

Hành Động: Evaluator sẽ đánh giá kết quả từ Executor:
- Kiểm tra xem các hành động đã đạt được mục tiêu hay chưa (ví dụ: tìm được vé máy bay và khách sạn trong ngân sách 10 triệu đồng).
Kết Quả:
- Nếu mục tiêu đã đạt được, quy trình sẽ chuyển sang Finish.
- Nếu mục tiêu chưa đạt được, Evaluator có thể yêu cầu Planner tạo một kế hoạch mới hoặc điều chỉnh kế hoạch hiện tại.

Bước 6: Kết Thúc (Finish)

Hành Động: Nếu tất cả các bước đã hoàn thành và mục tiêu đã đạt được, quy trình sẽ kết thúc.
Kết Quả: Hệ thống trả về thông tin cho người dùng về vé máy bay và khách sạn đã tìm được trong ngân sách 10 triệu đồng.

Tóm Tắt Quy Trình

Nhận yêu cầu từ người dùng.
Lập kế hoạch để giải quyết yêu cầu.
Đánh giá kế hoạch để đảm bảo tính khả thi.
Thực hiện kế hoạch nếu nó hợp lệ.
Đánh giá kết quả từ việc thực hiện.
Kết thúc quy trình và trả về thông tin cho người dùng.

À... à... vậy thì chỗ này tui có hàng loạt thắc mắc:

lỡ mày đánh giá kế hoạch khả thi mà khi thực hiện nó không đạt được mục tiêu thì hổng lẽ làm hoài? chi phí nào chịu nổi?
rồi giả sử cái đoạn đánh giá 10 triệu đòi đi Châu Âu không khả thi thì có chạy không hay là đi.. hỏi lại?

Mấy cái này thì tôi không rõ nhưng khi hỏi AI (dùng luôn cả o1 và Sonnet 3.5 luôn) thì nó trả lời thêm các giải pháp cho 2 câu trên:

Giới hạn số lượng kế hoạch, Phân tích kết quả, Cơ chế dừng tự động khi đạt ngưỡng (số lượng) nào đó, Thông báo hoặc hỏi lại người dùng, Tối ưu kế hoạch từ kinh nghiệm trước đó --> là cách mà nó sẽ hoạt động để tối ưu.
Còn đoạn đánh giá 10 triệu không khả thi thì rơi vô đoạn Evaluator nó đánh giá không khả thi rồi, sẽ hỏi lại "đi mấy ngày, nâng lên 30 triệu được hem"
Còn ý khác, ngoài đánh giá Kế Hoạch đầu vào, nó còn đánh giá luôn cái mục tiêu có đạt được với kể hoạch đã được duyệt khả thi không.

Còn tra cứu tài liệu thì phải nhắc đến: Khả năng học hỏi của AI Agent (Reinforcement Learning):

AI Agent có thể học hỏi thông qua các phương pháp như Reinforcement Learning. Agent sẽ nhận được phần thưởng khi thực hiện đúng và bị phạt khi thực hiện sai. Qua quá trình thử nghiệm và học hỏi, agent sẽ tìm ra chiến lược tối ưu để đạt được mục tiêu.

🙏 CUỐI CÙNG

AI Agents đại diện cho một bước tiến lớn trong lĩnh vực trí tuệ nhân tạo. Khả năng tự động hóa, học hỏi và thích ứng của chúng mở ra nhiều tiềm năng ứng dụng trong tương lai, từ trợ lý ảo cá nhân đến tự động hóa quy trình phức tạp trong doanh nghiệp.

Trên là những gì tui biết (và hiểu thì mới sương sương), nghĩ rằng có thể giá trị với anh chị em nên chia sẻ luôn để mọi người cùng đọc.

Hy vọng cũng được các anh chị em có chuyên môn sâu hơn chia sẻ tiếp để mình được học hỏi thêm 😃

Updated vài ý hỏi đáp:

Assistant của ChatGPT có phải là AI Agent?

Bạn Lê Ngọc Hòa có hỏi: Thiết lập Assistant của ChatGPT với các công cụ như Code Interpreter, File Search, Web Search... chính xác là tạo ra một AI Agent. Việc prompt đúng chỉ là một phần trong quá trình tương tác với agent này. Assistant của ChatGPT có khả năng lên kế hoạch (dù còn hạn chế), lựa chọn công cụ và thực hiện hành động để đáp ứng yêu cầu phức tạp của người dùng, vượt xa khả năng của một chatbot thông thường.

Có case study coi nó chạy như nào khum anh?

Chinh Dang có hỏi ý này, bài mình có update lại. Để ý xem các con ChatGPT hoặc Perplexity chạy từng bước cũng hình dung được dễ dàng rồi đó. Demo trực tiếp luôn ^^

Admin

✍️ GIẢI THÍCH ĐƠN GIẢN​

Workflow Automation:​

AI Agents​

🤔 ỦA.. Nếu dùng Make .com mà trước node API gì đó, Tui thêm node AI để đánh giá rồi mới chọn API phù hợp xử lý thì có được gọi là AI Agent không?​

🥴 Thấy các bác lúc thì agent, lúc thì agentic, lúc system, lú quá thì làm sao?​

ĐOẠN NÀY Cho luôn cơm thêm, các loại AI Agents thường gặp:​

🔀 Còn cái ảnh biểu đồ mà Huyền Chip vẽ nói về cái gì?​

Các Thành Phần Trong Sơ Đồ​

Đại khái, nó sẽ:​

✅ ĐI TỪNG BƯỚC ĐỂ DỄ HÌNH DUNG​

Bước 1: Nhận Yêu Cầu (Query)​

Bước 2: Lập Kế Hoạch (Planner)​

Bước 3: Đánh Giá Kế Hoạch (Evaluator)​

Bước 4: Thực Hiện Kế Hoạch (Executor)​

Bước 5: Đánh Giá Kết Quả (Evaluator)​

Bước 6: Kết Thúc (Finish)​

Tóm Tắt Quy Trình​

À... à... vậy thì chỗ này tui có hàng loạt thắc mắc:​

Còn tra cứu tài liệu thì phải nhắc đến: Khả năng học hỏi của AI Agent (Reinforcement Learning):​

🙏 CUỐI CÙNG​

Updated vài ý hỏi đáp:​

Assistant của ChatGPT có phải là AI Agent?​

Có case study coi nó chạy như nào khum anh?​