A.I: Bối cảnh dịch chuyển (P.7)
-Facebook: "https://www.facebook.com/tranthetruyen"
Đây là phần cuối của series này. Thứ tự đọc như sau: Phần 5 -7 (bài nói chuyện), rồi đến Phần 1-4 (phần thảo luận, links trong comment). Độ cập nhật thông tin dừng ở tháng 8/2024, xem như "lỗi mốt" trong thời AI thay đổi nhanh như chớp này. Ví dụ, những thảo luận về giải AI trong khoa học (Phần 4) và Nobel đã nhanh chóng hội tụ: Vào tháng 10/2024, AlphaFold -- thành tựu của AI trong ngành Sinh học phân tử đã đem lại giải Hóa học cho chủ nhân; Hopfield & Hinton -- hai trong những người đặt nền móng cho AI hiện tại được trao giải Vật lý. Tương tự, những thảo luận về AI cho Việt Nam (Phần 3) cũng nhanh chóng "bắt trend" với nghị quyết 57 về KHKT mới công bố tháng 12/2024. Tuy nhiên những bài học thu được trong 70 năm lịch sử AI thì vẫn còn có thể có ích nhiều năm nữa.

BỐI CẢNH ĐANG THAY ĐỔI
Hai thập kỷ qua đã chứng kiến sự thay đổi trong việc thực hành AI.
Trong những năm 2000, khi chúng ta phát triển giải pháp AI, chúng ta phải trải qua toàn bộ chu trình triển khai từ thu thập dữ liệu, trích xuất đặc trưng, phát triển mô hình và sau đó là triển khai. Quy trình rất phức tạp. Độ chính xác trong nhiều lĩnh vực khá thấp và mọi người vẫn còn hoài nghi.
Trong những năm 2010, khi deep learning phổ biến, chúng ta không cần tập trung vào phát triển mô hình nữa. Thay vào đó, chúng ta tập trung vào việc thu thập đúng loại dữ liệu. Dữ liệu càng nhiều càng tốt vì deep learning có thể mở rộng rất tốt với dữ liệu lớn và càng nhiều dữ liệu, độ chính xác càng cao. Và AI trở nên càng ngày càng hữu dụng nhờ sự cải thiện về độ chính xác. Quy trình giờ trở thành: thu thập dữ liệu, huấn luyện mô hình và sau đó triển khai. Và khi huấn luyện mô hình, chúng ta không cần bắt đầu từ đầu, chúng ta chỉ cần chọn đúng loại kiến trúc. Và tâm thế cho lĩnh vực này rất tốt đến mức mọi người đều cố gắng đẩy nhanh sự phát triển của AI.
Và giờ đây trong thập kỷ hiện tại, khi chúng ta có những hệ thống AI đa năng rất tốt, chúng ta không còn cần phát triển mô hình mới nữa. Tất cả những gì chúng ta cần làm ngày nay là đưa ra các câu lệnh điều khiển tốt để định hướng hành vi của các mô hình ngôn ngữ. Với các kỹ thuật mới như học theo ngữ cảnh hoặc chuỗi suy luận, chúng ta có thể phát triển ứng dụng AI rất nhanh với ít dữ liệu. Và với khả năng và sự phổ biến mới của AI, cùng với những rủi ro liên quan đến việc sử dụng AI, cộng đồng đã thay đổi tâm thế thành: Hãy có trách nhiệm khi triển khai các hệ thống.
Với bản chất của AI Tạo sinh, một trong những cách tốt là xem nó như một công nghệ "dặm đầu tiên". Nó khác với AI của các thế hệ trước. AI hiện đại đã thay đổi cách chúng ta xây dựng, duy trì và tương tác với hệ thống. AI Tạo sinh có thể làm nhiều việc, là một chuyên gia đa năng, nhưng nó không chuyên sâu vào bất cứ điều gì và do đó không hiệu quả bằng khi phục vụ như một hệ thống tiếp xúc trực tiếp với khách hàng. Vì vậy chúng ta cần phát triển các ứng dụng AI "dặm cuối cùng" được xây dựng trên nền tảng AI Tạo sinh đa năng.
Bản thân việc thực hành nghiên cứu trong AI đã thay đổi qua các năm. Ban đầu, chúng ta dành rất nhiều thời gian để thiết kế các hệ thống hoạt động. Và rồi với AI Tạo sinh, chúng ta chuyển chiến thuật sang khám phá các hành vi mới nổi của các hệ thống AI rất lớn. Giờ đây chúng ta tiếp cận AI nhiều hơn như các nhà khoa học; nghĩa là, chúng ta muốn tìm hiểu những quy luật chi phối hành vi của các hệ thống AI, nghiên cứu cách điều khiển chúng để sử dụng tốt.
KIẾN TRÚC HỆ THỐNG KÉP
Tuy nhiên, khả năng suy luận thực sự trong các hệ thống AI ngày nay vẫn còn thiếu. Có hai hệ thống trong nhận thức của con người. Hệ thống 1 là loại tự động. Chúng ta biết nó khi chúng ta thấy nó mà không cần suy nghĩ sâu, nó mang tính trực giác. Nhưng chúng ta cũng có một hệ thống khác với suy nghĩ sâu sắc. Chúng ta có xu hướng dành thời gian để suy nghĩ về các bước và hậu quả của giải pháp, đó là Hệ thống 2. Và đối với con người, Hệ thống 1 và Hệ thống 2 làm việc song song để giải quyết tốt nhất vấn đề đang gặp phải.
Deep learning hiện tại chủ yếu về Hệ thống 1. Còn các mô hình ngôn ngữ lớn ngày nay thì sao? Có vẻ như Hệ thống 2 đang thiếu. Mặc dù các nhà nghiên cứu đã cố gắng thể hiện khả năng của Hệ thống 2 thông qua chuỗi suy luận, đây không phải là suy nghĩ thực sự chân chính. Nó giống như hiển thị chuỗi suy luận hơn, nhưng không có gì đảm bảo rằng chuỗi suy luận thực sự diễn ra. Rất có thể đó là một sự truy xuất nhất định các mẫu mà chúng ta đã thấy trong văn bản huấn luyện hoặc mã. Giả thuyết của tôi là điều này xảy ra vì hệ thống ngôn ngữ được huấn luyện trên văn bản, và trong văn bản có các ví dụ về giải quyết vấn đề, và trong mã có giải quyết vấn đề từng bước. Khi đối mặt với một yêu cầu mới, hệ thống ngôn ngữ có thể truy xuất giải pháp tương tự cho các vấn đề tương tự mà chúng ta đã thấy trong dữ liệu huấn luyện, thay vì có khả năng suy luận thực sự.
Tại Viện AI Ứng dụng, ĐH Deakin nơi tôi làm việc, chúng tôi hình dung một kiến trúc có 4 thành phần: Hệ thống 1, Hệ thống 2, một hệ thống con về bộ nhớ, và một hệ thống con về lý thuyết tâm trí. Hệ thống 1 và 2 tương tác với bộ nhớ. Kết hợp những điều này lại với nhau, chúng ta sẽ xây dựng một hệ thống rất có khả năng có thể nhìn, nghe, ghi nhớ và suy nghĩ sâu sắc về thế giới và các tác nhân khác.
NHỮNG CÂU HỎI LỚN HƠN
Giờ đây với tất cả những tiến bộ của AI hiện đại, đã đến lúc chúng ta lùi lại một bước và suy nghĩ về hậu quả của việc có AI tiên tiến. Đối với tôi, có vẻ quan trọng là AI cho phép suy nghĩ về những câu hỏi rất lớn mà chúng ta không thể trả lời trước đây. Ví dụ, đối với một số người, trí tuệ nhân tạo tổng quát hay AGI đang đến gần hơn. Nhà tương lai học và nhà công nghệ Ray Kurzweil đã dự đoán một thời điểm cụ thể mà ông gọi là Điểm Kỳ dị, khi AI tốt hơn con người trong mọi khía cạnh của trí thông minh. Ông dự đoán rằng Điểm Kỳ dị sẽ đến trong khoảng 5 năm nữa, vào năm 2029. Một số người thậm chí nói nó sẽ đến năm nay, 2024, một số nói trong vài năm nữa hoặc vài nghìn ngày. Một số tin rằng phải mất nhiều thập kỷ.
Vì AI là đa năng, chúng ta có thể làm việc với tất cả các phương thức cùng một lúc. Chẳng hạn như, chúng ta có thể làm việc với văn bản, thị giác, âm thanh - ai biết được, chúng ta có thể kết nối những thứ như DNA, hồ sơ y tế, tín hiệu sinh lý để hiểu sâu về bản thân chúng ta. Những câu hỏi lớn khác là: Con người có ý nghĩa gì khi não sinh học được kết nối với não kỹ thuật số? Chúng ta có còn là chính mình không? Chúng ta có trở thành kỹ thuật số không? Hay chúng ta trở thành người khác hoặc thứ gì đó khác?
Và đã đến lúc bắt đầu đặt những câu hỏi lớn về ý thức. Còn về cơ sở hạ tầng điện toán đám mây mà chúng ta có ngày nay kết nối hàng tỷ tác nhân sống trong điện thoại di động hoặc các thiết bị nhỏ thì sao? Chúng ta đã có AGI theo nghĩa đó chưa? Điều gì sẽ xảy ra trong tương lai gần khi tất cả các tác nhân có thể nói chuyện với nhau?
Những câu hỏi lớn khác là: Khoa học có thể được tự động hóa không? Chúng ta có thể xây dựng các nhà khoa học AI có khả năng khám phá các quy luật vật lý mới không? Và nghĩ xa hơn, AI sẽ như thế nào khi nó được tích hợp với điện toán lượng tử? AI lượng tử sẽ trông như thế nào?
(Hết)