A.I: Bối cảnh dịch chuyển (P.6)
-Facebook: "https://www.facebook.com/tranthetruyen"
"Chúa tạo ra con người theo hình ảnh của Ngài. Con người tạo ra AI theo hình ảnh của mình." (Rodney Brooks, 2018)

Chiến lược AI quốc gia
Cuối năm 2018, một người bạn của tôi từ Việt Nam đến thăm tôi ở Melbourne và chúng tôi đã có một cuộc trò chuyện dài về những phát triển công nghệ thú vị nhất trên thế giới mà các nước đang phát triển như Việt Nam có thể hưởng lợi. Câu trả lời của tôi là có hai loại công nghệ sẽ thay đổi thế giới. Một là AI và cái kia là điện toán lượng tử. AI mang tính ngắn và trung hạn hơn, còn điện toán lượng tử thì mang tính trung và dài hạn hơn.
Vào thời điểm đó, hệ sinh thái AI đã phát triển rất tốt. Chúng ta có PyTorch, được phát triển bởi Facebook (nay là Meta), và TensorFlow, được phát triển bởi Google và chúng có thể truy cập được bởi mọi người trên khắp thế giới. Những kiến thức cơ bản về mạng nơ-ron không quá nâng cao về mặt toán học. Những thứ chúng ta sử dụng như là sự kết hợp của toán học cấp ba và đại học với các phép toán ma trận và tối ưu hóa. Nhưng việc tối ưu hóa thực ra được thực hiện bởi phần mềm. Vì vậy để hiểu deep learning, chúng ta chỉ cần hiểu một chút về thao tác ma trận.
Và nhờ tính chất mã nguồn mở của PyTorch và TensorFlow, bất kỳ ai có kỹ năng lập trình đều có thể nhanh chóng nắm bắt AI cơ bản và thử nghiệm. Trong khi đó điện toán lượng tử vẫn còn trong giai đoạn rất sơ khai, chúng ta vẫn chưa có phần cứng sẵn có cho lập trình viên hàng ngày.
Vì vậy, tôi và người bạn đã cùng viết một bài luận có tựa đề "Kế hoạch Duy lý cho AI Duy lý ở Việt Nam giai đoạn 2019-2029." Tôi viết rằng tôi kỳ vọng kế hoạch sẽ được chính AI viết, bởi vì không có giới hạn về những gì AI có thể làm, phải không? Hãy tưởng tượng nếu AI có thể đọc tất cả các tài liệu về kinh tế Việt Nam và khí hậu chính trị, và hiểu được nguyện vọng của người dân và lãnh đạo, nó hẳn sẽ có thể viết một kế hoạch hợp lý. Điều đó không thể làm được vào năm 2018, nhưng tôi đoán ngày nay nó không còn xa vời nếu ai đó thực sự thử.
Và vào thời điểm đó, chúng tôi nhận thấy rằng sự tiến bộ của AI là không thể ngăn cản và bất kỳ quốc gia nào cũng phải chuẩn bị cho sự xuất hiện của AI vì nếu không quản lý đúng đắn, nó có thể gây ra những vấn đề như khủng hoảng xã hội chẳng hạn như mất việc làm, hoặc người dân không hài lòng về bản chất của việc sử dụng AI, hoặc những kẻ xấu có thể lợi dụng công nghệ và làm điều xấu như lan truyền thông tin sai lệch hoặc gây hại cho người dân. Chúng tôi cũng nhận ra rằng vì AI dựa trên dữ liệu lớn và hệ thống lớn, những người có quyền lực nhất sẽ là các công ty công nghệ Internet như Google, Facebook, IBM hay Amazon. Chúng tôi không biết vào thời điểm đó rằng các startup như OpenAI có thể trở thành những người chơi chính và chiến thắng tất cả. DeepMind đã là một startup lớn được Google mua lại. OpenAI vẫn độc lập cho đến nay, nhưng phải liên kết với Microsoft vì nguồn lực cần thiết để huấn luyện các hệ thống AI lớn. Giờ nhìn lại, chúng ta thấy rằng nhiều điều chúng tôi dự đoán đã trở thành sự thật. Thật thú vị khi xem những gì khác sẽ trở thành sự thật.
Khả năng mở rộng theo hạ tầng tính toán mới quan trọng
Một năm sau, vào năm 2019, cộng đồng AI đã bị khuấy động bởi một bài luận của Giáo sư Rich Sutton - một người tiên phong trong học tăng cường. Bài luận có tựa đề "Bài học Cay đắng". Trong bài luận, ông nói rằng bài học lớn nhất từ 70 năm nghiên cứu AI là phương pháp chiến thắng là phương pháp có thể tận dụng tốt sức mạnh tính toán. Và khi nó thắng, nó thắng với khoảng cách rất lớn so với các đối thủ. Và nếu quan sát từ lịch sử AI, khá rõ ràng rằng các phương pháp không mở rộng được sẽ không tồn tại lâu. Ví dụ, các phương pháp dựa vào kinh nghiệm trong những năm 1980 với hệ chuyên gia dựa trên việc nhập luật của con người, và các phương pháp rất khó mở rộng như phương pháp hạt nhân trên tập dữ liệu lớn, hóa ra dễ dàng bị thay thế bởi mạng nơ-ron.
Giáo sư Sutton nói hai phương pháp có thể mở rộng rất tốt là tìm kiếm và học. Tìm kiếm là những gì Google hay Bing làm, học là học máy mà chúng ta thấy ngày nay. Phần lớn AI ngày nay dựa trên học máy.
Bản chất quan trọng nhất của deep learning là nó mở rộng được với sức mạnh tính toán. Không có giới hạn cơ bản nào cho khả năng mở rộng của nó, miễn là chúng ta có phần cứng để chạy nó.
SỰ TRỖI DẬY CỦA A.I TỔNG QUÁT
Tâm thế của cộng đồng AI cao đến mức vào năm sau, năm 2020, Giáo sư Hinton tuyên bố rằng deep learning sẽ có thể làm được mọi thứ. Không có giới hạn về những gì deep learning có thể làm.
Kể từ năm 2020, bối cảnh AI đã thay đổi rất nhanh chóng. Trước năm 2020, chúng ta có những thứ cụ thể như phát hiện spam, dịch máy, hệ thống trả lời câu hỏi cơ bản và một số hệ thống trợ giúp lập trình nguyên thủy như tự động hoàn thành hoặc gợi ý API. Nhiều trong số đó là các hệ thống chuyên biệt, mỗi hệ thống được huấn luyện để làm tốt chỉ một nhiệm vụ.
Sau năm 2020, chúng ta nhanh chóng có các hệ thống AI đa năng có thể viết bài luận hoàn chỉnh và viết nhiều dòng mã, thậm chí là cả ứng dụng phức tạp. Đến giữa năm 2022, khá rõ ràng rằng giờ đây chúng ta có thể huấn luyện AI tổng quát để làm nhiều việc, nếu không muốn nói là mọi việc, cùng một lúc. Một hệ thống tên là Gato, được phát triển bởi DeepMind có thể xử lý ngôn ngữ, thị giác và thậm chí cả hành động robot.
AI Tạo sinh trở thành một lĩnh vực đầu tư chủ chốt.
Khoảnh khắc định nghĩa có lẽ là sự ra mắt của ChatGPT vào cuối năm 2022. Chưa bao giờ một sản phẩm công nghệ lại thu hút sự chú ý mạnh mẽ như vậy từ công chúng. Hàng trăm triệu người dùng đăng ký trong vòng vài tuần. Đối với nhiều người, thời khắc thực sự của AI đã đến.
Trong 2 năm qua, Mô hình Ngôn ngữ Lớn và Mô hình Khuếch tán đã thống trị tất cả các hội nghị nghiên cứu AI lớn.
Với xu hướng hiện tại, có sự suy đoán rằng AI có thể làm được nhiều việc trong năm tới hoặc gần đó. Nghĩa là, AI có thể viết tốt hơn con người trung bình, lập trình tốt hơn lập trình viên trung bình, suy nghĩ như một nghiên cứu sinh, và tạo video theo yêu cầu mà mạch lạc và đủ dài để thưởng thức.
Ba góc nhìn về AI Tạo sinh
Giờ đây, với việc AI Tạo sinh hiện tại rất, rất mạnh mẽ. Chúng ta chưa định nghĩa nó một cách chính thức nhưng hãy đồng ý rằng AI Tạo sinh là một loại công nghệ có thể tạo ra các tác phẩm số như văn bản, hình ảnh, mã, âm thanh và thậm chí cả DNA hoặc protein. Vậy chúng ta nên nhìn nhận AI Tạo sinh như thế nào? Ít nhất có ba cách để nhìn nhận nó.
-
Cách đầu tiên là xem AI Tạo sinh như một loại động cơ nén, trong đó mô hình nén toàn bộ dữ liệu Internet vào trọng số mô hình và khi chúng ta đưa ra yêu cầu, mô hình giải nén những gì nó đã ghi nhớ dựa trên yêu cầu đó. Và đó là những gì chúng ta có ngày nay với GPT và các kỹ thuật hoặc phần mềm cạnh tranh khác.
-
Một cách khác để nhìn nhận AI Tạo sinh là nó là một loại cơ sở dữ liệu chương trình gần đúng. Khi nói cơ sở dữ liệu chương trình gần đúng, chúng ta muốn nói rằng bất cứ khi nào chúng ta đưa ra yêu cầu, mô hình sẽ truy xuất một chương trình liên quan có thể thực thi yêu cầu đó và đưa ra câu trả lời. Vì vậy nó tiến bộ hơn một chút so với góc nhìn về nén, bởi vì nén hoạt động ở mức dữ liệu, trong khi chương trình hoạt động ở mức hàm. Vì vậy nó tiến thêm một bước. Chúng ta có thể đi xa đến đâu với góc nhìn này? Tôi không biết, nhưng hành vi của các mô hình ngôn ngữ ngày nay dường như cho thấy vẫn còn không gian để phát triển.
-
Cách thứ ba để nhìn nhận AI Tạo sinh là một cách để nắm bắt các mô hình thế giới trong các tham số của nó. Và từ đó chúng ta có thể tạo ra một mô hình cẩn thận mà chúng ta mong đợi thấy. Sau đó chúng ta có thể đi xa hơn với điều này bằng cách thấy rằng chúng ta có thể sống trong các mô phỏng.