11/02/2023 10:29 GMT+7 | HighTech
Một công cụ tìm kiếm mà bạn có thể trò chuyện sẽ giúp tìm câu trả lời dễ dàng hơn - nếu nó không nói ra những điều hư cấu - đang khiến cả Microsoft, Google, Baidu, Alibaba cùng những công ty khác lao vào nghiên cứu chế tạo.
Jiang Chen, một chuyên gia máy học từng làm việc tại Google, đã bị mê hoặc khi lần đầu tiên dùng thử ChatGPT. Chatbot này có vẻ mạch lạc trong các câu trả lời và chứa đầy đủ thông tin để giải đáp bất cứ câu hỏi nào.
Nhưng vầng hào quang về sức mạnh của công nghệ này đã mờ đi khi Chen cố gắng sử dụng cùng một công nghệ cơ bản tạo ra ChatGPT để xây dựng một công cụ tìm kiếm tốt hơn cho công ty khởi nghiệp mà anh đồng sáng lập, Moveworks. Công ty muốn sử dụng AI để giúp nhân viên sàng lọc thông tin như các tài liệu hỗ trợ kỹ thuật và trang nhân sự.
Kết quả cho thấy công cụ tìm kiếm AI mới của Chen rất tuyệt vời trong việc thu thập tất cả các loại thông tin hữu ích từ các tài liệu đưa vào, bao gồm cung cấp địa chỉ và số điện thoại. Nhưng vấn đề là một vài trong số chúng không có thật. “Khả năng tự chế tạo của nó thật đáng kinh ngạc”, Chen nói.
Trong khi đó trên internet, sự phấn khích tột độ xung quanh ChatGPT đang lan tràn và không quá khó hiểu khi nhiều quan điểm phổ biến nói rằng nó có thể phát minh lại các công cụ tìm kiếm. Rõ ràng, chatbot này có thể cung cấp các câu trả lời phức tạp cho các câu hỏi bằng cách tổng hợp thông tin mà nó tìm thấy trong hàng tỷ từ trên mạng internet.
Nhưng, cách thức hoạt động của nó cơ bản lại trái ngược với ý tưởng về một công cụ tìm kiếm có thể truy xuất thông tin tìm thấy trên mạng một cách đáng tin cậy. Có rất nhiều thông tin không chính xác trên web, nhưng ChatGPT không nhận ra, thậm chí sau đó không chỉ sử dụng nó mà còn dùng nó để tạo ra những thông tin sai lệch mới. Các thuật toán cơ bản của AI không rút thông tin một cách trực tiếp từ cơ sở dữ liệu của các sự kiện hoặc liên kết, mà thay vào đó, chỉ tạo ra các chuỗi từ nhằm mục đích thống kê sao cho giống với những gì được thấy trong dữ liệu đào tạo của nó. Và tất nhiên, nó không quan tâm đến sự thật.
Bất chấp thách thức đó, và có lẽ được thúc đẩy bởi sự ham thích xung quanh ChatGPT, những gã khổng lồ về tìm kiếm trên web, cũng như một số công ty mới thành lập, đang bất chấp để tiến về phía trước. Microsoft, công ty đã đầu tư khoảng 10 tỷ USD vào OpenAI, đơn vị tạo ra ChatGPT, được cho là bằng cách nào đó sẽ bổ sung công nghệ này vào công cụ tìm kiếm của mình là Bing.
Google, đã âm thầm làm việc trên một chatbot tương tự có tên là LaMDA, được cho là đang cố gắng đưa ra phản hồi với Microsoft. Công ty có kế hoạch sớm phát hành một chatbot AI và có thể giới thiệu tới 20 sản phẩm tương tự trong năm nay.
Còn ở bên kia bán cầu, các công ty Trung Quốc cũng muốn có các hệ thống ngôn ngữ tự nhiên và thông minh của riêng mình vì nhiều lý do từ ngôn ngữ đến chính trị. Và gánh nặng tạo ra một ChatGPT bản địa chắc chắn sẽ đổ lên vai những gã khổng lồ công nghệ của đất nước này.
Sau khi ra mắt công cụ sáng tác nghệ thuật theo phong cách Stable Diffusion, Baidu gần đây đã thông báo rằng họ đang làm việc trên chatbot AI có tên Ernie, dự kiến sẽ ra mắt vào tháng 3. Còn tập đoàn thương mại điện tử Alibaba sau đó cũng đã tiết lộ rằng “câu trả lời” của họ cho ChatGPT đang được thử nghiệm nội bộ. Công ty mẹ của WeChat, Tencent, cho biết họ đang tiến hành các “nghiên cứu có liên quan”.
Trong khi đó, một số công ty khởi nghiệp đã nhanh nhạy tung ra các công cụ tìm kiếm có giao diện trò chuyện tương tự như ChatGPT. Chúng bao gồm You.com, Perplexity AI và Neeva .
Các công cụ này đã minh họa cả tiềm năng và thách thức của việc điều chỉnh công nghệ kiểu ChatGPT để nhằm mục đích tìm kiếm. You.com, được thành lập bởi Richard Socher, một chuyên gia về ngôn ngữ và AI, có thể cung cấp câu trả lời thông qua giao diện trò chuyện. Các câu trả lời sẽ đi kèm với các trích dẫn, có thể giúp người dùng theo dõi nguồn gốc của một phần thông tin.
Nhưng mô hình này đôi khi kết hợp các nguồn không thuộc về nhau. Ví dụ, khi bạn hỏi về một người cụ thể, câu trả lời có thể tạo ra bằng cách kết hợp thông tin từ tiểu sử của nhiều người có cùng tên.
Một vấn đề khác với một hệ thống như ChatGPT là các phản hồi của nó chỉ dựa trên dữ liệu mà nó đã được đào tạo. Việc đào tạo lại toàn bộ mô hình có thể tiêu tốn hàng triệu USD vì kích thước và quy mô dữ liệu của nó. Đó là lý do YouChat bối rối khi được hỏi về tỷ số thể thao mới nhất nhưng lại biết thời tiết ở New York hiện tại như thế nào. Socher không muốn tiết lộ cách kết hợp các thông tin, coi đó là một lợi thế cạnh tranh.
“Tôi nghĩ hiện tại rất nhiều giao diện trò chuyện này vượt trội hơn nhiều so với trải nghiệm dùng công cụ tìm kiếm ở một số khía cạnh, nhưng ở những khía cạnh khác, chúng rõ ràng vẫn còn tệ hơn nhiều”, Socher thừa nhận. “Chúng tôi đang làm việc để giảm thiểu tất cả những vấn đề này.”
Aravind Srinivas, người sáng lập kiếm CEO của công ty khởi nghiệp Perplexity AI, người trước đây đã làm việc tại OpenAI, cho biết thách thức để tạo ra một hệ thống giống như ChatGPT với các thông tin dữ liệu gần đây có nghĩa là chúng sẽ cần được kết hợp với một thứ khác. Ông nói: “Một mình chúng sẽ không bao giờ có thể trở thành công cụ tìm kiếm tốt.”
Saam Motamedi, một nhà đầu tư mạo hiểm tại Greylock Partners, người đã đầu tư vào công ty tìm kiếm dựa trên trí tuệ nhân tạo Neeva, cho biết ông vẫn chưa rõ các giao diện trò chuyện sẽ tương thích như thế nào với mô hình doanh thu chính cho các công cụ tìm kiếm, cụ thể là quảng cáo. Google và Bing sử dụng truy vấn tìm kiếm để chọn quảng cáo xuất hiện trên đầu danh sách các liên kết được cung cấp để phản hồi. Nhưng Motamedi nghi ngờ rằng các hình thức quảng cáo mới có thể cần phải xuất hiện để các giao diện tìm kiếm kiểu trò chuyện trở nên khả thi, nhưng ông hoàn toàn không rõ những hình thức đó sẽ là gì. Neeva hiện tính phí đăng ký cho các tìm kiếm không có quảng cáo không giới hạn.
Chi phí vận hành một mô hình như ChatGPT trên quy mô của Google cũng có thể sẽ gây ra vấn đề. Luis Ceze, đồng sáng lập và CEO của OctoML, một công ty chuyên giúp các công ty giảm chi phí triển khai các thuật toán học máy, ước tính rằng việc chạy một tìm kiếm trên ChatGPT có thể đắt gấp 10 lần so với tìm kiếm Google. Bởi vì mỗi câu trả lời sẽ yêu cầu chạy trên một mô hình quy mô lớn và hệ thống AI phức tạp.
Cơn sốt ChatGPT cũng đã khiến một số lập trình viên và nhà nghiên cứu AI phải ngạc nhiên. Thuật toán cốt lõi của con bot này, được gọi là GPT, được OpenAI phát triển lần đầu tiên vào năm 2018 và một phiên bản mạnh mẽ hơn, GPT-2, đã được tiết lộ vào năm 2019 . Đó là một mô hình máy học được thiết kế để lấy văn bản và sau đó dự đoán điều gì sẽ xảy ra tiếp theo. Tuy nhiên, OpenAI đã cho thấy nó có thể hoạt động ấn tượng nếu được đào tạo với khối lượng văn bản khổng lồ. Phiên bản thương mại đầu tiên của công nghệ, GPT-3, đã có sẵn cho các nhà phát triển sử dụng kể từ tháng 6 năm 2020 và có thể thực hiện được nhiều điều mà ChatGPT đã thể hiện gần đây.
Theo đó, ChatGPT đã sử dụng phiên bản cải tiến của thuật toán cơ bản, nhưng bước nhảy vọt lớn nhất trong khả năng của nó đến từ việc OpenAI có đối tượng thử nghiệm là con người, những người sẽ cung cấp phản hồi cho hệ thống về điều gì tạo ra câu trả lời đủ để thỏa mãn họ. Nhưng giống như các hệ thống tạo văn bản trước đó, ChatGPT vẫn có xu hướng tái tạo các thông tin sai lệch từ dữ liệu đào tạo của nó, cũng như tạo ra các kết quả trông hợp lý nhưng thực tế lại không chính xác.
Gary Marcus, giáo sư danh dự tại Đại học New York và là người lên tiếng chỉ trích sự cường điệu của AI, tin rằng ChatGPT không phù hợp để tìm kiếm vì nó không hiểu thực sự về những gì nó nói. Ông nói thêm rằng các công cụ như ChatGPT có thể gây ra các vấn đề khác cho các công ty tìm kiếm bằng cách làm tràn ngập internet bằng các văn bản được tối ưu hóa cho công cụ tìm kiếm, do chính AI này tạo ra. Ông nói: “Tất cả các công cụ tìm kiếm sắp gặp sự cố.”
Alex Ratner, trợ lý giáo sư tại Đại học Washington và là người đồng sáng lập Snorkel AI, chuyên đào tạo các mô hình AI để giúp chúng hiệu quả hơn, gọi ChatGPT là “một bước ngoặt hợp pháp” cho những gì mà một phần mềm có thể làm. Nhưng ông cũng nói rằng có thể mất một thời gian để tìm ra cách ngăn chặn các mô hình ngôn ngữ như GPT bịa đặt thông tin. Ông tin rằng việc tìm cách cập nhật thông tin mới cho nó để giữ cho nguồn tìm kiếm luôn mới mẻ rất có thể sẽ liên quan đến các phương pháp mới để đào tạo các mô hình AI cơ bản.
Nhưng những bản sửa lỗi đó sẽ mất bao lâu để xuất hiện vẫn chưa ai biết. Có thể sẽ mất một thời gian dài trước khi công nghệ này có thể thay đổi hoàn toàn cách mọi người tìm kiếm câu trả lời.
“Tôi đã nói với nhóm của mình rằng mọi người sẽ thấy sự khác biệt giữa trước và sau khi có ChatGPT”, Chen từ Moveworks cho biết. “Nhưng liệu nó có thay thế được các công cụ tìm kiếm hay không lại là một câu hỏi khác.”
Tham khảo Wired
Đăng nhập
Họ và tên
Mật khẩu
Xác nhận mật khẩu
Mã xác nhận
Tải lại captchaĐăng ký
Xin chào, !
Bạn đã đăng nhập với email:
Đăng xuất