Cuộc chạy đua để xây dựng công cụ tìm kiếm dựa trên ChatGPT đã bắt đầu, bạn có thể thử chúng ngay bây giờ

11/02/2023 10:29 GMT+7 | HighTech

Một công cụ tìm kiếm mà bạn có thể trò chuyện sẽ giúp tìm câu trả lời dễ dàng hơn - nếu nó không nói ra những điều hư cấu - đang khiến cả Microsoft, Google, Baidu, Alibaba cùng những công ty khác lao vào nghiên cứu chế tạo.

Jiang Chen, một chuyên gia máy học từng làm việc tại Google, đã bị mê hoặc khi lần đầu tiên dùng thử ChatGPT. Chatbot này có vẻ mạch lạc trong các câu trả lời và chứa đầy đủ thông tin để giải đáp bất cứ câu hỏi nào.

Nhưng vầng hào quang về sức mạnh của công nghệ này đã mờ đi khi Chen cố gắng sử dụng cùng một công nghệ cơ bản tạo ra ChatGPT để xây dựng một công cụ tìm kiếm tốt hơn cho công ty khởi nghiệp mà anh đồng sáng lập, Moveworks. Công ty muốn sử dụng AI để giúp nhân viên sàng lọc thông tin như các tài liệu hỗ trợ kỹ thuật và trang nhân sự.

Kết quả cho thấy công cụ tìm kiếm AI mới của Chen rất tuyệt vời trong việc thu thập tất cả các loại thông tin hữu ích từ các tài liệu đưa vào, bao gồm cung cấp địa chỉ và số điện thoại. Nhưng vấn đề là một vài trong số chúng không có thật. “Khả năng tự chế tạo của nó thật đáng kinh ngạc”, Chen nói.

Trong khi đó trên internet, sự phấn khích tột độ xung quanh ChatGPT đang lan tràn và không quá khó hiểu khi nhiều quan điểm phổ biến nói rằng nó có thể phát minh lại các công cụ tìm kiếm. Rõ ràng, chatbot này có thể cung cấp các câu trả lời phức tạp cho các câu hỏi bằng cách tổng hợp thông tin mà nó tìm thấy trong hàng tỷ từ trên mạng internet.

Nhưng, cách thức hoạt động của nó cơ bản lại trái ngược với ý tưởng về một công cụ tìm kiếm có thể truy xuất thông tin tìm thấy trên mạng một cách đáng tin cậy. Có rất nhiều thông tin không chính xác trên web, nhưng ChatGPT không nhận ra, thậm chí sau đó không chỉ sử dụng nó mà còn dùng nó để tạo ra những thông tin sai lệch mới. Các thuật toán cơ bản của AI không rút thông tin một cách trực tiếp từ cơ sở dữ liệu của các sự kiện hoặc liên kết, mà thay vào đó, chỉ tạo ra các chuỗi từ nhằm mục đích thống kê sao cho giống với những gì được thấy trong dữ liệu đào tạo của nó. Và tất nhiên, nó không quan tâm đến sự thật.

Bất chấp thách thức đó, và có lẽ được thúc đẩy bởi sự ham thích xung quanh ChatGPT, những gã khổng lồ về tìm kiếm trên web, cũng như một số công ty mới thành lập, đang bất chấp để tiến về phía trước. Microsoft, công ty đã đầu tư khoảng 10 tỷ USD vào OpenAI, đơn vị tạo ra ChatGPT, được cho là bằng cách nào đó sẽ bổ sung công nghệ này vào công cụ tìm kiếm của mình là Bing.

Google, đã âm thầm làm việc trên một chatbot tương tự có tên là LaMDA, được cho là đang cố gắng đưa ra phản hồi với Microsoft. Công ty có kế hoạch sớm phát hành một chatbot AI và có thể giới thiệu tới 20 sản phẩm tương tự trong năm nay.

Còn ở bên kia bán cầu, các công ty Trung Quốc cũng muốn có các hệ thống ngôn ngữ tự nhiên và thông minh của riêng mình vì nhiều lý do từ ngôn ngữ đến chính trị. Và gánh nặng tạo ra một ChatGPT bản địa chắc chắn sẽ đổ lên vai những gã khổng lồ công nghệ của đất nước này.

Sau khi ra mắt công cụ sáng tác nghệ thuật theo phong cách Stable Diffusion, Baidu gần đây đã thông báo rằng họ đang làm việc trên chatbot AI có tên Ernie, dự kiến sẽ ra mắt vào tháng 3. Còn tập đoàn thương mại điện tử Alibaba sau đó cũng đã tiết lộ rằng “câu trả lời” của họ cho ChatGPT đang được thử nghiệm nội bộ. Công ty mẹ của WeChat, Tencent, cho biết họ đang tiến hành các “nghiên cứu có liên quan”.

Trong khi đó, một số công ty khởi nghiệp đã nhanh nhạy tung ra các công cụ tìm kiếm có giao diện trò chuyện tương tự như ChatGPT. Chúng bao gồm You.com, Perplexity AI và Neeva .

Các công cụ này đã minh họa cả tiềm năng và thách thức của việc điều chỉnh công nghệ kiểu ChatGPT để nhằm mục đích tìm kiếm. You.com, được thành lập bởi Richard Socher, một chuyên gia về ngôn ngữ và AI, có thể cung cấp câu trả lời thông qua giao diện trò chuyện. Các câu trả lời sẽ đi kèm với các trích dẫn, có thể giúp người dùng theo dõi nguồn gốc của một phần thông tin.

Nhưng mô hình này đôi khi kết hợp các nguồn không thuộc về nhau. Ví dụ, khi bạn hỏi về một người cụ thể, câu trả lời có thể tạo ra bằng cách kết hợp thông tin từ tiểu sử của nhiều người có cùng tên.

Một vấn đề khác với một hệ thống như ChatGPT là các phản hồi của nó chỉ dựa trên dữ liệu mà nó đã được đào tạo. Việc đào tạo lại toàn bộ mô hình có thể tiêu tốn hàng triệu USD vì kích thước và quy mô dữ liệu của nó. Đó là lý do YouChat bối rối khi được hỏi về tỷ số thể thao mới nhất nhưng lại biết thời tiết ở New York hiện tại như thế nào. Socher không muốn tiết lộ cách kết hợp các thông tin, coi đó là một lợi thế cạnh tranh.

“Tôi nghĩ hiện tại rất nhiều giao diện trò chuyện này vượt trội hơn nhiều so với trải nghiệm dùng công cụ tìm kiếm ở một số khía cạnh, nhưng ở những khía cạnh khác, chúng rõ ràng vẫn còn tệ hơn nhiều”, Socher thừa nhận. “Chúng tôi đang làm việc để giảm thiểu tất cả những vấn đề này.”

Aravind Srinivas, người sáng lập kiếm CEO của công ty khởi nghiệp Perplexity AI, người trước đây đã làm việc tại OpenAI, cho biết thách thức để tạo ra một hệ thống giống như ChatGPT với các thông tin dữ liệu gần đây có nghĩa là chúng sẽ cần được kết hợp với một thứ khác. Ông nói: “Một mình chúng sẽ không bao giờ có thể trở thành công cụ tìm kiếm tốt.”

Saam Motamedi, một nhà đầu tư mạo hiểm tại Greylock Partners, người đã đầu tư vào công ty tìm kiếm dựa trên trí tuệ nhân tạo Neeva, cho biết ông vẫn chưa rõ các giao diện trò chuyện sẽ tương thích như thế nào với mô hình doanh thu chính cho các công cụ tìm kiếm, cụ thể là quảng cáo. Google và Bing sử dụng truy vấn tìm kiếm để chọn quảng cáo xuất hiện trên đầu danh sách các liên kết được cung cấp để phản hồi. Nhưng Motamedi nghi ngờ rằng các hình thức quảng cáo mới có thể cần phải xuất hiện để các giao diện tìm kiếm kiểu trò chuyện trở nên khả thi, nhưng ông hoàn toàn không rõ những hình thức đó sẽ là gì. Neeva hiện tính phí đăng ký cho các tìm kiếm không có quảng cáo không giới hạn.

Chi phí vận hành một mô hình như ChatGPT trên quy mô của Google cũng có thể sẽ gây ra vấn đề. Luis Ceze, đồng sáng lập và CEO của OctoML, một công ty chuyên giúp các công ty giảm chi phí triển khai các thuật toán học máy, ước tính rằng việc chạy một tìm kiếm trên ChatGPT có thể đắt gấp 10 lần so với tìm kiếm Google. Bởi vì mỗi câu trả lời sẽ yêu cầu chạy trên một mô hình quy mô lớn và hệ thống AI phức tạp.

Cơn sốt ChatGPT cũng đã khiến một số lập trình viên và nhà nghiên cứu AI phải ngạc nhiên. Thuật toán cốt lõi của con bot này, được gọi là GPT, được OpenAI phát triển lần đầu tiên vào năm 2018 và một phiên bản mạnh mẽ hơn, GPT-2, đã được tiết lộ vào năm 2019 . Đó là một mô hình máy học được thiết kế để lấy văn bản và sau đó dự đoán điều gì sẽ xảy ra tiếp theo. Tuy nhiên, OpenAI đã cho thấy nó có thể hoạt động ấn tượng nếu được đào tạo với khối lượng văn bản khổng lồ. Phiên bản thương mại đầu tiên của công nghệ, GPT-3, đã có sẵn cho các nhà phát triển sử dụng kể từ tháng 6 năm 2020 và có thể thực hiện được nhiều điều mà ChatGPT đã thể hiện gần đây.

Theo đó, ChatGPT đã sử dụng phiên bản cải tiến của thuật toán cơ bản, nhưng bước nhảy vọt lớn nhất trong khả năng của nó đến từ việc OpenAI có đối tượng thử nghiệm là con người, những người sẽ cung cấp phản hồi cho hệ thống về điều gì tạo ra câu trả lời đủ để thỏa mãn họ. Nhưng giống như các hệ thống tạo văn bản trước đó, ChatGPT vẫn có xu hướng tái tạo các thông tin sai lệch từ dữ liệu đào tạo của nó, cũng như tạo ra các kết quả trông hợp lý nhưng thực tế lại không chính xác.

Gary Marcus, giáo sư danh dự tại Đại học New York và là người lên tiếng chỉ trích sự cường điệu của AI, tin rằng ChatGPT không phù hợp để tìm kiếm vì nó không hiểu thực sự về những gì nó nói. Ông nói thêm rằng các công cụ như ChatGPT có thể gây ra các vấn đề khác cho các công ty tìm kiếm bằng cách làm tràn ngập internet bằng các văn bản được tối ưu hóa cho công cụ tìm kiếm, do chính AI này tạo ra. Ông nói: “Tất cả các công cụ tìm kiếm sắp gặp sự cố.”

Alex Ratner, trợ lý giáo sư tại Đại học Washington và là người đồng sáng lập Snorkel AI, chuyên đào tạo các mô hình AI để giúp chúng hiệu quả hơn, gọi ChatGPT là “một bước ngoặt hợp pháp” cho những gì mà một phần mềm có thể làm. Nhưng ông cũng nói rằng có thể mất một thời gian để tìm ra cách ngăn chặn các mô hình ngôn ngữ như GPT bịa đặt thông tin. Ông tin rằng việc tìm cách cập nhật thông tin mới cho nó để giữ cho nguồn tìm kiếm luôn mới mẻ rất có thể sẽ liên quan đến các phương pháp mới để đào tạo các mô hình AI cơ bản.

Nhưng những bản sửa lỗi đó sẽ mất bao lâu để xuất hiện vẫn chưa ai biết. Có thể sẽ mất một thời gian dài trước khi công nghệ này có thể thay đổi hoàn toàn cách mọi người tìm kiếm câu trả lời.

“Tôi đã nói với nhóm của mình rằng mọi người sẽ thấy sự khác biệt giữa trước và sau khi có ChatGPT”, Chen từ Moveworks cho biết. “Nhưng liệu nó có thay thế được các công cụ tìm kiếm hay không lại là một câu hỏi khác.”

Tham khảo Wired

Bảo Nam

Tags:

Cùng chuyên mục

Xem theo ngày

Đọc thêm

"Âm dương lộ" - chưa đủ "độ chín" của phim kinh dị

Từng dẫn đầu doanh thu phòng vé trong vài ngày kể từ khi ra mắt, nhưng Âm dương lộ (đạo diễn: Hoàng Tuấn Cường) có lẽ sẽ khó chạm đến cột mốc 50 tỷ đồng, vì phần kịch bản "lỗi thời, dàn dựng mang hơi hướng truyền hình hơn là điện ảnh.
10/04/2025 18:00 0
Những bộ xương có thể "viết lại" lịch sử Kim tự tháp

Cuối tháng 3 vừa qua, các nhà khoa học Hà Lan và Mỹ vừa công bố một phát hiện bất ngờ: Trái ngược với quan niệm lâu đời rằng Kim tự tháp là nơi an nghỉ cuối cùng dành riêng cho tầng lớp quý tộc giàu có, nơi đây có thể vẫn dành chỗ cho những người lao động vất vả, thuộc tầng lớp thấp trong xã hội.
10/04/2025 17:59 0
3 lý do để mong chờ bộ phim Hàn sắp ra mắt 'Crushology 101'

Bộ phim truyền hình sắp tới của đài MBC, Crushology 101, đã hé lộ một vài lý do chính khiến khán giả nên háo hức chờ đợi ngày công chiếu!
10/04/2025 17:58 0
Mối tình hơn 60 năm của cặp NSƯT: 'Ai nói già rồi thì không có tình yêu?'

Câu chuyện tình yêu của NSƯT Mạnh Dung và NSƯT Thanh Dậu là minh chứng cho sự thủy chung, son sắt và lòng yêu nghề không đổi. Họ không chỉ là những nghệ sĩ đáng kính mà còn là hình mẫu về một tình yêu vượt thời gian.
10/04/2025 17:56 0
Bỏng mắt do hóa chất - cấp cứu khẩn cấp bảo vệ thị lực

Bỏng mắt do hóa chất là một cấp cứu nhãn khoa có thể gây tổn thương nghiêm trọng cho mắt, thậm chí dẫn đến mất thị lực vĩnh viễn nếu không được xử trí kịp thời.
10/04/2025 17:54 0
Bệnh viện Mắt Sài Gòn Đà Lạt điều trị thành công đục thủy tinh thể hai mắt cho bệnh nhân mắc hội chứng Down

Bệnh viện Mắt Sài Gòn Đà Lạt vừa qua đã phẫu thuật thành công cho bệnh nhân Nguyễn N.H. (sinh năm 1973, ngụ tại TP. Bảo Lộc, Lâm Đồng) mắc hội chứng Down, bị đục thủy tinh thể cả hai mắt ở mức độ nặng.
10/04/2025 17:53 0
Tin nóng thể thao tối 10/4: Thủ tướng gửi thư khen U17 Việt Nam; cầu thủ Việt kiều Thái Lan gia nhập HAGL

Tin nóng thể thao tối 10/4: Thủ tướng động viên đội tuyển U17 Việt Nam trước đại chiến với UAE. Thủ môn Việt kiều Thái Lan gia nhập HAGL. Wushu Việt Nam giành 4 HCV, chỉ xếp sau Trung Quốc ở Cúp tán thủ Thế giới 2025...
10/04/2025 17:53 0
Bệnh viện Mắt Sài Gòn Đà Lạt - bệnh viện chuyên khoa mắt chất lượng cao đầu tiên tại tỉnh Lâm Đồng

Bệnh viện Mắt Sài Gòn Đà Lạt đã trở thành địa chỉ tin cậy của hàng nghìn bệnh nhân mỗi năm. Với đội ngũ bác sĩ giàu kinh nghiệm và trang thiết bị hiện đại, bệnh viện cung cấp dịch vụ khám chữa các bệnh lý về mắt như viễn thị, cận thị, loạn thị, đục thủy tinh thể, glaucoma, và các bệnh lý võng mạc
10/04/2025 17:51 0
XSMN 10/4 - Kết quả xổ số miền Nam hôm nay 10/4/2025 - Trực tiếp XSMN ngày 10 tháng 4

XSMN 10/4: Xổ số miền Nam ngày 10/4/2025 gồm các tỉnh Tây Ninh, An Giang và Bình Thuận. Theo dõi kết quả XSMN hôm nay thứ Năm ngày 10/4 trên Thethaovanhoa.vn.
10/04/2025 17:10 0
Cựu vô địch thế giới billiard snooker bị đình chỉ thi đấu vì cáo buộc lạm dụng trẻ em

Cựu vô địch snooker thế giới Graeme Dott vừa bị Liên đoàn Snooker Thế giới (WPBSA) đình chỉ thi đấu do vướng vào các cáo buộc nghiêm trọng liên quan đến hành vi lạm dụng tình dục trẻ em.
10/04/2025 17:00 0
HLV của ĐT Việt Nam sẽ sử dụng đội hình nào để đấu với MU?

Người hâm mộ đang nóng lòng chờ xem HLV Kim Sang Sik sẽ sử dụng những cái tên nào trong đội Ngôi sao Đông Nam Á (ASEAN All-Stars) đá giao hữu với MU vào ngày 28/5 tới.
10/04/2025 16:58 0
Quảng Nam: Quảng bá hình ảnh du lịch xanh, hiệu quả, bền vững

Sở Văn hóa, Thể thao và Du lịch tỉnh Quảng Nam tổ chức Hội nghị quảng bá, xúc tiến du lịch và giới thiệu chương trình ưu đãi thu hút khách du lịch đến Quảng Nam năm 2025.
10/04/2025 16:48 0
XSMB 10/4 - Kết quả Xổ số miền Bắc hôm nay 10/4/2025 - Kết quả XSMB thứ Năm ngày 10 tháng 4

XSMB 10/4: Kết quả Xổ số miền Bắc hôm nay thứ Năm ngày 10/4/2025 quay thưởng lúc 18h10 được trực tiếp cập nhật nhanh nhất, chính xác nhất trên Thethaovanhoa.vn.
10/04/2025 16:48 0
Tại sao HLV Kim Sang Sik được chọn dẫn dắt đội Ngôi sao Đông Nam Á đấu với MU?

HLV Kim Sang Sik vừa nhận vinh dự lớn khi được dẫn dắt đội ASEAN All-Stars thi đấu giao hữu cùng MU vào tháng 5 tới.
10/04/2025 16:36 0
XSMT 10/4 - Kết quả xổ số miền Trung hôm nay 10/4/2025 - Kết quả XSMT thứ Năm ngày 10 tháng 4

XSMT 10/4: Thethaovanhoa.vn cập nhật kết quả xổ số miền Trung hôm nay thứ Năm ngày 10/4/2025 gồm các tỉnh Bình Định, Quảng Trị và Quảng Bình.
10/04/2025 16:23 0
Raphinha sánh ngang kỷ lục của Lionel Messi

Trong chiến thắng ấn tượng 4-0 của Barcelona trước Borussia Dortmund tại lượt đi tứ kết Champions League, Raphinha không chỉ góp công lớn với một bàn thắng mà còn thiết lập một cột mốc ấn tượng trong lịch sử đội bóng xứ Catalunya.
10/04/2025 16:14 0
CHÍNH THỨC: Xem Hoàng Đức, Quang Hải, Tiến Linh đối đầu MU với giá chưa đến 300 nghìn

Giá vé cho trận đấu giao hữu đặc biệt giữa MU và đội Ngôi sao Đông Nam Á (ASEAN All-star) tại sân Bukit Jalil (Malaysia) vào ngày 28/5/2025 vừa chính thức được công bố.
10/04/2025 16:09 0
Thận trọng với chiêu trò lừa đảo qua cuộc gọi nháy máy

Các chuyên gia khuyến cáo rằng, nếu nhận được cuộc gọi từ một số điện thoại lạ, không rõ nguồn gốc hoặc không liên quan đến bất kỳ tổ chức nào mà bạn quen biết, hãy tuyệt đối không nhấc máy và không làm theo bất kỳ hướng dẫn nào.
10/04/2025 15:30 0
Những nội dung quan trọng tại Hội nghị lần thứ 11 Ban Chấp hành Trung ương Đảng khóa XIII

Sáng 10/4/2025, Hội nghị lần thứ 11 Ban Chấp hành Trung ương Đảng khóa XIII đã khai mạc trọng thể tại Thủ đô Hà Nội. Tại Hội nghị lần này, Trung ương thảo luận, cho ý kiến đối với 15 nội dung tập trung vào hai nhóm vấn đề chính.
10/04/2025 15:28 0
Raphinha xin lỗi đàn em vì 'cướp' bàn thắng ở trận Barcelona thắng Dortmund

Raphinha lên tiếng sau khi bị chê trách tham lam "cướp" bàn thắng của cầu thủ trẻ Pau Cubarsi ở lượt đi tứ kết Champions League, trận đấu Barca đánh bại Dortmund với tỷ số 4-0.
10/04/2025 15:28 0
Xem thêm ›