Cạnh tranh giữa các mô hình AI lớn gia tăng, rào cản kỹ thuật Thả, vấn đề lợi nhuận trở nên khó khăn.

robot
Đang tạo bản tóm tắt

Cạnh tranh AI trở nên gay gắt, ai có thể chiến thắng trong "cuộc chiến trăm mô hình"?

Tháng trước, một cuộc "chiến tranh động vật" đã bùng nổ trong lĩnh vực AI. Một bên là mô hình Llama (lạc đà không bướu) do Meta phát hành, bên kia là mô hình lớn có tên là Falcon (chim ưng).

Llama được các nhà phát triển yêu thích nhờ vào tính chất mã nguồn mở của nó. Sau khi nghiên cứu bài báo và mã nguồn của Llama, công ty NEC của Nhật Bản đã nhanh chóng phát triển một phiên bản chatbot tiếng Nhật. Trong khi đó, Falcon được phát triển bởi Viện Nghiên cứu Đổi mới Công nghệ của Các Tiểu vương quốc Ả Rập Thống nhất, đã từng vượt qua Llama trên bảng xếp hạng mô hình mã nguồn mở.

Hiện tại, lĩnh vực AI đã bước vào giai đoạn "các anh hùng tranh tài". Các quốc gia và doanh nghiệp có sức mạnh đang khẩn trương phát triển các mô hình ngôn ngữ lớn của riêng họ. Chỉ riêng tại khu vực Vịnh, Ả Rập Xê Út đã mua hơn 3000 chip H100 cho các trường đại học trong nước để phục vụ cho việc huấn luyện.

Hiện tượng "một quốc gia một mô hình" này khiến người ta không khỏi thắc mắc: công nghệ AI được cho là có mức độ rào cản cao, làm sao lại phát triển thành "cuộc chiến trăm mô hình"?

Thuật toán Transformer thay đổi quy tắc trò chơi

Sự trỗi dậy của các mô hình lớn hiện nay đều nhờ vào bài báo "Attention Is All You Need" mà Google công bố vào năm 2017. Thuật toán Transformer được đề xuất trong bài báo này đã trở thành yếu tố then chốt cho cơn sốt AI lần này.

Transformer đã giải quyết vấn đề mà các mạng nơ-ron sớm khó hiểu ngữ cảnh của văn bản dài. Nó sử dụng mã hóa vị trí thay vì thiết kế tuần hoàn, thực hiện tính toán song song, nâng cao đáng kể hiệu quả đào tạo. Điều này đã đưa AI từ nghiên cứu lý thuyết sang thực tiễn kỹ thuật, thúc đẩy sự xuất hiện của thời đại mô hình lớn.

Năm 2019, OpenAI đã phát triển mô hình GPT-2 dựa trên Transformer. Sau đó, Google đã phát hành Meena với hiệu suất mạnh mẽ hơn, chủ yếu nhờ vào việc tăng cường số lượng tham số và sức mạnh tính toán. Cách tiếp cận "xây dựng bạo lực" này đã gây sốc cho giới học thuật.

Hiện nay, tốc độ đổi mới thuật toán cơ bản đã chậm lại, các yếu tố kỹ thuật như kỹ thuật dữ liệu, quy mô sức mạnh tính toán trở thành yếu tố then chốt trong cuộc đua AI. Các công ty công nghệ có một số năng lực kỹ thuật đều có thể phát triển các mô hình lớn.

Vào dễ, thành công khó

Mặc dù ngưỡng tham gia không cao, nhưng để trở thành doanh nghiệp hàng đầu trong thời đại AI không phải là dễ dàng. Lấy cuộc tranh giành giữa Falcon và Llama làm ví dụ, mặc dù Falcon đứng ở vị trí cao hơn, nhưng khó có thể gây ra ảnh hưởng thực sự đến Meta.

Đối với các mô hình lớn mã nguồn mở, cộng đồng nhà phát triển năng động chính là sức cạnh tranh cốt lõi. Meta đã xác lập con đường mã nguồn mở từ năm 2015 và rất am hiểu cách vận hành cộng đồng. Hiện tại, dòng Llama đã trở thành tiêu chuẩn cho các LLM mã nguồn mở, nhiều mô hình đã được phát triển dựa trên nó.

Về hiệu suất, hầu hết các LLM vẫn còn khoảng cách rõ rệt so với GPT-4. Trong bài kiểm tra AgentBench, GPT-4 dẫn đầu với 4.41 điểm, xếp thứ hai là Claude với 2.77 điểm, các mô hình mã nguồn mở thường chỉ đạt khoảng 1 điểm.

Nguyên nhân gây ra sự chênh lệch này là đội ngũ các nhà khoa học hàng đầu của OpenAI và kinh nghiệm tích lũy lâu dài. Do đó, lợi thế cốt lõi của các mô hình lớn nằm ở việc xây dựng hệ sinh thái hoặc khả năng suy luận thuần túy, chứ không phải chỉ đơn giản là tích lũy tham số.

Cân bằng chi phí và thu nhập trở thành vấn đề

Hiện tại, các nhà cung cấp mô hình lớn đang phải đối mặt với vấn đề mất cân bằng nghiêm trọng giữa chi phí và doanh thu. Theo ước tính, các công ty công nghệ toàn cầu sẽ chi tới 200 tỷ USD mỗi năm cho cơ sở hạ tầng mô hình lớn, nhưng doanh thu chỉ đạt tối đa 75 tỷ USD, có ít nhất 125 tỷ USD thiếu hụt.

Ngay cả những ông lớn như Microsoft, Adobe cũng khó có thể có lãi từ các sản phẩm AI. Chẳng hạn, GitHub Copilot lỗ 20 đô la mỗi tháng cho mỗi người dùng, trong khi người dùng nặng thậm chí khiến Microsoft thua lỗ 80 đô la. Adobe thì buộc phải thiết lập hệ thống điểm để hạn chế việc sử dụng.

Đối với các mô hình lớn chủ yếu được tích lũy nhiều tham số, các ứng dụng chính vẫn bị giới hạn trong việc trò chuyện. Khi sự cạnh tranh đồng nhất gia tăng và số lượng mô hình mã nguồn mở tăng lên, các nhà cung cấp mô hình lớn đơn thuần sẽ đối mặt với nhiều thách thức hơn.

Trong tương lai, những doanh nghiệp AI thực sự nổi bật có thể không phải ở chính mô hình, mà ở cách kết hợp sâu sắc AI với các tình huống ứng dụng thực tế, tạo ra giá trị thực sự cho người dùng. Giống như sự thành công của iPhone 4 không phải ở bộ xử lý, mà ở hệ sinh thái ứng dụng phong phú.

GPT5.91%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 3
  • Chia sẻ
Bình luận
0/400
CommunityLurkervip
· 8giờ trước
Chép bài không tốn tiền
Xem bản gốcTrả lời0
Web3ExplorerLinvip
· 8giờ trước
giả thuyết: bộ phim ai này cảm giác như những cuộc chiến blockchain đầu tiên... cùng một cảm giác fr
Xem bản gốcTrả lời0
GateUser-4745f9cevip
· 8giờ trước
Không phải là đã nội tâm hóa đến ai rồi sao?
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)