Конкуренция в области больших моделей ИИ усиливается, технологические барьеры падают, а получение прибыли становится проблемой.

robot
Генерация тезисов в процессе

Конкуренция в области ИИ накаляется, кто сможет победить в "битве ста моделей"?

В прошлом месяце в области ИИ разразилась "война животных". С одной стороны, модель Llama (ламантин), представленная компанией Meta, а с другой стороны — большая модель под названием Falcon (сокол).

Llama пользуется большой популярностью среди разработчиков благодаря своей открытой природе. Японская компания NEC быстро разработала японскую версию чат-бота после изучения статьи и исходного кода Llama. В то время как Falcon был разработан Институтом научных инноваций ОАЭ и ранее обошел Llama в рейтинге открытых моделей.

В настоящее время область ИИ вошла в стадию "борьбы за господство". Мощные страны и компании активно разрабатывают свои собственные крупные языковые модели. Только в регионе Персидского залива Саудовская Аравия приобрела более 3000 чипов H100 для обучения для своих университетов.

Такое явление, как "одна страна - одна модель", вызывает недоумение: как высокие барьеры входа в AI-технологии превратились в "битву ста моделей"?

Алгоритм Transformer меняет правила игры

Возрождение различных крупных моделей в настоящее время стало возможным благодаря статье Google 2017 года «Внимание — это всё, что вам нужно». Алгоритм Transformer, представленный в этой статье, стал ключевым в текущем буме ИИ.

Трансформер решил проблему понимания длинного контекста текста ранними нейронными сетями. Он использует позиционное кодирование вместо циклической структуры, что позволяет осуществлять параллельные вычисления и значительно повышает эффективность обучения. Это перевело ИИ из теоретических исследований в инженерную практику и способствовало приходу эпохи больших моделей.

В 2019 году OpenAI разработала модель GPT-2 на основе Transformer. Затем Google выпустила более мощную Meena, в основном полагаясь на увеличение параметров и вычислительной мощности. Этот способ "агрессивного наращивания" шокировал академическое сообщество.

В настоящее время скорость инноваций в базовых алгоритмах замедляется, а такие инженерные факторы, как инженерия данных и масштаб вычислительной мощности, становятся ключевыми в соревновании ИИ. Технологические компании с определенной технической мощью могут разрабатывать крупные модели.

Войти легко, добиться успеха трудно

Хотя барьер для входа невысок, стать ведущей компанией в эпоху ИИ не так просто. На примере противостояния Falcon и Llama, хотя Falcon занимает более высокое место, ему трудно нанести значительный удар по Meta.

Для открытых больших моделей активное сообщество разработчиков является ключевым конкурентным преимуществом. Meta еще в 2015 году утвердила путь открытого исходного кода и хорошо понимает, как управлять сообществом. В настоящее время серия Llama стала маркером открытых LLM, многие модели разрабатываются на ее основе.

По показателям производительности большинство LLM все еще значительно отстают от GPT-4. В тесте AgentBench GPT-4 набрал 4,41 балла, опережая второго участника Claude, который набрал лишь 2,77 балла, а открытые модели часто находятся около 1 балла.

Причиной этой разницы является команда ведущих ученых OpenAI и накопленный за долгие годы опыт. Таким образом, основное преимущество больших моделей заключается в экосистемной строительстве или чисто выводной способности, а не в простом накоплении параметров.

Проблема несоответствия затрат и доходов

В настоящее время поставщики больших моделей в целом сталкиваются с серьезным дисбалансом между затратами и доходами. По оценкам, глобальные технологические компании ежегодно будут тратить 200 миллиардов долларов на инфраструктуру больших моделей, но доход составит максимум 75 миллиардов долларов, что означает разрыв как минимум в 125 миллиардов долларов.

Даже такие гиганты, как Microsoft и Adobe, испытывают трудности с получением прибыли от продуктов ИИ. Например, GitHub Copilot теряет 20 долларов на каждого пользователя в месяц, а активные пользователи даже приводят к убыткам Microsoft в 80 долларов. Adobe пришлось ввести систему баллов для ограничения использования.

Для большинства крупных моделей с большим количеством параметров основные сферы применения все еще ограничены чатами. С увеличением однородной конкуренции и ростом числа открытых моделей вызовы, с которыми сталкиваются чисто поставщики крупных моделей, будут еще более значительными.

В будущем настоящие компании в сфере ИИ, возможно, будут выделяться не благодаря самим моделям, а благодаря тому, как они глубоко интегрируют ИИ в реальные сценарии применения, создавая истинную ценность для пользователей. Как и успех iPhone 4, который заключался не в процессоре, а в богатой экосистеме приложений.

GPT-9.72%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 3
  • Поделиться
комментарий
0/400
CommunityLurkervip
· 21ч назад
Копировать домашнее задание бесплатно
Посмотреть ОригиналОтветить0
Web3ExplorerLinvip
· 21ч назад
гипотеза: эта драма с искусственным интеллектом ощущается как ранние войны блокчейна... такие же вибрации, fr
Посмотреть ОригиналОтветить0
GateUser-4745f9cevip
· 21ч назад
Разве это не внутренний конфликт, который вызван приходом ИИ?
Посмотреть ОригиналОтветить0
  • Закрепить