اشتعال المنافسة في الذكاء الاصطناعي، من يستطيع الفوز في "معركة المئة نموذج"؟
في الشهر الماضي، اندلعت "حرب الحيوانات" في مجال الذكاء الاصطناعي. من جهة، نموذج Llama الذي أطلقته Meta، ومن جهة أخرى، النموذج الكبير المسمى Falcon.
تحظى Llama بشعبية كبيرة بين المطورين بسبب خصائصها مفتوحة المصدر. بعد دراسة ورقة Llama المصدرية من قبل شركة NEC اليابانية، تم تطوير روبوت دردشة باللغة اليابانية بسرعة. بينما تم تطوير Falcon من قبل معهد الابتكار التكنولوجي في الإمارات العربية المتحدة، وقد تفوق في السابق على Llama في تصنيفات نماذج المصدر المفتوح.
حالياً، دخل مجال الذكاء الاصطناعي مرحلة "تسابق الفهود". الدول والشركات القوية تتسارع في بناء نماذجها اللغوية الكبيرة. فقط في منطقة الخليج، قامت المملكة العربية السعودية بشراء أكثر من 3000 شريحة H100 للجامعات المحلية للتدريب.
هذه الظاهرة "نموذج واحد لكل دولة" تثير التساؤل: كيف تحولت تقنية الذكاء الاصطناعي التي يُزعم أنها ذات عتبة عالية إلى "حرب النماذج"؟
خوارزمية Transformer تغير قواعد اللعبة
إن ظهور النماذج الكبيرة الحالية يعود الفضل فيه إلى الورقة البحثية التي نشرتها قوقل في عام 2017 بعنوان "الاهتمام هو كل ما تحتاجه". وقد أصبح خوارزمية Transformer التي اقترحتها هذه الورقة هي المفتاح لهذه الموجة الحالية من الذكاء الاصطناعي.
حل المحول مشكلة صعوبة فهم الشبكات العصبية المبكرة لسياق النصوص الطويلة. يعتمد على الترميز الموضعي بدلاً من التصميم التكراري، مما يحقق حساباً متوازياً ويزيد بشكل كبير من كفاءة التدريب. وقد أدى ذلك إلى انتقال الذكاء الاصطناعي من البحث النظري إلى الممارسة الهندسية، مما ساهم في ظهور عصر النماذج الكبيرة.
في عام 2019، طورت OpenAI نموذج GPT-2 بناءً على Transformer. بعد ذلك، أصدرت Google نموذج Meena الأكثر قوة، الذي يعتمد بشكل رئيسي على زيادة المعلمات والقدرة الحاسوبية. لقد صدم هذا الأسلوب "البنيوي العنيف" الأوساط الأكاديمية.
الآن، تباطأ معدل الابتكار في الخوارزميات الأساسية، وأصبح هندسة البيانات، وحجم الحوسبة، وعوامل الهندسة الأخرى هي العناصر الأساسية في المنافسة على الذكاء الاصطناعي. يمكن للشركات التكنولوجية ذات القدرة التقنية أن تطور نماذج كبيرة.
الدخول سهل والنجاح صعب
على الرغم من أن عتبة الدخول ليست عالية، إلا أنه ليس من السهل أن تصبح شركة رائدة في عصر الذكاء الاصطناعي. كمثال على ذلك، في صراع فالكون ولما، على الرغم من أن فالكون يحتل مرتبة أعلى، إلا أنه من الصعب أن يحدث تأثيرًا كبيرًا على ميتا.
بالنسبة للنماذج الكبيرة مفتوحة المصدر، فإن مجتمع المطورين النشط هو القوة التنافسية الأساسية. كانت ميتا قد وضعت مسار المصدر المفتوح في عام 2015، وهي تفهم جيدًا كيفية إدارة المجتمع. حاليًا، أصبحت سلسلة Llama بمثابة علامة الاتجاه للنماذج الكبيرة مفتوحة المصدر، حيث تم تطوير العديد من النماذج بناءً عليها.
من حيث الأداء، لا يزال لدى معظم LLM فجوة واضحة مع GPT-4. في اختبار AgentBench، حصل GPT-4 على 4.41 نقطة، مما يجعله يتفوق بفارق كبير، بينما حصل Claude على 2.77 نقطة فقط، والنماذج المفتوحة المصدر غالبًا ما تكون حوالي 1 نقطة.
إن الفريق العلمي المتميز في OpenAI والخبرة المتراكمة على مدى طويل هي التي تسببت في هذه الفجوة. وبالتالي، فإن الميزة الأساسية للنموذج الكبير تكمن في بناء النظام البيئي أو القدرة على الاستدلال البحت، وليس مجرد تراكم المعلمات.
توازن التكاليف والإيرادات مشكلة صعبة
تواجه مقدمو النماذج الكبيرة حالياً مشكلة عدم التوازن الشديد بين التكاليف والإيرادات. ويُقدَّر أن يصل إنفاق شركات التكنولوجيا العالمية على بنية تحتية للنماذج الكبيرة إلى 200 مليار دولار سنوياً، بينما قد تصل الإيرادات إلى 75 مليار دولار كحد أقصى، مما يؤدي إلى فجوة لا تقل عن 125 مليار دولار.
حتى مع الشركات الكبرى مثل مايكروسوفت وأدوبي، من الصعب تحقيق الربح من منتجات الذكاء الاصطناعي. على سبيل المثال، يتعين على GitHub Copilot دفع 20 دولارًا شهريًا لكل مستخدم، وحتى المستخدمين بكثافة يجعلون مايكروسوفت تخسر 80 دولارًا. بينما اضطرت أدوبي إلى إنشاء نظام نقاط لتقييد الاستخدام.
بالنسبة لمعظم النماذج الكبيرة التي تحتوي على عدد كبير من المعلمات، لا تزال السيناريوهات الرئيسية للتطبيق محدودة في الدردشة. مع تزايد حدة المنافسة المتماثلة وزيادة عدد النماذج مفتوحة المصدر، ستواجه شركات تقديم النماذج الكبيرة تحديات أكبر.
في المستقبل، قد لا تكون الشركات الذكية الحقيقية التي تبرز في مجال الذكاء الاصطناعي تعتمد على النموذج نفسه، بل على كيفية دمج الذكاء الاصطناعي بعمق مع سيناريوهات التطبيقات العملية، لخلق قيمة حقيقية للمستخدمين. تمامًا كما أن نجاح iPhone 4 لم يكن بسبب المعالج، بل بسبب النظام البيئي الغني للتطبيقات.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 13
أعجبني
13
3
مشاركة
تعليق
0/400
CommunityLurker
· منذ 15 س
نسخ الواجبات لا تحتاج إلى مال
شاهد النسخة الأصليةرد0
Web3ExplorerLin
· منذ 15 س
فرضية: هذه الدراما الذكية تشعر وكأنها حروب البلوكشين المبكرة... نفس الأجواء fr
تتزايد المنافسة في نماذج الذكاء الاصطناعي الكبيرة، وتقلل العوائق التكنولوجية، وتصبح الأرباح مشكلة.
اشتعال المنافسة في الذكاء الاصطناعي، من يستطيع الفوز في "معركة المئة نموذج"؟
في الشهر الماضي، اندلعت "حرب الحيوانات" في مجال الذكاء الاصطناعي. من جهة، نموذج Llama الذي أطلقته Meta، ومن جهة أخرى، النموذج الكبير المسمى Falcon.
تحظى Llama بشعبية كبيرة بين المطورين بسبب خصائصها مفتوحة المصدر. بعد دراسة ورقة Llama المصدرية من قبل شركة NEC اليابانية، تم تطوير روبوت دردشة باللغة اليابانية بسرعة. بينما تم تطوير Falcon من قبل معهد الابتكار التكنولوجي في الإمارات العربية المتحدة، وقد تفوق في السابق على Llama في تصنيفات نماذج المصدر المفتوح.
حالياً، دخل مجال الذكاء الاصطناعي مرحلة "تسابق الفهود". الدول والشركات القوية تتسارع في بناء نماذجها اللغوية الكبيرة. فقط في منطقة الخليج، قامت المملكة العربية السعودية بشراء أكثر من 3000 شريحة H100 للجامعات المحلية للتدريب.
هذه الظاهرة "نموذج واحد لكل دولة" تثير التساؤل: كيف تحولت تقنية الذكاء الاصطناعي التي يُزعم أنها ذات عتبة عالية إلى "حرب النماذج"؟
خوارزمية Transformer تغير قواعد اللعبة
إن ظهور النماذج الكبيرة الحالية يعود الفضل فيه إلى الورقة البحثية التي نشرتها قوقل في عام 2017 بعنوان "الاهتمام هو كل ما تحتاجه". وقد أصبح خوارزمية Transformer التي اقترحتها هذه الورقة هي المفتاح لهذه الموجة الحالية من الذكاء الاصطناعي.
حل المحول مشكلة صعوبة فهم الشبكات العصبية المبكرة لسياق النصوص الطويلة. يعتمد على الترميز الموضعي بدلاً من التصميم التكراري، مما يحقق حساباً متوازياً ويزيد بشكل كبير من كفاءة التدريب. وقد أدى ذلك إلى انتقال الذكاء الاصطناعي من البحث النظري إلى الممارسة الهندسية، مما ساهم في ظهور عصر النماذج الكبيرة.
في عام 2019، طورت OpenAI نموذج GPT-2 بناءً على Transformer. بعد ذلك، أصدرت Google نموذج Meena الأكثر قوة، الذي يعتمد بشكل رئيسي على زيادة المعلمات والقدرة الحاسوبية. لقد صدم هذا الأسلوب "البنيوي العنيف" الأوساط الأكاديمية.
الآن، تباطأ معدل الابتكار في الخوارزميات الأساسية، وأصبح هندسة البيانات، وحجم الحوسبة، وعوامل الهندسة الأخرى هي العناصر الأساسية في المنافسة على الذكاء الاصطناعي. يمكن للشركات التكنولوجية ذات القدرة التقنية أن تطور نماذج كبيرة.
الدخول سهل والنجاح صعب
على الرغم من أن عتبة الدخول ليست عالية، إلا أنه ليس من السهل أن تصبح شركة رائدة في عصر الذكاء الاصطناعي. كمثال على ذلك، في صراع فالكون ولما، على الرغم من أن فالكون يحتل مرتبة أعلى، إلا أنه من الصعب أن يحدث تأثيرًا كبيرًا على ميتا.
بالنسبة للنماذج الكبيرة مفتوحة المصدر، فإن مجتمع المطورين النشط هو القوة التنافسية الأساسية. كانت ميتا قد وضعت مسار المصدر المفتوح في عام 2015، وهي تفهم جيدًا كيفية إدارة المجتمع. حاليًا، أصبحت سلسلة Llama بمثابة علامة الاتجاه للنماذج الكبيرة مفتوحة المصدر، حيث تم تطوير العديد من النماذج بناءً عليها.
من حيث الأداء، لا يزال لدى معظم LLM فجوة واضحة مع GPT-4. في اختبار AgentBench، حصل GPT-4 على 4.41 نقطة، مما يجعله يتفوق بفارق كبير، بينما حصل Claude على 2.77 نقطة فقط، والنماذج المفتوحة المصدر غالبًا ما تكون حوالي 1 نقطة.
إن الفريق العلمي المتميز في OpenAI والخبرة المتراكمة على مدى طويل هي التي تسببت في هذه الفجوة. وبالتالي، فإن الميزة الأساسية للنموذج الكبير تكمن في بناء النظام البيئي أو القدرة على الاستدلال البحت، وليس مجرد تراكم المعلمات.
توازن التكاليف والإيرادات مشكلة صعبة
تواجه مقدمو النماذج الكبيرة حالياً مشكلة عدم التوازن الشديد بين التكاليف والإيرادات. ويُقدَّر أن يصل إنفاق شركات التكنولوجيا العالمية على بنية تحتية للنماذج الكبيرة إلى 200 مليار دولار سنوياً، بينما قد تصل الإيرادات إلى 75 مليار دولار كحد أقصى، مما يؤدي إلى فجوة لا تقل عن 125 مليار دولار.
حتى مع الشركات الكبرى مثل مايكروسوفت وأدوبي، من الصعب تحقيق الربح من منتجات الذكاء الاصطناعي. على سبيل المثال، يتعين على GitHub Copilot دفع 20 دولارًا شهريًا لكل مستخدم، وحتى المستخدمين بكثافة يجعلون مايكروسوفت تخسر 80 دولارًا. بينما اضطرت أدوبي إلى إنشاء نظام نقاط لتقييد الاستخدام.
بالنسبة لمعظم النماذج الكبيرة التي تحتوي على عدد كبير من المعلمات، لا تزال السيناريوهات الرئيسية للتطبيق محدودة في الدردشة. مع تزايد حدة المنافسة المتماثلة وزيادة عدد النماذج مفتوحة المصدر، ستواجه شركات تقديم النماذج الكبيرة تحديات أكبر.
في المستقبل، قد لا تكون الشركات الذكية الحقيقية التي تبرز في مجال الذكاء الاصطناعي تعتمد على النموذج نفسه، بل على كيفية دمج الذكاء الاصطناعي بعمق مع سيناريوهات التطبيقات العملية، لخلق قيمة حقيقية للمستخدمين. تمامًا كما أن نجاح iPhone 4 لم يكن بسبب المعالج، بل بسبب النظام البيئي الغني للتطبيقات.