Persaingan AI Memanas, Siapa yang Bisa Menang dalam "Pertarungan Seratus Model"?
Bulan lalu, terjadi "Perang Hewan" di bidang AI. Di satu sisi adalah model Llama (Llama) yang diluncurkan oleh Meta, di sisi lain adalah model besar bernama Falcon (Falcon).
Llama sangat populer di kalangan pengembang karena sifat sumber terbukanya. Setelah meneliti makalah dan kode sumber Llama, perusahaan Jepang NEC dengan cepat mengembangkan versi chatbot dalam bahasa Jepang. Sementara itu, Falcon dikembangkan oleh Institute of Technology Innovation di Uni Emirat Arab, dan pernah mengalahkan Llama di peringkat model sumber terbuka.
Saat ini, bidang AI telah memasuki tahap "pertempuran banyak raja". Negara-negara dan perusahaan-perusahaan yang kuat berlomba-lomba untuk mengembangkan model bahasa besar mereka sendiri. Hanya di kawasan Teluk, Arab Saudi telah membeli lebih dari 3000 chip H100 untuk pelatihan di universitas-universitas domestiknya.
Fenomena "satu negara satu model" ini membuat orang tidak bisa tidak bertanya: bagaimana teknologi AI yang diklaim memiliki hambatan tinggi, bisa berevolusi menjadi "pertempuran seratus model"?
Algoritma Transformer Mengubah Aturan Permainan
Kebangkitan berbagai model besar saat ini semua berkat makalah yang diterbitkan oleh Google pada tahun 2017 berjudul "Attention Is All You Need". Algoritma Transformer yang diusulkan dalam makalah tersebut menjadi kunci dari gelombang AI kali ini.
Transformer mengatasi masalah pemahaman konteks teks panjang yang sulit dipecahkan oleh jaringan saraf awal. Ini menggunakan pengkodean posisi sebagai pengganti desain berulang, memungkinkan perhitungan paralel, dan secara signifikan meningkatkan efisiensi pelatihan. Ini mengubah AI dari penelitian teoritis ke praktik rekayasa, mendorong datangnya era model besar.
Pada tahun 2019, OpenAI mengembangkan model GPT-2 berbasis Transformer. Kemudian, Google meluncurkan Meena yang memiliki performa lebih kuat, terutama dengan meningkatkan parameter dan kekuatan komputasi. Cara "penumpukan kekuatan" ini mengejutkan dunia akademis.
Saat ini, kecepatan inovasi algoritma dasar melambat, elemen-elemen teknik seperti rekayasa data dan skala komputasi menjadi kunci dalam kompetisi AI. Perusahaan teknologi yang memiliki kekuatan teknis tertentu dapat mengembangkan model besar.
Masuk mudah, sukses sulit
Meskipun ambang masuk tidak tinggi, menjadi perusahaan terdepan di era AI tidaklah mudah. Sebagai contoh, dalam persaingan antara Falcon dan Llama, meskipun Falcon memiliki peringkat yang lebih tinggi, namun sulit untuk memberikan dampak substansial pada Meta.
Untuk model besar sumber terbuka, komunitas pengembang yang aktif adalah kekuatan inti. Meta telah menetapkan jalur sumber terbuka sejak 2015, sangat memahami cara mengelola komunitas. Saat ini, seri Llama telah menjadi penanda arah untuk LLM sumber terbuka, banyak model yang dikembangkan berdasarkan itu.
Dalam hal kinerja, sebagian besar LLM masih memiliki perbedaan yang jelas dengan GPT-4. Dalam tes AgentBench, GPT-4 jauh unggul dengan skor 4,41, di posisi kedua Claude hanya 2,77, dan model sumber terbuka biasanya berada di sekitar 1.
Yang menyebabkan kesenjangan ini adalah tim ilmuwan terkemuka dari OpenAI dan pengalaman yang telah terakumulasi selama bertahun-tahun. Oleh karena itu, keuntungan inti dari model besar terletak pada pembangunan ekosistem atau kemampuan penalaran murni, bukan sekadar tumpukan parameter.
Ketidakseimbangan antara Biaya dan Pendapatan Menjadi Masalah
Saat ini, penyedia model besar umumnya menghadapi masalah ketidakseimbangan serius antara biaya dan pendapatan. Diperkirakan, perusahaan teknologi di seluruh dunia akan menghabiskan hingga 200 miliar dolar AS setiap tahun untuk infrastruktur model besar, tetapi pendapatan maksimal hanya 75 miliar dolar AS, sehingga terdapat celah setidaknya 125 miliar dolar AS.
Bahkan raksasa seperti Microsoft dan Adobe sulit untuk menghasilkan keuntungan dari produk AI. Misalnya, GitHub Copilot harus mengeluarkan biaya 20 dolar AS per pengguna per bulan, dan pengguna berat bahkan membuat Microsoft merugi 80 dolar AS. Adobe terpaksa menetapkan sistem poin untuk membatasi penggunaan.
Untuk sebagian besar model besar yang terakumulasi oleh parameter, skenario aplikasi utama masih terbatas pada percakapan. Dengan meningkatnya persaingan homogen dan semakin banyaknya model sumber terbuka, tantangan yang dihadapi oleh penyedia model besar murni akan semakin besar.
Di masa depan, perusahaan AI yang benar-benar menonjol mungkin tidak terletak pada model itu sendiri, tetapi pada bagaimana mengintegrasikan AI secara mendalam dengan skenario aplikasi nyata untuk menciptakan nilai nyata bagi pengguna. Seperti kesuksesan iPhone 4 yang tidak terletak pada prosesor, tetapi pada ekosistem aplikasi yang kaya.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
20 Suka
Hadiah
20
4
Posting ulang
Bagikan
Komentar
0/400
BakedCatFanboy
· 08-07 10:40
Memanggang AI agar lebih enak
Lihat AsliBalas0
CommunityLurker
· 08-04 20:44
Menyalin pekerjaan rumah tidak memerlukan biaya
Lihat AsliBalas0
Web3ExplorerLin
· 08-04 20:25
hipotesis: drama ai ini terasa seperti perang blockchain awal... nuansa yang sama fr
Lihat AsliBalas0
GateUser-4745f9ce
· 08-04 20:13
Bukankah ini sudah menjadi kompetisi di bidang AI?
Persaingan model AI besar semakin ketat, ambang teknologi menurun, dan profitabilitas menjadi masalah.
Persaingan AI Memanas, Siapa yang Bisa Menang dalam "Pertarungan Seratus Model"?
Bulan lalu, terjadi "Perang Hewan" di bidang AI. Di satu sisi adalah model Llama (Llama) yang diluncurkan oleh Meta, di sisi lain adalah model besar bernama Falcon (Falcon).
Llama sangat populer di kalangan pengembang karena sifat sumber terbukanya. Setelah meneliti makalah dan kode sumber Llama, perusahaan Jepang NEC dengan cepat mengembangkan versi chatbot dalam bahasa Jepang. Sementara itu, Falcon dikembangkan oleh Institute of Technology Innovation di Uni Emirat Arab, dan pernah mengalahkan Llama di peringkat model sumber terbuka.
Saat ini, bidang AI telah memasuki tahap "pertempuran banyak raja". Negara-negara dan perusahaan-perusahaan yang kuat berlomba-lomba untuk mengembangkan model bahasa besar mereka sendiri. Hanya di kawasan Teluk, Arab Saudi telah membeli lebih dari 3000 chip H100 untuk pelatihan di universitas-universitas domestiknya.
Fenomena "satu negara satu model" ini membuat orang tidak bisa tidak bertanya: bagaimana teknologi AI yang diklaim memiliki hambatan tinggi, bisa berevolusi menjadi "pertempuran seratus model"?
Algoritma Transformer Mengubah Aturan Permainan
Kebangkitan berbagai model besar saat ini semua berkat makalah yang diterbitkan oleh Google pada tahun 2017 berjudul "Attention Is All You Need". Algoritma Transformer yang diusulkan dalam makalah tersebut menjadi kunci dari gelombang AI kali ini.
Transformer mengatasi masalah pemahaman konteks teks panjang yang sulit dipecahkan oleh jaringan saraf awal. Ini menggunakan pengkodean posisi sebagai pengganti desain berulang, memungkinkan perhitungan paralel, dan secara signifikan meningkatkan efisiensi pelatihan. Ini mengubah AI dari penelitian teoritis ke praktik rekayasa, mendorong datangnya era model besar.
Pada tahun 2019, OpenAI mengembangkan model GPT-2 berbasis Transformer. Kemudian, Google meluncurkan Meena yang memiliki performa lebih kuat, terutama dengan meningkatkan parameter dan kekuatan komputasi. Cara "penumpukan kekuatan" ini mengejutkan dunia akademis.
Saat ini, kecepatan inovasi algoritma dasar melambat, elemen-elemen teknik seperti rekayasa data dan skala komputasi menjadi kunci dalam kompetisi AI. Perusahaan teknologi yang memiliki kekuatan teknis tertentu dapat mengembangkan model besar.
Masuk mudah, sukses sulit
Meskipun ambang masuk tidak tinggi, menjadi perusahaan terdepan di era AI tidaklah mudah. Sebagai contoh, dalam persaingan antara Falcon dan Llama, meskipun Falcon memiliki peringkat yang lebih tinggi, namun sulit untuk memberikan dampak substansial pada Meta.
Untuk model besar sumber terbuka, komunitas pengembang yang aktif adalah kekuatan inti. Meta telah menetapkan jalur sumber terbuka sejak 2015, sangat memahami cara mengelola komunitas. Saat ini, seri Llama telah menjadi penanda arah untuk LLM sumber terbuka, banyak model yang dikembangkan berdasarkan itu.
Dalam hal kinerja, sebagian besar LLM masih memiliki perbedaan yang jelas dengan GPT-4. Dalam tes AgentBench, GPT-4 jauh unggul dengan skor 4,41, di posisi kedua Claude hanya 2,77, dan model sumber terbuka biasanya berada di sekitar 1.
Yang menyebabkan kesenjangan ini adalah tim ilmuwan terkemuka dari OpenAI dan pengalaman yang telah terakumulasi selama bertahun-tahun. Oleh karena itu, keuntungan inti dari model besar terletak pada pembangunan ekosistem atau kemampuan penalaran murni, bukan sekadar tumpukan parameter.
Ketidakseimbangan antara Biaya dan Pendapatan Menjadi Masalah
Saat ini, penyedia model besar umumnya menghadapi masalah ketidakseimbangan serius antara biaya dan pendapatan. Diperkirakan, perusahaan teknologi di seluruh dunia akan menghabiskan hingga 200 miliar dolar AS setiap tahun untuk infrastruktur model besar, tetapi pendapatan maksimal hanya 75 miliar dolar AS, sehingga terdapat celah setidaknya 125 miliar dolar AS.
Bahkan raksasa seperti Microsoft dan Adobe sulit untuk menghasilkan keuntungan dari produk AI. Misalnya, GitHub Copilot harus mengeluarkan biaya 20 dolar AS per pengguna per bulan, dan pengguna berat bahkan membuat Microsoft merugi 80 dolar AS. Adobe terpaksa menetapkan sistem poin untuk membatasi penggunaan.
Untuk sebagian besar model besar yang terakumulasi oleh parameter, skenario aplikasi utama masih terbatas pada percakapan. Dengan meningkatnya persaingan homogen dan semakin banyaknya model sumber terbuka, tantangan yang dihadapi oleh penyedia model besar murni akan semakin besar.
Di masa depan, perusahaan AI yang benar-benar menonjol mungkin tidak terletak pada model itu sendiri, tetapi pada bagaimana mengintegrasikan AI secara mendalam dengan skenario aplikasi nyata untuk menciptakan nilai nyata bagi pengguna. Seperti kesuksesan iPhone 4 yang tidak terletak pada prosesor, tetapi pada ekosistem aplikasi yang kaya.