Jaringan di Era AI: Asal Usul Permintaan dan Arah Inovasi
Dengan munculnya model besar, posisi jaringan dalam infrastruktur AI semakin penting. Artikel ini akan membahas dari segi prinsip, mengapa jaringan menjadi bagian kunci di era AI, dan menganalisis tren inovasi dan peluang investasi di sisi jaringan di masa depan.
1. Sumber Permintaan Jaringan
Di era model besar, perbedaan antara ukuran model dan batasan kekuatan pemrosesan satu kartu cepat melebar, kluster server ganda menjadi solusi, yang membentuk dasar peningkatan pentingnya jaringan di era AI. Berbeda dengan masa lalu yang hanya digunakan untuk mentransfer data, kini jaringan lebih banyak digunakan untuk menyinkronkan parameter model antar kartu grafis, yang menuntut kepadatan dan kapasitas jaringan yang lebih tinggi.
Ukuran model yang semakin besar:
Waktu pelatihan = Skala data pelatihan x Jumlah parameter model / Kecepatan komputasi
Tingkat perhitungan = Tingkat perhitungan per perangkat x Jumlah perangkat x Efisiensi paralel multi-perangkat
Dalam mengejar data pelatihan dan parameter yang lebih besar, meningkatkan efisiensi komputasi menjadi kunci untuk memperpendek waktu pelatihan. Sementara itu, cara untuk memperluas "jumlah perangkat" dan meningkatkan "efisiensi paralel" secara langsung menentukan tingkat kekuatan komputasi.
Komunikasi kompleks dari sinkronisasi multi-kartu:
Dalam pelatihan model besar, setelah memisahkan model ke kartu tunggal, setiap kali perhitungan dilakukan, perlu dilakukan penyelarasan ( Reduce, Gather, dll ). Dalam primitif komunikasi NCCL Nvidia, All-to-All ( semua node saling mendapatkan nilai dan penyelarasan ) adalah operasi yang cukup umum, yang menuntut persyaratan lebih tinggi untuk transmisi dan pertukaran jaringan.
Biaya kerusakan yang semakin mahal:
Pelatihan model besar seringkali berlangsung selama berbulan-bulan, dan setelah terputus, perlu kembali ke titik putus sebelumnya untuk melanjutkan pelatihan. Kegagalan atau latensi tinggi di salah satu bagian jaringan dapat menyebabkan gangguan, yang mengakibatkan keterlambatan kemajuan dan peningkatan biaya. Jaringan AI modern telah berkembang menjadi sistem rekayasa yang kompleks, setara dengan pesawat terbang, kapal induk, dan sebagainya.
2. Arah Inovasi Jaringan
Dalam konteks ekspansi skala investasi komputasi, dan terus berkembangnya parameter model, "pengurangan biaya", "keterbukaan", dan keseimbangan skala komputasi menjadi topik utama inovasi jaringan.
Perubahan Media Komunikasi:
Cahaya, tembaga, dan silikon adalah tiga media utama untuk transmisi manusia. Di era AI, modul cahaya tidak hanya mengejar kecepatan yang lebih tinggi, tetapi juga mulai menjalani jalan pengurangan biaya seperti LPO, LRO, dan silikon cahaya. Kabel tembaga mendominasi koneksi di dalam rak berkat rasio biaya-efektivitas dan tingkat kegagalan yang rendah. Teknologi semikonduktor baru seperti Chiplet dan Wafer-scaling sedang mengeksplorasi batasan konektivitas berbasis silikon.
Persaingan Protokol Jaringan:
Protokol komunikasi antar chip dan keterikatan kuat pada kartu grafis, seperti NV-LINK dari Nvidia dan Infinity Fabric dari AMD, menentukan batas kemampuan dari satu server atau satu node komputasi, dan merupakan bidang persaingan sengit bagi para raksasa. Komunikasi antar node terutama bersaing di sekitar IB dan Ethernet.
Perubahan Arsitektur Jaringan:
Arsitektur jaringan antar node saat ini umumnya menggunakan arsitektur leaf-spine, yang memiliki karakteristik praktis, sederhana, dan stabil. Namun, seiring dengan meningkatnya jumlah node dalam satu cluster, arsitektur leaf-spine menjadi berlebihan dalam cluster super besar, menyebabkan biaya jaringan yang cukup tinggi. Arsitektur Dragonfly, arsitektur rail-only, dan solusi baru lainnya diharapkan menjadi arah evolusi untuk cluster super besar generasi berikutnya.
3. Saran Investasi
Sistem Komunikasi Inti:
Zhongji Xuchuang, Xinyi Sheng, Tianfu Communications, Industri Fulin, Yingweike, Hudian Co., Ltd.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
13 Suka
Hadiah
13
4
Bagikan
Komentar
0/400
GovernancePretender
· 3jam yang lalu
Jadi siapa yang memiliki kartu grafis terbesar, dia yang menang.
Lihat AsliBalas0
Blockblind
· 14jam yang lalu
Pembagian ini sangat detail Beli beli beli
Lihat AsliBalas0
SandwichVictim
· 14jam yang lalu
Organisasi lagi menggambar kue lagi ya
Lihat AsliBalas0
CryptoNomics
· 14jam yang lalu
*sigh* skala jaringan mengikuti kurva gompertz, model Anda mengabaikan batasan throughput yang kritis. biarkan saya menjalankan regresi cepat...
Permintaan jaringan meningkat pesat di era AI: Analisis tren inovasi dan peluang investasi
Jaringan di Era AI: Asal Usul Permintaan dan Arah Inovasi
Dengan munculnya model besar, posisi jaringan dalam infrastruktur AI semakin penting. Artikel ini akan membahas dari segi prinsip, mengapa jaringan menjadi bagian kunci di era AI, dan menganalisis tren inovasi dan peluang investasi di sisi jaringan di masa depan.
1. Sumber Permintaan Jaringan
Di era model besar, perbedaan antara ukuran model dan batasan kekuatan pemrosesan satu kartu cepat melebar, kluster server ganda menjadi solusi, yang membentuk dasar peningkatan pentingnya jaringan di era AI. Berbeda dengan masa lalu yang hanya digunakan untuk mentransfer data, kini jaringan lebih banyak digunakan untuk menyinkronkan parameter model antar kartu grafis, yang menuntut kepadatan dan kapasitas jaringan yang lebih tinggi.
Ukuran model yang semakin besar:
Dalam mengejar data pelatihan dan parameter yang lebih besar, meningkatkan efisiensi komputasi menjadi kunci untuk memperpendek waktu pelatihan. Sementara itu, cara untuk memperluas "jumlah perangkat" dan meningkatkan "efisiensi paralel" secara langsung menentukan tingkat kekuatan komputasi.
Komunikasi kompleks dari sinkronisasi multi-kartu: Dalam pelatihan model besar, setelah memisahkan model ke kartu tunggal, setiap kali perhitungan dilakukan, perlu dilakukan penyelarasan ( Reduce, Gather, dll ). Dalam primitif komunikasi NCCL Nvidia, All-to-All ( semua node saling mendapatkan nilai dan penyelarasan ) adalah operasi yang cukup umum, yang menuntut persyaratan lebih tinggi untuk transmisi dan pertukaran jaringan.
Biaya kerusakan yang semakin mahal: Pelatihan model besar seringkali berlangsung selama berbulan-bulan, dan setelah terputus, perlu kembali ke titik putus sebelumnya untuk melanjutkan pelatihan. Kegagalan atau latensi tinggi di salah satu bagian jaringan dapat menyebabkan gangguan, yang mengakibatkan keterlambatan kemajuan dan peningkatan biaya. Jaringan AI modern telah berkembang menjadi sistem rekayasa yang kompleks, setara dengan pesawat terbang, kapal induk, dan sebagainya.
2. Arah Inovasi Jaringan
Dalam konteks ekspansi skala investasi komputasi, dan terus berkembangnya parameter model, "pengurangan biaya", "keterbukaan", dan keseimbangan skala komputasi menjadi topik utama inovasi jaringan.
Perubahan Media Komunikasi: Cahaya, tembaga, dan silikon adalah tiga media utama untuk transmisi manusia. Di era AI, modul cahaya tidak hanya mengejar kecepatan yang lebih tinggi, tetapi juga mulai menjalani jalan pengurangan biaya seperti LPO, LRO, dan silikon cahaya. Kabel tembaga mendominasi koneksi di dalam rak berkat rasio biaya-efektivitas dan tingkat kegagalan yang rendah. Teknologi semikonduktor baru seperti Chiplet dan Wafer-scaling sedang mengeksplorasi batasan konektivitas berbasis silikon.
Persaingan Protokol Jaringan: Protokol komunikasi antar chip dan keterikatan kuat pada kartu grafis, seperti NV-LINK dari Nvidia dan Infinity Fabric dari AMD, menentukan batas kemampuan dari satu server atau satu node komputasi, dan merupakan bidang persaingan sengit bagi para raksasa. Komunikasi antar node terutama bersaing di sekitar IB dan Ethernet.
Perubahan Arsitektur Jaringan: Arsitektur jaringan antar node saat ini umumnya menggunakan arsitektur leaf-spine, yang memiliki karakteristik praktis, sederhana, dan stabil. Namun, seiring dengan meningkatnya jumlah node dalam satu cluster, arsitektur leaf-spine menjadi berlebihan dalam cluster super besar, menyebabkan biaya jaringan yang cukup tinggi. Arsitektur Dragonfly, arsitektur rail-only, dan solusi baru lainnya diharapkan menjadi arah evolusi untuk cluster super besar generasi berikutnya.
3. Saran Investasi
Sistem Komunikasi Inti: Zhongji Xuchuang, Xinyi Sheng, Tianfu Communications, Industri Fulin, Yingweike, Hudian Co., Ltd.
Inovasi Sistem Komunikasi: Changfei Fiber, Taicheng Light, Yuanjie Technology, Shengkete Communication-U, Hanwuji, Dekeli
4. Peringatan Risiko