Ми прискорили нові відкриті вагові моделі GPT певної AI компанії -- gpt-oss-20b та gpt-oss-120b -- для провідної продуктивності висновків на архітектурі NVIDIA Blackwell, забезпечуючи до 1.5 мільйона токенів на секунду на системі NVIDIA GB200 NVL72.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
9 лайків
Нагородити
9
7
Поділіться
Прокоментувати
0/400
HAWASX
· 5год тому
Покращення продуктивності настільки сильне, що швидкість випуску скамкойнів ось-ось злетить до місяця.
Переглянути оригіналвідповісти на0
MetadataExplorer
· 5год тому
英伟达 дивовижний呀
Переглянути оригіналвідповісти на0
BearMarketNoodler
· 5год тому
Продуктивність зросла настільки, що швидкість випуску скамкойнів має до місяця.
Переглянути оригіналвідповісти на0
Дізнатися більше
GateUser-43d6d1b5
· 5год тому
і чому gpt не підвищує вартість?
Переглянути оригіналвідповісти на0
MEVHunter
· 5год тому
ще одна розігнана відеокарта з'їдає прибутки... смх краще оптимізуй свій tx таймінг, бранець
Ми прискорили нові відкриті вагові моделі GPT певної AI компанії -- gpt-oss-20b та gpt-oss-120b -- для провідної продуктивності висновків на архітектурі NVIDIA Blackwell, забезпечуючи до 1.5 мільйона токенів на секунду на системі NVIDIA GB200 NVL72.
Технічне глибоке занурення в те, як ми