Model besar harus menjadi lebih pintar, harus bergantung pada manusia untuk mengajar dan mengelola—ini adalah Human-in-the-loop RL.
Saya baru-baru ini melakukan tugas di @JoinSapien, yaitu meninjau proses penalaran yang ditulis oleh AI:
🌱 Bagaimana AI berpikir? 🌱 Apakah itu logis? 🌱 Langkah mana yang mulai salah?
Tugas ini disebut evaluasi CoT (Chain-of-Thought), saya adalah auditor logikanya.
Selanjutnya, ada Tree of Thoughts (jalur penalaran berbentuk pohon), AI akan mencoba beberapa cabang ide, dan manusia akan menyaring jalur mana yang terbaik.
Sebenarnya, Anda bisa menganggapnya seolah-olah Anda sedang menjelaskan masalah kepada seorang anak, tetapi anak ini adalah otak masa depan tingkat GPT.
Pekerjaan ini, AI tidak bisa melakukannya sendiri, manusia harus terlibat.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Model besar harus menjadi lebih pintar, harus bergantung pada manusia untuk mengajar dan mengelola—ini adalah Human-in-the-loop RL.
Saya baru-baru ini melakukan tugas di @JoinSapien, yaitu meninjau proses penalaran yang ditulis oleh AI:
🌱 Bagaimana AI berpikir?
🌱 Apakah itu logis?
🌱 Langkah mana yang mulai salah?
Tugas ini disebut evaluasi CoT (Chain-of-Thought), saya adalah auditor logikanya.
Selanjutnya, ada Tree of Thoughts (jalur penalaran berbentuk pohon), AI akan mencoba beberapa cabang ide, dan manusia akan menyaring jalur mana yang terbaik.
Sebenarnya, Anda bisa menganggapnya seolah-olah Anda sedang menjelaskan masalah kepada seorang anak, tetapi anak ini adalah otak masa depan tingkat GPT.
Pekerjaan ini, AI tidak bisa melakukannya sendiri, manusia harus terlibat.
@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol