Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
Pour que les grands modèles deviennent intelligents, il faut que les humains enseignent et gèrent - c'est ce qu'on appelle le Human-in-the-loop RL.
Récemment, j'ai effectué une tâche sur @JoinSapien, qui consistait à examiner un processus de raisonnement écrit par une IA :
🌱 Comment l'IA pense-t-elle ?
🌱 Est-ce logique ?
🌱 À quel moment cela a-t-il commencé à dérailler ?
Cette tâche s'appelle évaluation CoT (Chain-of-Thought), je suis son auditeur logique.
En allant plus loin, il y a l'Arbre des Pensées, où l'IA essaiera plusieurs branches d'idées, et les humains sélectionneront le meilleur chemin.
En fait, vous pouvez considérer que vous parlez à un enfant, mais cet enfant a un cerveau futuriste de niveau GPT.
Ce travail, l'IA ne peut pas le faire seule, une personne doit participer.
@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol