2025-08-06 11:25:34

Pour que les grands modèles deviennent intelligents, il faut que les humains enseignent et gèrent - c'est ce qu'on appelle le Human-in-the-loop RL.

Récemment, j'ai effectué une tâche sur @JoinSapien, qui consistait à examiner un processus de raisonnement écrit par une IA :

🌱 Comment l'IA pense-t-elle ?
🌱 Est-ce logique ?
🌱 À quel moment cela a-t-il commencé à dérailler ?

Cette tâche s'appelle évaluation CoT (Chain-of-Thought), je suis son auditeur logique.

En allant plus loin, il y a l'Arbre des Pensées, où l'IA essaiera plusieurs branches d'idées, et les humains sélectionneront le meilleur chemin.

En fait, vous pouvez considérer que vous parlez à un enfant, mais cet enfant a un cerveau futuriste de niveau GPT.

Ce travail, l'IA ne peut pas le faire seule, une personne doit participer.

@JoinSapien #sapien @KaitoAI # KaitoAI #SapienProtocol

IN9.48%

TREE-2.03%

GPT-7.63%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

Récompense
J'aime
Commentaire
Partager

Commentaire

0/400

Aucun commentaire

Rubrique
#Gate & WLFI USD1 Points Program
6373 Popularité
#Show My Alpha Points
66240 Popularité
#ETH Whales Accumulate
12636 Popularité
#SOL Futures Reach New High
21061 Popularité
#ETH ETF Sees 12 Weeks of Inflows
6394 Popularité

Épingler