Je me suis heurté à la même limitation en testant des agents

Je me suis heurté à la même limitation en testant des agents IA : chaque session ressemblait à un nouveau départ.

Il y a quelques semaines, j'ai essayé un flux de travail sur OpenGradient où l'agent devait traiter une séquence de tâches liées sur plusieurs interactions. Rien de compliqué. Environ 15-20 étapes étalées sur plusieurs sessions. Ce qui m'a frappé, ce n'était pas la qualité du modèle. C'était le fait que l'agent pouvait se référer à l'état précédent sans que j'aie à reconstruire le contexte à chaque fois.

Ça semble mineur jusqu'à ce que vous le compariez à l'expérience habituelle.
Avec des systèmes sans état, je me suis retrouvé à coller les mêmes informations encore et encore. Une tâche qui aurait dû prendre 5 prompts en a fini par en prendre 12 parce que le modèle perdait sans cesse le fil des décisions prises plus tôt. La friction n'était pas l'intelligence. C'était la mémoire.

OpenGradient pousse dans une direction différente. Le réseau a déjà traité plus de 2 millions d'inférences, et ce qui est intéressant, c'est à quel point le design semble axé sur la préservation d'un état utile entre les actions plutôt que sur l'optimisation des réponses isolées.

La tension est que le fait d'avoir un état crée de nouvelles attentes.
Une fois qu'un agent se souvient des décisions précédentes, les utilisateurs cessent de le juger prompt par prompt. Ils commencent à juger la cohérence. Je me suis surpris à faire exactement cela. Après quelques interactions réussies, un seul détail oublié est devenu beaucoup plus agaçant qu'une réponse médiocre.
C'est probablement le vrai défi ici.

Faire en sorte qu'un système IA se souvienne est une chose.
Rendre cette mémoire assez fiable pour que les gens cessent d'y penser et s'attendent simplement à ce qu'elle soit là est une barre bien plus haute, et je ne suis pas sûr que quelqu'un ait totalement résolu cela encore.

@OpenGradient $OPG #OPG .