Zwykłe testy często oceniają AI na podstawie jednoznacznego zadania. Pytanie, odpowiedź, wynik. To czyste, szybkie i uspokajające. Ale ten format mówi prawie nic o tym, co się dzieje po kilku dniach ciągłej akcji. Ten limit staje się jeszcze bardziej wrażliwy przy autonomicznych agentach AI narażonych na złożone pułapki, zwłaszcza gdy mają narzędzia, pamięć i trwałe cele.

Emergence AI umieściło zatem agentów w trwałych środowiskach. Mogli współpracować, głosować, używać narzędzi, poruszać się po wirtualnych miastach i podejmować decyzje zgodnie z zasadami społecznymi. Ta sytuacja wygląda mniej jak egzamin, a bardziej jak małe sztuczne społeczeństwo.

Deweloperzy będą musieli testować agentów przez dłuższy czas. Nie tylko przez kilka minut. Będą musieli obserwować ich interakcje, pamięć, powtarzające się decyzje i reakcję na konflikty. W przeciwnym razie, czyste AI będą walidowane w laboratoriach, ale będą kruche na otwartym rynku.

Rozwiązanie polega zatem nie na blokowaniu agentów AI. Chodzi o ograniczenie ich uprawnień, śledzenie ich działań, wprowadzanie progów stop-loss oraz audytowanie środowisk, w których się rozwijają. To wymaganie staje się pilne, gdy agenci AI zbliżają się do płatności kryptowalutowych i stablecoinów. Autonomiczna AI musi pozostawać użyteczna. Ale nigdy nie może stać się czarną skrzynką z kluczami w rękach.

Maksymalizuj swoje doświadczenia z Cointribune dzięki naszemu programowi "Czytaj, aby zarabiać"! Za każdy przeczytany artykuł zdobywaj punkty i uzyskaj dostęp do ekskluzywnych nagród. Zarejestruj się teraz i zacznij zdobywać korzyści.

$RSR

$YGG

$XRP