Jednym z nawyków, które dał mi krypto, jest zwracanie uwagi na to, co system cicho zakłada, że pozostanie stabilne
Płynność
Walidatory
Przestrzeń blokowa
Interesujące awarie zazwyczaj zaczynają się, gdy jedna z tych założeń ulega zmianie
Zastanawiam się, czy AI ma swoją wersję tego
Zachowanie modelu
Większość ludzi postrzega nieskrępowane AI jako sposób na dyskusję o tematach, których inne modele odmawiają poruszenia
Kiedyś myślałem, że to jest interesująca część
Jako deweloper, to, co ciągle mnie niepokoi, to nie sama cenzura
To możliwość, że zgodność stała się niewidzialnym oprogramowaniem pośredniczącym między aplikacjami a modelami poniżej
Piszesz workflow
Testujesz polecenia
Wdrażasz agenta
A potem dostawca upstream dostosowuje politykę bezpieczeństwa
Endpoint pozostaje online
Opóźnienie wygląda normalnie
Nic nie wywołuje alertu
Ale agent ekstrakcji nagle klasyfikuje ten sam dokument inaczej, mimo że polecenie się nie zmieniło
Na małą skalę to irytujące
Powtarzasz testy
Życie toczy się dalej
To, co mniej mnie niepokoi, to co się stanie, gdy tysiące workflow odziedziczą tę samą zmianę zachowania
Im więcej autonomicznych systemów budujemy, tym mniej oczywiste zaczyna być poczucie odpowiedzialności za awarię
Dziś przyglądałem się infrastrukturze Prywatnego Czat @OpenGradient
Większość uwagi skupia się na Claude Fable 5
To, co przyciągnęło moją uwagę na dłużej, to Nous Hermes obok
Nie dlatego, że jest nieskrępowany
Ale dlatego, że usuwa jedną ruchomą część
Zachowanie nie jest już związane z dostawcą, który ciągle dostosowuje polityki upstream
Może za bardzo się nad tym zastanawiam
To, co wydaje się trudniejsze do zlekceważenia, to koszt koordynacji
Jeśli zachowanie modelu się zmienia, zespoły zależne od niego muszą ustalić, czy problem leży w ich kodzie, poleceniach, pipeline oceny, czy gdzieś poza ich kontrolą
Ten proces debugowania ma koszt, nawet gdy nic technicznie nie jest zepsute
Może to bliżej zarządzania
Lub zarządzania zależnościami
Szczerze nie jestem pewien
Ciągle wracam do pomysłu, że system może pozostać w pełni operacyjny, jednocześnie stając się coraz mniej przewidywalny
Im dłużej o tym myślę, tym trudniej powiedzieć, gdzie kończy się infrastruktura, a gdzie zaczyna model
#opg $OPG $RE $SYN