Projekt #Mira sprawdza odpowiedzi przekazane mu przez inne AI. To jasne, że wiele innych AI decyduje, czy odpowiedź jest poprawna, czy nie.
To znaczy, jeśli większość z oceniających AI zdecyduje, że odpowiedź jest poprawna, to ją akceptują, a jeśli uznają, że odpowiedź jest błędna, to ją odrzucają.
Tylko to jest proste, gdy AI opiera się na danych historycznych i wszystko to bierze z internetu, a jeśli będzie błąd w internecie, to wszystkie oceniające AI uznają odpowiedź za prawdziwą. Jeszcze trudność polega na sprawdzeniu potrzebnego faktu z tekstu, nawet w jednym zdaniu może być 6-7 faktów, które trzeba zweryfikować, a jeśli tekst jest duży, 7000-10000 słów, to faktów jest wiele i ich weryfikacja może być długa i kosztowna.
A potem jest jeszcze trudniej, biorąc pod uwagę: turystykę, medycynę, naukę.
Jeśli chodzi o przykład z turystyką, to jeszcze nie jest tak skomplikowane, AI może korzystać ze źródeł w Internecie, takich jak pogoda, opinie innych podróżników, przepływy turystów, i tak dalej.
W medycynie wszystko jest bardziej skomplikowane
Weryfikacja odbywa się poprzez bazy publikacji naukowych i notatek, a także badania kliniczne i badania medyczne.
Często nie ma tego wszystkiego w otwartym dostępie, szczególnie jeśli preparaty są eksperymentalne lub tajne.
Tutaj już decyduje lekarz, czy przepisać ten lek pacjentowi, czy nie. Niech nawet AI odpowiedziało, że lek pomoże w tej lub innej chorobie.
A w nauce jest jeszcze trudniej, ponieważ AI może wydać tylko hipotezę, która nie jest w żaden sposób weryfikowana.
Ponieważ potrzebne są eksperymenty, dane z laboratorium, powtarzalność wyników.
Dlatego nawet jeśli system taki jak $MIRA będzie działać dobrze, częściej będzie mówić:
Prawdopodobnie prawda, lub niewystarczające dane, lub wątpliwe.
A nie po prostu ~"prawda"/"fałsz".
Ale to właśnie z powodu tego problemu rynek projektów takich jak Mira może stać się ogromny.
Swoją drogą, podejście projektu Mira polega na weryfikacji odpowiedzi AI przez wiele innych AI
i dzielenie odpowiedzi na kilka twierdzeń przed weryfikacją zmniejsza błędy AI
Na 90% i jak na razie to najlepszy wynik. W porównaniu do innych projektów, które wykorzystują AI.

