AI HÍREK
Az xAI bemutatja a Grok 4.20-at, amely négy együttműködő vitázó ágenst tartalmaz
Tudják, hogy a legjobb döntések általában akkor születnek, amikor okos emberek vitatkoznak egymással? Elon Musk xAI-ja pontosan ezt építette be egy AI-ba.
A Grok 4.20 hétfőn jelent meg, és egy alapjaiban eltérő architektúrával működik. Ahelyett, hogy egyetlen AI generálná a választ, négy specializált ágens dolgozik egyszerre: valós időben vitatkoznak egymással, majd átadják a konszenzusos eredményt.
Ezért fontos ez valójában: a hallucinációk száma 65%-kal csökkent a korai tesztek során. Amikor az egyik ágens magabiztosan mond valami hibásat, egy másik ágens elkapja a hibát, még mielőtt a felhasználó látná a kimenetet. Ez egyfajta szakmai lektorálás (peer review) gépi sebességgel.
Az eredmények a gyakorlatban is meggyőzőek. Egy élő tőzsdei kereskedési versenyen (Alpha Arena Season 1.5) a Grok 4.20 volt az egyetlen nyereséges AI modell, amely 10 ezer dollárból ~11-13,5 ezer dollárt csinált, miközben az OpenAI és a Google riválisai veszteséggel zártak. Az első hat helyezettből négy a Grok 4.20 variánsa volt.
Egy megjegyzés: ez még csak a beta fázis. Az xAI szerint a jelenlegi verzió csupán a „kicsi”, 500 milliárd paraméteres foundation model; a teljes verzió tanítása még tart. Elon Musk a szokásához híven mindenféle hivatalos bejelentés vagy benchmark nélkül dobta be a megjelenést az X-en. Ezért is tartott ilyen sokáig, mire írtunk róla: ez nem volt egy VALÓDI, teljes körű termékbevezetés.
A legérdekesebb rész? Ingyenes fiókokkal is elérhető. Most is ellátogathat a grok.x.ai oldalra, kérdezhet valami összetettet, és egy élő felületen keresztül nézheti, ahogy a négy ágens valós időben gondolkodik. A fizetős csomagok (havi 30 dolláros SuperGrok) gyorsabb válaszokat és hozzáférést kapnak egy „Heavy” módhoz, amely 16 ágensre skálázódik a kutatási szintű problémák megoldásához.
- Grok (a koordinátor): Lebontja a kérdést, feladatokat oszt ki, feloldja az ellentéteket, és átadja a végső választ.
- Harper (a kutató): Valós idejű adatokat hív le az internetről és az X napi kb. 68 millió angol nyelvű bejegyzéséből az azonnali tényellenőrzéshez.
- Benjamin (a logikus): Kezeli a matematikát, a kódot, a lépésről lépésre történő érvelést, és teszteli a logikai felépítést.
- Lucas (a kreatív): Alternatív szempontokat kutat fel, átírja a szöveget a jobb érthetőség érdekében, és rendhagyó ötleteket ad hozzá.
- Hallucináció-csökkentés: A korai tesztek 65%-os visszaesést mutattak a hallucinációk terén a többágenses konszenzusos rendszernek köszönhetően.
- Teljesítmény: Az egyetlen nyereséges modell az Alpha Arena Season 1.5 tőzsdei kereskedési versenyen.
- Többszempontú feladatok: Képes érveket és ellenérveket felsorakoztatni összetett témákban úgy, hogy hagyja az ágenseket vitatkozni a szintézis előtt.
- Heavy mód: Egy fizetős verzió, amely a rendszert 16 specializált ágensre skálázza fel az összetett kutatási feladatokhoz.
Miért fontos?
Ez egy jelentős architekturális váltásnak tűnik. Míg minden más nagy laboratórium továbbra is egyetlen modellen alapuló következtetést (inference) alkalmaz, az xAI arra fogad, hogy a jövő a modellcsapatoké, amelyek vitákon keresztül jutnak el a jobb eredményekig. Ha a teljes méretű Grok 4.20 beváltja az ígéretét a tanítás befejezése után, a többi labornak el kell döntenie, hogy követik-e ezt az utat.