Rejtélyes gpt2-chatbot tűnt fel az LMSYS felületén, találgatásokat indítva egy OpenAI megjelenésről
Rejtélyes új mesterséges intelligencia modell bukkant fel az LMSYS Chatbot Arena nevű platformon, amely rövid idő alatt lázba hozta a technológiai közösséget és a kutatókat egyaránt. A gpt2-chatbot néven megjelent modell teljesítménye az első tesztek és felhasználói visszajelzések alapján nemcsak megközelíti, hanem egyes esetekben meg is haladja a jelenlegi iparági etalonnak számító GPT-4 képességeit. A modell forrása egyelőre hivatalosan ismeretlen, ám a válaszok stílusa és minősége miatt sokan az OpenAI titkos fejlesztésére gyanakszanak, amely szerintük egy új, még be nem jelentett generatív modell tesztelése lehet.
A közösségi média és az online szakmai fórumok, különösen a Twitter és a Reddit, az elmúlt napokban szinte forrtak a találgatásoktól. Az izgalmakat tovább fokozta az OpenAI vezérigazgatója, Sam Altman, aki a tőle megszokott sejtelmes stílusban reagált a pletykákra. Altman egy közösségi médiás bejegyzésében csupán annyit írt, hogy valahogy gyengéje a gpt2, ami sokak szerint nem más, mint egy huncut, mégis beszédes utalás arra, hogy valóban az ő cégük áll a háttérben. Ez a fajta kommunikáció gyakori az iparágban, ahol a cégek a hivatalos megjelenés előtt szívesen gerjesztenek organikus érdeklődést a termékeik iránt.
Az új modell képességeit több szakértő is méltatta, ami megalapozza a várakozásokat. Andrew Gao, a Stanford Egyetem AI-kutatója például arról számolt be, hogy a modell sikeresen megoldott egy rendkívül komplex nemzetközi matematikai diákolimpiai feladatot, ami komoly tesztje bármelyik jelenlegi LLM-nek. Hasonló véleményen volt Ethan Mollick, a Wharton professzora is, aki szintén elismerően nyilatkozott a modell teljesítményéről a GPT-4-hez való viszonyítás során. Ez a fajta technikai teljesítmény azt sugallja, hogy ha valóban egy új OpenAI modellről van szó, akkor az jelentős előrelépést jelenthet a logikai érvelés és a problémamegoldó képességek terén, amivel tovább szorosabbá válik a verseny a technológiai óriások között.
Az LMSYS Chatbot Arena, mint független összehasonlító felület, kulcsszerepet játszik az ilyen típusú, név nélküli modellek hitelesítésében. Mivel itt vaktesztek során, emberi visszajelzések alapján rangsorolják a megoldásokat, a gpt2-chatbot kiemelkedő szereplése nem a marketingnek, hanem a tiszta technikai teljesítménynek köszönhető. A technológiai közösség most feszült figyelemmel várja a hivatalos megerősítést, hiszen egy ilyen szintű új modell megjelenése alapjaiban rendezheti át az AI-piac erőviszonyait, és újabb lökést adhat a generatív modellek fejlődésének.
- Egy „gpt2-chatbot” nevű új AI modell tűnt fel az LMSYS Chatbot Arena-n, amely az AI modellek összehasonlításának népszerű oldala.
- Számos közösségi média fiók váratlanul kiemelkedő teljesítményről számolt be a modell kapcsán.
- Andrew Gao, a Stanford Egyetem hallgatója és AI kutatója azt állította, hogy a gpt-2 megoldott egy nemzetközi matematikai diákolimpiai feladatot.
- Ethan Mollick, a Wharton professzora hasonló véleményen volt a gpt-2 teljesítményéről a GPT-4-hez képest.
- --