AI-modellek a Pictionary játékkal mérik össze problémamegoldó képességeiket

2026. május 24. · MI Történik? · 2 perc olvasás

Új és rendkívül kreatív megközelítést alkalmazott egy fejlesztő a mesterséges intelligencia modellek képességeinek tesztelésére: a népszerű Pictionary, azaz a klasszikus rajzolós-tippelős társasjáték segítségével méri össze az LLM-ek problémamegoldó és együttműködési készségeit. A módszer lényege, hogy két teljesen különálló AI-modell játszik egymással egy zárt rendszerben, ahol az egyik feladata egy adott szó vagy fogalom vizuális megjelenítése, míg a másiknak ki kell találnia, mit ábrázol a skicc. Ez a formabontó kísérlet nem csupán egy szórakoztató digitális időtöltés, hanem egy kifejezetten komoly tesztelési folyamat, amely új megvilágításba helyezi a nagy nyelvi modellek közötti közvetlen interakciókat és azok határait.

A projekt gerincét egy olyan szoros együttműködésen alapuló játékmenet alkotja, amelyben a két különálló AI-modellnek teljesen eltérő szerepkörökben és kognitív feladatokban kell helytállnia. Az alkotó szerepben lévő modellnek komoly absztrakciós készségre van szüksége, hiszen a kapott kifejezést értelmezve digitális vonalakká kell alakítania a gondolatait, vagyis a gyakorlatban a rajzkészségét teszi próbára a rendszer. A folyamat másik oldalán helyet foglaló partner AI ezzel szemben a fejlett vizuális felismerő képességére hagyatkozik, amikor elemzi a vonásokat és megpróbálja pontosan megfejteni az elkészült ábrát. A játék sikere így kizárólag azon múlik, hogy a két különböző rendszer mennyire képes összehangoltan működni.

Ez a kísérleti környezet kiválóan alkalmas arra, hogy egy teljesen újfajta benchmarkként szolgáljon a komplex multi-modal érvelés és a gyakorlati problémamegoldás mérésére. A hagyományos, statikus szöveges teszteken túlmenően a Pictionary-szerű helyzetek rákényszerítik az érintett AI-modelleket, hogy átlépjék a tiszta szöveges kommunikáció korlátait, és olyan összetettebb feladatokat oldjanak meg, amelyek egyszerre igényelnek képi logikát és kontextuális megértést. A fejlesztő által kidolgozott egyedi módszer így egy izgalmas, új dimenziót nyit meg az LLM-ek képességeinek kiértékelésében. Világosan rávilágít arra, hogy a modern mesterséges intelligencia rendszerek mennyire képesek a valós időben történő, dinamikus és kreatív együttműködésre, valamint a több modalitást érintő, összetett problémák hatékony leküzdésére.

Együttműködésen alapuló játék két különálló AI-modell között
Teszteli az egyik modell rajzkészségét és a másik vizuális felismerő képességét
Benchmarkként szolgál a multi-modal érveléshez és problémamegoldáshoz
--

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az OpenAI nonprofit szervezeteknek és időseknek szóló forrásokkal bővíti az AI Akadémiát

2026. május 25.

A Trump-adminisztráció elhalasztja a TikTok betiltását, miközben az AppLovin felvásárlási ajánlatot tett

2026. május 25.

A Google elérhetővé tette a Gemini 2.5 Pro-t az API-n keresztül a fejlesztők számára

2026. május 25.

Tudj meg többet

Gemini vs. ChatGPT 2026: Őszinte összehasonlítás magyar szemmel