Az MIT kutatói kifejlesztették a COCO-Periph-et az AI perifériás látásának javítására

2026. május 22. · MI Történik? · 2 perc olvasás

Az MIT kutatói jelentős áttörést értek el a mesterséges intelligencia látásának fejlesztésében azzal, hogy létrehozták a COCO-Periph nevű új képadatkészletet. Ez a fejlesztés lehetővé teszi az AI modellek számára, hogy a vizuális információkat az emberi szem működéséhez sokkal hasonlóbb módon dolgozzák fel, különös tekintettel a perifériás látásra. A kutatás célja, hogy áthidalja azt a szakadékot, amely jelenleg a számítógépes látás és az emberi vizuális észlelés között húzódik, mivel a hagyományos modellek gyakran nehezen boldogulnak azzal, amikor a fontos információk a kép fókuszpontján kívül esnek.

A COCO-Periph adatbázis különlegessége abban rejlik, hogy célzottan módosítja a képeket annak érdekében, hogy szimulálja azt a természetes részletvesztést, amely az emberi látómező szélein, a látószög különböző fokainál jelentkezik. A kutatócsoport alapos tesztelésnek vetette alá az új rendszert, amely során emberi alanyok és különböző AI objektumfelismerő modellek teljesítményét hasonlították össze. Az eredmények rávilágítottak arra a technológiai hiányosságra, hogy míg az AI teljesítménye drasztikusan romlott, ahogy a vizsgált objektum távolabb került a látómező központjától, addig az embereknél ez a csökkenés sokkal fokozatosabb és kontrolláltabb volt. A vizsgálatok során bebizonyosodott, hogy ha az AI modelleket a COCO-Periph segítségével tanítják, jelentősen javítható a teljesítményük a perifériás tartományokban, ami közelebb viszi a rendszereket az emberi szintű észleléshez.

Ez az előrelépés azért bír kiemelt jelentőséggel, mert a jövő technológiái számára elengedhetetlen, hogy a gépek a miénkhez hasonló módon érzékeljék a környezetüket. Különösen igaz ez a kritikus rendszerekre, például az önvezető járművek biztonsági funkcióira, amelyek folyamatosan az emberi észlelés előrejelzésére építenek. Amennyiben egy AI rendszer képes pontosan észlelni a periférián megjelenő mozgásokat vagy akadályokat, sokkal megbízhatóbb döntéseket hozhat összetett, valós idejű közlekedési szituációkban. A COCO-Periph által kínált módszertan nem csupán az algoritmusok pontosságát növeli, hanem egy lépéssel közelebb visz minket ahhoz, hogy a mesterséges intelligencia valóban képes legyen biztonságosan és hatékonyan együttműködni az emberekkel a mindennapi életben.

A COCO-Periph úgy módosítja a képeket, hogy rögzítse a részletvesztést, amely a látószög különböző fokainál jelentkezik.
A csapat emberi alanyokon és AI objektumfelismerő modelleken is tesztelte a képeket, hogy összehasonlítsák a perifériás látást.
Az AI teljesítménye romlott, ahogy a célobjektum távolabb került a fókusztól, míg az embereknél a csökkenés fokozatosabb volt.
A COCO-Periph-en végzett tanítás csökkentette a szakadékot az emberi szintű teljesítményhez képest.

Miért fontos?

Az olyan kutatások, mint a COCO-Periph, segítenek a technológiát ahhoz igazítani, ahogyan mi, emberek természetes módon befogadjuk és feldolgozzuk a vizuális információkat – ez fontos képesség az olyan rendszerek számára, mint a vezetőbiztonsági funkciók, amelyek az emberi észlelés előrejelzésére építenek.

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Autoresearch ágens demonstrálta a rekurzív önfejlesztést

13 órája

Építsen kódolás nélküli hangügynököt ügyfélfelvételhez a Grok segítségével

19 órája

Az Anthropic kutatása szerint Claude személyisége nyelvenként változik

tegnap

Tudj meg többet

AI a kutatásban és oktatásban: Hatékony irodalomkutatás és forráselemzés