A DINO 1.5 modellek előrelépést hoznak a zero-shot AI objektumfelismerésben

2026. május 23. · MI Történik? · 2 perc olvasás

Az IDEA Research nemrégiben jelentette be a Grounding DINO 1.5 modellsorozatot, amely jelentős előrelépést jelent a zero-shot AI objektumfelismerés területén. Ez az új fejlesztés lehetővé teszi, hogy a mesterséges intelligencia előzetes, speciális tanítás nélkül is képes legyen pontosan azonosítani és felismerni különböző tárgyakat mind képeken, mind videókon. A két részből álló modellcsalád tagjai közül a Pro verzió a komplex, változatos szcenáriók kezelésére lett optimalizálva, míg az Edge változat kisebb teljesítményű eszközökön, például okostelefonokon is hatékonyan futtatható. A fejlesztés lényege, hogy a rendszer a korábban sosem látott tárgyakat is kiemelkedő pontossággal képes beazonosítani, ami nagyban leegyszerűsíti a vizuális felismerést igénylő feladatok automatizálását.

A technológia alapját a rendkívül széles körű tanítási folyamat biztosítja, ugyanis a modelleket több mint 20 millió, gondosan válogatott és részletesen feliratozott képen képezték ki. Ez a hatalmas adatmennyiség tette lehetővé a DINO 1.5 számára, hogy megbízhatóan értelmezze a valós világban előforduló tárgyakat, függetlenül azok környezetétől vagy megjelenési formájától. A tesztelések során a DINO 1.5 Pro kiemelkedő eredményeket produkált, hiszen a korábban sosem látott, teljesen ismeretlen tárgyak esetében is 55,7 százalékos pontossággal végzett helyes azonosítást, ami rekordnak számít a kategóriában. Ez a magas szintű általánosítási képesség kulcsfontosságú, hiszen a legtöbb hagyományos modellnek speciális adathalmazokra van szüksége a pontos működéshez.

A DINO 1.5 megjelenése azért is bír kiemelt jelentőséggel, mert közelebb visz minket a valóban hatékony és pontos AI objektumfelismerő rendszerek széles körű elterjedéséhez. A technológia alkalmazási területei rendkívül szerteágazóak: a megbízhatóbb robotika fejlesztésétől kezdve az önvezető járművek látásalapú navigációján át az automatizált megfigyelőrendszerekig számos iparág profitálhat belőle. Mivel a modellek kevesebb egyedi tanítást és kevesebb célzott adatot igényelnek az üzembe helyezéshez, jelentősen csökkenhet a fejlesztési idő és a költség, ami meggyorsíthatja az innovációs folyamatokat az AI-alapú látásérzékelés területén. A fejlesztők számára ez az új modellsorozat új távlatokat nyit, hiszen hatékonyabb és rugalmasabb eszközöket biztosít az összetett vizuális feladatok megoldásához.

A DINO 1.5 két modellből áll – a Pro a feladatok és szcenáriók széles skálájához készült, az Edge pedig okostelefonokon való futtatásra van optimalizálva.
A modelleket több mint 20 millió válogatott és feliratozott képen tanították, ami lehetővé teszi a valós világ tárgyainak megbízható felismerését.
A DINO 1.5 Pro rekordot döntő pontosságot ért el a tesztelés során: az általa korábban sosem látott tárgyakat az esetek 55,7%-ában helyesen azonosította.

Miért fontos?

A DINO 1.5 jelentős lépés az olyan AI objektumfelismerő rendszerek felé, amelyek elég pontosak és hatékonyak a való világbeli használathoz. Ezek a rendszerek megnyitják az utat a megbízhatóbb robotika, az önvezető járművek és az automatizált megfigyelés előtt, miközben kevesebb tanítási időt és adatot igényelnek. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Perplexity és a Harvard tanulmánya feltérképezi az összetett AI ágens alapú munka felé való eltolódást

2 napja

Az MIT tanulmánya azonosítja a legfőbb AI-kockázatokat és a felelős intézményeket

3 napja

Tanulmány: Az AI tutorok felülmúlják a jogi kart

2026. június 4.

Tudj meg többet

AI a kutatásban és oktatásban: Hatékony irodalomkutatás és forráselemzés

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?