MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Twelve Labs elindította a Pegasus-1 modellt a fejlett videóértelmezéshez

A mesterséges intelligencia világa újabb mérföldkőhöz érkezett, miután a Twelve Labs hivatalosan is elindította a legújabb, Pegasus-1 elnevezésű modelljét a fejlett videóértelmezéshez. Miközben a jelenlegi AI technológiák már kiválóan boldogulnak a különböző szövegek, PDF dokumentumok, statikus képek és összetett táblázatok értelmezésével, a videós tartalmak mélyebb feldolgozása eddig komoly kihívást jelentett. A Twelve Labs fejlesztése azonban gyökeres változást hoz ezen a téren, hiszen a Pegasus-1 képes kifejezetten a videók kontextusát és tartalmát értelmezni. A startup a technológia iránt mélyebben érdeklődők számára egy részletes technikai jelentést is közzétett a modell működéséről.

A gyakorlatban ez azt jelenti, hogy a Pegasus-1 képes ténylegesen végignézni egy videós anyagot, majd pontosan elmesélni a felhasználónak, hogy mi történt a felvételen. A modell sokoldalúságát jól mutatja, hogy akár egy népszerű Mr. Beast videót is feltölthetünk a rendszerbe, hogy aztán részletes kérdéseket tegyünk fel róla az AI-nak. A rendszer képes elemezni, hogy a szereplők arckifejezései és a környezetben található kellékek miként járultak hozzá a tartalom alakulásához. Ez a fejlett videóértelmezés nemcsak a szórakoztató tartalmaknál működik, hanem segítségével bármilyen YouTube, TikTok vagy hagyományos biztonsági kamerafelvétel gyorsan és hatékonyan összefoglalhatóvá válik.

A technológia gyakorlati alkalmazási lehetőségei rendkívül széles körűek, és több iparágat is forradalmasíthatnak. Az egyik legfontosabb terület a tartalommoderálás, ahol a Pegasus-1 képes automatikusan megjelölni a kérdéses felvételeket a videókban szereplő elemek, például lőfegyverek alapján. Emellett a kereskedelemben és a marketingben is komoly hasznot hajthat a termékek automatikus megjelölésével és címkézésével a promóciós videókban. Nem elhanyagolható a munkahelyi biztonság kérdése sem: az ipari környezetben, például gyárakban üzemeltetett kamerák képeit elemezve a modell folyamatosan nyomon tudja követni a biztonsági előírások és a megfelelőség betartását.

A Pegasus-1 megjelenése azért kiemelten fontos, mert egy teljesen új alkalmazási kategóriát teremt meg a piacon. Eddig a robotok és a különböző automatizált rendszerek a mozgóképek terén gyakorlatilag vakok voltak, nem értették a vizuális összefüggéseket. Képzeljük el, milyen elképesztő lehetőségeket nyithat meg ez a technológia a mindennapokban, ha például ezzel a megoldással vértezik fel a biztonsági kamerákat. A Twelve Labs újítása után még egyetlen zokni ellopása is a mosodából sokkal kockázatosabbá és könnyebben felderíthetővé válik, mint korábban bármikor.

Miért fontos?

Ez egy teljesen új alkalmazási kategóriát hoz létre, mert eddig a robotok gyakorlatilag vakok voltak. Képzeld el, milyen lehetőségeket nyithat ez meg: csak gondolj a ezzel a technológiával felvértezett biztonsági kamerákra – egyetlen zokni ellopása a mosodából mostantól sokkal kockázatosabbá vált! ---

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
NYT-újságíró AI segítségével, ingatlanügynök nélkül adta el házát
most
Az Anthropic megerősítette, hogy a nagyteljesítményű Mythos modell hamarosan elérhető lesz a nyilvánosság számára
most
Az ElevenLabs Music v2 lehetővé teszi a szám közbeni műfajváltást és a gyors repet
most
Tudj meg többet
AI hanggenerálás és zeneszerzés: Útmutató a Suno, Udio és ElevenLabs használatához