A Google kiadta a Gemini Embedding 2-t a multimodális adatleképezéshez

2026. március 11. · MI Történik? · 1 perc olvasás

A Google megjelentette a Gemini Embedding 2-t, egy multimodális beágyazási (embedding) modellt, amely szöveget, képeket, videókat, hanganyagokat és PDF-eket képez le egy egységes vektortérbe. A modell a csak szöveges gemini-embedding-001 utódja, és a produkciós RAG rendszerek kiépítésének architekturális összetettségét kezeli azáltal, hogy feleslegessé teszi a különálló folyamatokat (pipelines) – a fejlesztők mostantól különböző modalitásokat kombinálhatnak egyetlen kérésben. A technikai korlátok közé tartozik a 8 192 szöveges token, hat kép, 120 másodpercnyi videó, 80 másodpercnyi hang és hat PDF-oldal. A Massive Text Embedding Benchmark teszten a Gemini Embedding 2 javulást mutat a visszakeresési pontosság és a tartományeltolódással (domain shift) szembeni rugalmasság terén: ez egy gyakori probléma, amikor a teljesítmény csökken, ha az általános tanítóadatokról speciális területekre, például saját tulajdonú kódokra vagy orvosi adatkészletekre váltanak. A modell nyilvános előnézetben (public preview) érhető el a Gemini API-n és a Vertex AI-n keresztül, opcionális feladattípus-paraméterekkel, amelyek optimalizálják a vektor-tulajdonságokat a specifikus műveletekhez.

Szövegeket, képeket, videókat, hangokat és PDF-eket képez le egyetlen egységes vektortérbe
Megszünteti a különálló folyamatok szükségességét a multimodális RAG rendszerekben
Kérésenként 8 192 tokent, 6 képet, 120 mp videót és 80 mp hangot támogat
Javult a visszakeresési pontosság és a tartományeltolódással szembeni ellenállás a benchmarkokon
Olyan speciális feladattípus-paramétereket tartalmaz, mint a RETRIEVAL_QUERY és a CLASSIFICATION

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez

2026. május 28.

Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje

2026. április 15.

Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt

2026. március 30.

Tudj meg többet

AI modellek finomhangolása és egyedi fejlesztése: Lépj túl a generikus megoldásokon!

Gemini a Gmail-ben és a Google Docs-ban: Így automatizáld a munkád