A Jina AI kiadta a Jina CLIP v1 nyílt forráskódú multimodális embedding modelljét

VIZUÁLIS TECHNOLÓGIA

A Jina AI kiadta a Jina CLIP v1 nyílt forráskódú multimodális embedding modelljét

2024. június 6. · MI Történik? · 1 perc olvasás

A Jina AI megjelentette a Jina CLIP v1-et, egy új multimodális embedding modellt, amely jelentősen felülmúlja az eredeti OpenAI CLIP modellt. Kiválóan teljesít a csak szöveges és a kép-alapú képkeresésben, miközben rendkívül versenyképes marad a hagyományos cross-modális feladatokban is.

Felülteljesíti az eredeti OpenAI CLIP-et specifikus keresési benchmarkokban
Szöveg-szöveg és kép-kép alapú keresési képességekre optimalizálták
Megőrzi a csúcstechnológiás teljesítményt a cross-modális (szövegből kép) feladatoknál
Sokoldalú eszközként tervezték multimodális keresőmotorok és RAG alkalmazások fejlesztéséhez

Miért fontos?

A jobb multimodális embeddingek lehetővé teszik a fejlesztők számára, hogy pontosabb keresőmotorokat és olyan AI alkalmazásokat építsenek, amelyek jobban megértik a szöveges és vizuális adatok közötti összefüggéseket. ---

Eredeti forrás megtekintése (angol) →