Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Multimodális modellek

A Meta bemutatta a Chameleon multimodális modellt az integrált szöveg- és látásfeldolgozáshoz

2024. május 23. · MI Történik? · 1 perc olvasás

A Meta bemutatja a Chameleon-t – egy multimodális modellcsaládot, amely kiemelkedő a képek és szövegek értelmezésében és generálásában, számos feladatban elérve a legkorszerűbb (state-of-the-art) teljesítményt.

Egyszerre jeleskedik a képek és szövegek megértésében és generálásában
Számos benchmarkban ért el piacvezető teljesítményt
Early-fusion architektúrát használ a jobb modalitások közötti következtetés érdekében

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az Anthropic kutatója négy kulcsfontosságú promptstratégiát vázolt fel a Claude Fable 5-höz

4 órája

Az Apple bemutatta a Siri AI funkcióit és az iOS 27-et a WWDC nyitóelőadásán

7 órája

A NASA X-59-es repülőgépe elérte a szuperszonikus sebességet, ami jelentős mérföldkő a repülésben

9 órája