A DeepSeek bemutatta a Janus-Pro nyílt forráskódú multimodális AI képgeneráló modelljét

DEEPSEEK

A DeepSeek bemutatta a Janus-Pro nyílt forráskódú multimodális AI képgeneráló modelljét

2025. január 28. · MI Történik? · 1 perc olvasás

A kínai DeepSeek AI startup nemrég adta ki a Janus-Pro-t, egy új nyílt forráskódú multimodális AI modellt, amely túlszárnyalja az olyan jelentős képgeneráló riválisokat, mint a DALL-E 3 és a Stable Diffusion – mindezt a vállalat vírusszerűen terjedő R1 indítása után.

Az új Janus-Pro modellcsalád kiváló minőségű képeket generál szöveges leírásokból, 1B és 7B paraméteres változatokban érhető el.
A Janus-Pro lekörözte a DALL-E 3-at és a Stable Diffusion-t a képminőséget és pontosságot mérő legfontosabb iparági benchmarkokon, mint például a GenEval és a DPG-Bench.
A modelleket MIT licenc alatt tették közzé, így a fejlesztők szabadon használhatják és módosíthatják azokat kereskedelmi projektekhez is.
A bevezetés a DeepSeek R1 kiadását követi, amely o1-szintű érvelési képességeket ért el jóval alacsonyabb költségek mellett – alaposan felkavarva az amerikai piacokat és az iparágat.

Miért fontos?

Most a DeepSeekről beszél mindenki, és az R1 hatásai az egész piacon érezhetőek, miközben a világ próbálja feldolgozni a fejlesztési költségekkel és képességekkel kapcsolatos feltételezések átalakulását. Bár a jelenlegi pánik talán túlzott reakció, a kínai labor kérdéseket vetett fel az USA vélt vezető szerepével kapcsolatban ezen a területen. ---

Eredeti forrás megtekintése (angol) →