DEEPSEEK
A DeepSeek bemutatta a Janus-Pro nyílt forráskódú multimodális AI képgeneráló modelljét
A kínai DeepSeek AI startup nemrég adta ki a Janus-Pro-t, egy új nyílt forráskódú multimodális AI modellt, amely túlszárnyalja az olyan jelentős képgeneráló riválisokat, mint a DALL-E 3 és a Stable Diffusion – mindezt a vállalat vírusszerűen terjedő R1 indítása után.
- Az új Janus-Pro modellcsalád kiváló minőségű képeket generál szöveges leírásokból, 1B és 7B paraméteres változatokban érhető el.
- A Janus-Pro lekörözte a DALL-E 3-at és a Stable Diffusion-t a képminőséget és pontosságot mérő legfontosabb iparági benchmarkokon, mint például a GenEval és a DPG-Bench.
- A modelleket MIT licenc alatt tették közzé, így a fejlesztők szabadon használhatják és módosíthatják azokat kereskedelmi projektekhez is.
- A bevezetés a DeepSeek R1 kiadását követi, amely o1-szintű érvelési képességeket ért el jóval alacsonyabb költségek mellett – alaposan felkavarva az amerikai piacokat és az iparágat.
Miért fontos?
Most a DeepSeekről beszél mindenki, és az R1 hatásai az egész piacon érezhetőek, miközben a világ próbálja feldolgozni a fejlesztési költségekkel és képességekkel kapcsolatos feltételezések átalakulását. Bár a jelenlegi pánik talán túlzott reakció, a kínai labor kérdéseket vetett fel az USA vélt vezető szerepével kapcsolatban ezen a területen. ---