Deepseek: A 6 millió dolláros kínai AI projekt, amely felforgatja a csúcsmodellekről szóló narratívát
A Deepseek, egy open-source kínai AI modell, a hírek szerint jelentős aggodalmat keltett az iparág vezetői, például a Meta körében. Annak ellenére, hogy versenyképes teljesítményt nyújt az olyan élvonalbeli modellekkel szemben, mint a ChatGPT o1, kiderült, hogy egy hedge fund mellékprojektjeként jött létre, és mindössze 6 millió dollárba került a fejlesztése. Ez az alacsony költségű siker megkérdőjelezi azt az elterjedt nézetet, miszerint a csúcsszintű AI-hoz csillagászati, több milliárd dolláros befektetésekre van szükség.
- A modellt körülbelül 6 millió dollárból építették fel, ami töredéke a nyugati versenytársak költségeinek.
- Egy befektetési cég mellékprojektjeként fejlesztették ki, nem pedig egy dedikált technológiai óriásnál.
- A beszámolók szerint a Meta vezetőire „a frászt hozta” az open-source konkurencia.
- Teljesítménye eléri vagy meghaladja a sokkal drágább csúcsmodellekét.
Miért fontos?
A projekt hatékonysága kérdéseket vet fel az amerikai laboratóriumok masszív infrastruktúra-kiadási terveivel kapcsolatban, és az erőforrás-hatékonyabb AI-fejlesztés irányába tolhatja el a versenyhelyzetet. ---