Kiemelt hírek

Az Apple bemutatja a Ferret-UI 2-t az automatizált mobil- és webes feladatvégrehajtáshoz

Az Apple kifejlesztette és nyíltan közzétette a Ferret-UI 2-t, egy multimodális nagy nyelvi modellt, amelyet kifejezetten a mobil eszközökön és webböngészőkön...

eredeti forrás · 2024. október 31.

Kiemelt hírek

Az Anthropic Claude 3.5 Sonnet új mércét állít fel a szoftvermérnöki feladatokban

Az Anthropic nemrég frissített Claude 3.5 Sonnet modellje új, a technológia jelenlegi állását képviselő 49%-os teljesítményt ért el az SWE-bench teszten, amely...

eredeti forrás · 2024. október 31.

Kiemelt hírek

A Runway bemutatja az Act-One eszközt a kifejező karakteranimációkhoz

A Runway elindította az Act-One-t, egy élvonalbeli eszközt, amelyet arra terveztek, hogy az egyszerű videó- és hangbemeneteket rendkívül kifejező...

eredeti forrás · 2024. október 24.

Kiemelt hírek

Az Ideogram kiadja a Canvas-t a fejlett AI képszerkesztéshez és képkiterjesztéshez

Az Ideogram bemutatta a Canvas-t, egy AI-alapú képszerkesztő munkaterületet, amely kifinomult inpainting és outpainting képességeket kínál. Az eszköz dedikált...

eredeti forrás · 2024. október 24.

Kiemelt hírek

A Sequoia Capital jelentése vázolja az inferencia-idejű érvelésre való áttérést

A Sequoia Capital jelentést tett közzé a generatív AI fejlődéséről, fókuszban az „1-es rendszerű gondolkodásról” a „2-es rendszerű gondolkodásra” való...

eredeti forrás · 2024. október 17.

Kiemelt hírek

Az AI2 kiadta a Molmo multimodális modelleket, amelyek lekörözik a Gemini-t és a Claude 3.5-öt

Az AI2 megjelentette a Molmo-t – a multimodális modellek egy új családját, amelynek legkisebb változata (1B) majdnem eléri a GPT-4V szintjét, a közepes modell...

eredeti forrás · 2024. szeptember 26.

Kiemelt hírek

A Meta kiadta a Llama 3.2-t edge-optimalizált és multimodális modellekkel

A Meta megjelentette a Llama 3.2-t – egy új nyílt modellcsaládot, amely edge-optimalizált szöveges modelleket (1B és 3B), valamint a Meta első nagy...

eredeti forrás · 2024. szeptember 26.

Kiemelt hírek

A Mistral kiadta a Pixtral 12B-t, az első nyílt multimodális modelljét

A Mistral nyíltan közzétette a Pixtral 12B-t, amivel a vállalat először lépett be a multimodális modellek piacára. Ez az új modell képes szöveges és képi...

eredeti forrás · 2024. szeptember 12.

Kiemelt hírek

A Fish Audio kiadta a Fish Speech 1.4-et azonnali hangklónozással

A Fish Audio bemutatta a Fish Speech 1.4-et, egy fejlett, többnyelvű hangmodellt, amelyet a globális fejlesztők számára terveztek. A rendszer azonnali...

eredeti forrás · 2024. szeptember 12.

Kiemelt hírek

A Replit bejelentette a Replit Agent-et a szoftverfejlesztési feladatok automatizálására

A Replit bejelentette a Replit Agent-et, egy speciális AI eszközt, amely automatizálja a komplex szoftverfejlesztési munkafolyamatokat. Az ágenst olyan...

eredeti forrás · 2024. szeptember 12.

Kiemelt hírek

A Stanford tanulmánya szerint az LLM-ek által generált ötletek újszerűbbek az emberi szakértőkénél

A Stanford Egyetem tanulmánya kimutatja, hogy a nagy nyelvi modellek (LLM-ek) által generált ötleteket a közvetlen összehasonlítások során gyakran újszerűbbnek...

eredeti forrás · 2024. szeptember 12.

Kiemelt hírek

Az Alibaba Cloud kiadta a Qwen2-VL nyílt látás-nyelvi modellcsaládot

Az Alibaba Cloud nyilvánosan közzétette a Qwen2-VL-t – egy kereskedelmileg is használható nyílt látás-nyelvi (vision-language) modellcsaládot (72B, 2B), amely...

eredeti forrás · 2024. szeptember 5.

Kiemelt hírek

Az LM Studio 0.3.0 dokumentumalapú csevegéssel és GPU-kiegyenlítéssel bővült

Az LM Studio kiadta a 0.3.0-s verziót, amely RAG-alapú dokumentum-csevegést, OpenAI-szerű JSON kimeneti támogatást és automatikus GPU/CPU kiegyenlítést kínál a...

eredeti forrás · 2024. szeptember 5.

Kiemelt hírek

Az OpenAI elindította a GPT-4o finomhangolási lehetőségeit

Az OpenAI mostantól lehetővé teszi a fejlesztők számára a GPT-4o finomhangolását, így egyedi igényekre szabhatják a modell válaszait specifikus területeken. Ez...

eredeti forrás · 2024. augusztus 22.

Kiemelt hírek

Az Ideogram 2.0 új mércét állít fel a szövegből képet generáló technológiák terén

Az Ideogram kiadta text-to-image modelljének 2.0-s verzióját, amely állításuk szerint túlszárnyalja a DALL-E 3, a Midjourney és a FLUX Pro teljesítményét. Az...

eredeti forrás · 2024. augusztus 22.

Kiemelt hírek

Elon Musk xAI-ja bemutatta a Grok-2-t és a Grok-2 mini-t a csúcsmodellek riválisaként

Elon Musk xAI cége bemutatta a Grok-2 és Grok-2 mini modelleket, ami jelentős előrelépést jelent a nyelvmodell-kínálatukban. Ezek a modellek fejlett...