MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2024. július 25.
A Stability AI közzétette a Stable Audio Open technikai kutatási jelentését
A Stability AI kiadta a Stable Audio modell technikai jelentését, amely mélyreható betekintést nyújt a szövegből hangot generáló (text-to-audio) rendszerének…
2024. július 18.
A Mistral kiadta a Codestral-Mamba 7B-t a hatékony kódgeneráláshoz
A Mistral a Mamba architektúra készítőivel együttműködve megjelentette a Codestral-Mamba 7B-t. Ezt a modellt a saját méretkategóriájában a legerősebb…
A Microsoft bemutatja a SpreadsheetLLM-et a táblázatkezelési feladatok optimalizálására
A Microsoft kutatói bemutatták a SpreadsheetLLM-et, egy újszerű kódolási módszert, amelyet kifejezetten a nagy nyelvi modellek (LLM) táblázatokkal kapcsolatos…
A Patronus AI kiadta a Lynx-et a csúcstechnológiás hallucináció-detektáláshoz
A Lynx a Patronus AI által kiadott új, kereskedelmileg szabadon felhasználható hallucináció-detektáló modell. A modellt az AI-alkalmazások megbízhatóságának…
A Speculative RAG keretrendszer növeli a pontosságot és csökkenti a késleltetést
Az UCSD és a Google kutatói bemutatták a Speculative RAG keretrendszert, amely a nagy és kis nyelvi modellek erősségeit ötvözi a Retrieval-Augmented Generation…
A Hugging Face elindította a SmolLM sorozatot az eszközön futtatható nyelvi modellekhez
A Hugging Face megjelentette a SmolLM sorozatot, amely egy új, korszerű, eszközön futtatható (on-device) multimodális Large Language Model széria. Ezeket a…
Az Európai Unió közzétette az EU AI Act végleges szövegét
Az Európai Unió közzétette az EU AI Act teljes és végleges szövegét a Hivatalos Lapjában. Ez a mérföldkőnek számító jogszabály kockázatalapú szabályozást vezet…
2024. július 15.
A FlashAttention-3 javítja az AI oktatás hatékonyságát és a GPU kihasználtságát
A Colfax Research, a Meta, az NVIDIA, a Georgia Tech, a Princeton University és a Together.ai kutatói kiadták a FlashAttention-3-at, amely a széles körben…
A Turing-díjas Yoshua Bengio vázolja a fejlett AI kockázatait
Yoshua Bengio Turing-díjas tudós, a jelenlegi AI-bumm egyik úgynevezett „keresztapja”. Kollégájához, Geoffrey Hintonhoz hasonlóan ő is egyre inkább aggódik a…
Kutatók lángszóróval felszerelt robotkutyákat hoztak létre a precíziós gyomirtáshoz
A Texas A&M University és a Boston Dynamics kutatói valóra váltották sok gyerek álmát – lángszórót szereltek egy robotra... a tudomány nevében! A kutatási…
A Prime Intellect szolgáltatást indít a decentralizált, globális AI oktatáshoz
Az AI fejlesztés egyik fő kihívása, hogy a legfejlettebb frontier modelleket általában sűrűn hálózatba kötött, hatalmas chip-klasztereken tanítják. A…
2024. július 11.
A Perplexity AI frissítette a Pro Search funkciót a többlépcsős érvelési feladatokhoz
A Perplexity AI bemutatta a Pro Search továbbfejlesztett változatát, amely képes többlépcsős érvelésre és összetett számítási feladatok elvégzésére. Ez a…
A Meta bemutatja a MobileLLM-et a hatékony eszközön belüli nyelvi modellezéshez
A Meta kutatói előálltak a MobileLLM-mel, amely egy mobileszközökre optimalizált, hatékony Large Language Model. Az innovatív architektúra 4,3%-os…
A Stanford és a UCSD Test-Time Training rétegeket fejlesztett a hosszú kontextusokhoz
A Stanford és a UCSD kutatói bemutatták a Test-Time Training (TTT) rétegeket, a szekvencia-modellező rétegek egy új osztályát. Ezek a rétegek lineáris…
2024. július 8.
A Google Project Naptime projektje LLM-eket használ az automatizált szoftveres sebezhetőség-kutatáshoz
Google has published details on Project Naptime, a software framework built to help use LLMs for vulnerability discovery in code. The system uses a specialized…
A kódoló startup Magic közzétette AGI-felkészültségi irányelveit a biztonsági vállalások érdekében
A Magic, egy rendkívül nagy kontextusablakkal rendelkező kódmodelleket építő startup, közzétett egy „AGI-felkészültségi irányelvet”. Ez az irányelv egy sor…
A Tencent Persona Hubja egymilliárd szintetikus karaktert generál matematikai adatokhoz
A Tencent kutatói kifejlesztették a Persona Hub-ot, egy technikát a szintetikus adatok nagyüzemi generálására. A keretrendszer körülbelül egymilliárd különböző…
A HACC-MAN játékgép fizikai játékmeneten keresztül tanítja az LLM-ek „jailbreakelését”
A Koppenhágai Informatikai Egyetem és az Aalborgi Egyetem kutatói létrehozták a HACC-MAN-t, egy 80-as évekbeli stílusú kabinetbe zárt fizikai arcade…
Az AI-modellek meghaladhatják a tréningadat-eloszlásaik készségszintjét
A Harvard és a Princeton kutatói bebizonyították, hogy az AI-rendszerek többek lehetnek részeik összegénél azáltal, hogy a tréningkészleteikben találhatóknál…
2024. június 30.
Az Anthropic kiadta a GPT-4o-t is leköröző Claude 3.5 Sonnet modellt
Az Anthropic megjelentette a Claude 3.5 Sonnet-et, amely 200 ezer tokenes kontextusablakkal rendelkezik, és több teljesítmény-benchmarkban is megelőzi az olyan…