2024. július 25.
✨ KIEMELT HÍREK
A Stability AI kiadta a Stable Audio modell technikai jelentését, amely mélyreható betekintést nyújt a szövegből hangot generáló (text-to-audio) rendszerének…
2024. július 18.
KIEMELT HÍREK
A Mistral a Mamba architektúra készítőivel együttműködve megjelentette a Codestral-Mamba 7B-t. Ezt a modellt a saját méretkategóriájában a legerősebb…
NYELVI MODELLEK
A Microsoft kutatói bemutatták a SpreadsheetLLM-et, egy újszerű kódolási módszert, amelyet kifejezetten a nagy nyelvi modellek (LLM) táblázatokkal kapcsolatos…
KIEMELT HÍREK
A Lynx a Patronus AI által kiadott új, kereskedelmileg szabadon felhasználható hallucináció-detektáló modell. A modellt az AI-alkalmazások megbízhatóságának…
NYELVI MODELLEK
Az UCSD és a Google kutatói bemutatták a Speculative RAG keretrendszert, amely a nagy és kis nyelvi modellek erősségeit ötvözi a Retrieval-Augmented Generation…
KIEMELT HÍREK
A Hugging Face megjelentette a SmolLM sorozatot, amely egy új, korszerű, eszközön futtatható (on-device) multimodális Large Language Model széria. Ezeket a…
KIEMELT HÍREK
Az Európai Unió közzétette az EU AI Act teljes és végleges szövegét a Hivatalos Lapjában. Ez a mérföldkőnek számító jogszabály kockázatalapú szabályozást vezet…
2024. július 15.
A Colfax Research, a Meta, az NVIDIA, a Georgia Tech, a Princeton University és a Together.ai kutatói kiadták a FlashAttention-3-at, amely a széles körben…
Yoshua Bengio Turing-díjas tudós, a jelenlegi AI-bumm egyik úgynevezett „keresztapja”. Kollégájához, Geoffrey Hintonhoz hasonlóan ő is egyre inkább aggódik a…
A HÉT ROBOTJA
A Texas A&M University és a Boston Dynamics kutatói valóra váltották sok gyerek álmát – lángszórót szereltek egy robotra... a tudomány nevében! A kutatási…
AI INFRASTRUKTÚRA
Az AI fejlesztés egyik fő kihívása, hogy a legfejlettebb frontier modelleket általában sűrűn hálózatba kötött, hatalmas chip-klasztereken tanítják. A…
2024. július 11.
✨ Kiemelt hírek
A Perplexity AI bemutatta a Pro Search továbbfejlesztett változatát, amely képes többlépcsős érvelésre és összetett számítási feladatok elvégzésére. Ez a…
Nyelvi modellek
A Meta kutatói előálltak a MobileLLM-mel, amely egy mobileszközökre optimalizált, hatékony Large Language Model. Az innovatív architektúra 4,3%-os…
Nyelvi modellek
A Stanford és a UCSD kutatói bemutatták a Test-Time Training (TTT) rétegeket, a szekvencia-modellező rétegek egy új osztályát. Ezek a rétegek lineáris…
2024. július 8.
Google has published details on Project Naptime, a software framework built to help use LLMs for vulnerability discovery in code. The system uses a specialized…
AI BIZTONSÁG
A Magic, egy rendkívül nagy kontextusablakkal rendelkező kódmodelleket építő startup, közzétett egy „AGI-felkészültségi irányelvet”. Ez az irányelv egy sor…
AI ADATOK
A Tencent kutatói kifejlesztették a Persona Hub-ot, egy technikát a szintetikus adatok nagyüzemi generálására. A keretrendszer körülbelül egymilliárd különböző…
AI OKTÁTÁS
A Koppenhágai Informatikai Egyetem és az Aalborgi Egyetem kutatói létrehozták a HACC-MAN-t, egy 80-as évekbeli stílusú kabinetbe zárt fizikai arcade…
AI KUTATÁS
A Harvard és a Princeton kutatói bebizonyították, hogy az AI-rendszerek többek lehetnek részeik összegénél azáltal, hogy a tréningkészleteikben találhatóknál…
2024. június 30.
Iparági bejelentések
Az Anthropic megjelentette a Claude 3.5 Sonnet-et, amely 200 ezer tokenes kontextusablakkal rendelkezik, és több teljesítmény-benchmarkban is megelőzi az olyan…