2024. március 9.
IPARI BEJELENTÉSEK
A Google közzétette a Gemini 1.5-öt, amely úttörő, akár 10 millió tokent is támogató kontextusablakkal rendelkezik. Ezt a következő generációs modellt kiváló…
NAGY NYELVI MODELLEK
A Google nyílt forráskódúvá tette a Gemma-t, egy könnyű nyelvi modellcsaládot (7B és 12B), amely a Gemini-vel megegyező technológiára épül. Ezek a modellek…
BESZÉDFELISMERÉS ÉS SZÖVEGFELOLVASÁS
Az Amazon bemutatta a Base TTS-t, az eddigi legnagyobb text-to-speech modellt. A több mint 100 000 órányi beszédadaton tanított modell a beszédmintézis…
2024. március 4.
AI KUTATÁS
A Google DeepMind megalkotta a Genie-t, egy generatív modellt, amely interaktív világokat képes létrehozni. A Genie egy rendkívül érdekes rendszer, amely…
Egy közelmúltbeli DIY (csináld magad) kísérlet rávilágított arra, milyen egyszerűen integrálhatók az AI-alapú személyfelismerő rendszerek hobbicélú drónokba,…
AI TRAINING
A Cohere kutatói azt vizsgálták, hogyan befolyásolják a különböző megerősítéses tanulási (RL) algoritmusok a nyelvi modellek összehangolásának RLHF szakaszát.…
AI CAPABILITIES
A New York University kutatói azt tesztelték, mennyire teljesítenek jól a vezető nyelvi modellek, mint a GPT-4, hacking versenyeken. A modelleket a 2023-as…
AI INFRASTRUCTURE
A ByteDance és a Pekingi Egyetem kutatói közzétették a MegaScale-t, egy nagyléptékű AI rendszerek tanítására szolgáló rendszert. A tanulmány…
2024. február 26.
AI RESEARCH
Az Amazon egy nagy szövegfelolvasó modellcsaládot épített 100 ezer órányi közkinccsé tett beszédadaton. A modell, a Big Adaptive Streamable TTS with Emergent…
AI MODELLEK
A Google megalkotta és közzétette a Gemma-t, két nyíltan hozzáférhető, kisméretű és nagy teljesítményű AI modellt. A legfontosabb újdonság, hogy a Gemma…
AI OKTÁTÁS
Jascha Sohl-Dickstein kutató független vizsgálatot végzett a neurális hálózatok tanításáról, és valami olyasmit fedezett fel, ami egyszerre intuitív és…
AI ÉRTÉKELÉS
Nicholas Carlini kutató létrehozott egy benchmarkot a nyelvi modellek tesztelésére 100 különálló feladaton keresztül. Ezeket a feladatokat főként az alapján…
2024. február 19.
AI ARCHITEKTÚRA
A Google DeepMind, a Mila, a Montreali Egyetem, az Oxfordi Egyetem és a McGill Egyetem kutatói rájöttek, hogyan integrálják a Mixture-of-Expert (MoE)…
AI ALKALMAZÁSOK
A Huawei Orosz Kutatóintézetének kutatói megpróbáltak nyíltan hozzáférhető nyelvi modelleket használni sebezhetőség-észlelésre. Munkájuk útmutatóként és…
Rendelkezik-e a nyelvi modelled tudatelmélettel – „annak felismerésével, hogy mások máshogy érzékelik a világot, és azzal a képességgel, hogy nyomon kövesse…
2024. február 17.
AI BUILDERS SERIES
A generatív AI gyors fejlődése a saját fejlesztésű (proprietary) és az open-source modellek robbanásszerű elterjedéséhez vezetett, ami megnehezíti a fejlesztők…
AI EFFICIENCY
A látencia és a hosztolási költségek kritikus tényezők, amikor LLM-alapú alkalmazásokat visznek éles környezetbe (production). A kisebb modellek általában…
AI TOOLS
A Hugging Face Open LLM Leaderboardja az open-source nyelvi modellek rangsorolásának elsődleges forrásává vált. Számos benchmarkon és méreten keresztül követi…
2024. február 12.
AI RESEARCH
A KU Leuven kutatói létrehozták és közzétették a FindingEmo-t, egy olyan adatkészletet, amelynek célja az AI rendszerek megtanítása az emberek érzelmeinek…
AI SAFETY
A Google DeepMind kutatói bemutatták, hogyan lehet megmérgezni a Mixture of Experts (MoE) modelleket úgy, hogy egy támadó megváltoztassa a modell előrejelzését…