2024. február 26.
AI RESEARCH
Az Amazon egy nagy szövegfelolvasó modellcsaládot épített 100 ezer órányi közkinccsé tett beszédadaton. A modell, a Big Adaptive Streamable TTS with Emergent…
2024. február 19.
Rendelkezik-e a nyelvi modelled tudatelmélettel – „annak felismerésével, hogy mások máshogy érzékelik a világot, és azzal a képességgel, hogy nyomon kövesse…
AI ALKALMAZÁSOK
A Huawei Orosz Kutatóintézetének kutatói megpróbáltak nyíltan hozzáférhető nyelvi modelleket használni sebezhetőség-észlelésre. Munkájuk útmutatóként és…
AI ARCHITEKTÚRA
A Google DeepMind, a Mila, a Montreali Egyetem, az Oxfordi Egyetem és a McGill Egyetem kutatói rájöttek, hogyan integrálják a Mixture-of-Expert (MoE)…
2024. február 17.
AI TOOLS
A Hugging Face Open LLM Leaderboardja az open-source nyelvi modellek rangsorolásának elsődleges forrásává vált. Számos benchmarkon és méreten keresztül követi…
AI EFFICIENCY
A látencia és a hosztolási költségek kritikus tényezők, amikor LLM-alapú alkalmazásokat visznek éles környezetbe (production). A kisebb modellek általában…
AI BUILDERS SERIES
A generatív AI gyors fejlődése a saját fejlesztésű (proprietary) és az open-source modellek robbanásszerű elterjedéséhez vezetett, ami megnehezíti a fejlesztők…
2024. február 12.
AI ALIGNMENT
New research from the University of Washington, Stanford, MIT, and AllenAI lays out a framework for 'Pluralistic Alignment.' The motivating idea is that as a…
AI TOOLS
Az Allen Institute for AI létrehozta az OLMo-t, egy „valóban nyílt” nyelvi modellcsaládot, amelynek célja a tanítási folyamat demisztifikálása. Sok „nyílt”…
AI TRAINING
Számos intézmény kutatói létrehozták a BioDrone-t, az első bionikus drónalapú vizuális benchmarkot az egyedi tárgykövetéshez (SOT). Az adatkészletet egy…
AI SAFETY
A Google DeepMind kutatói bemutatták, hogyan lehet megmérgezni a Mixture of Experts (MoE) modelleket úgy, hogy egy támadó megváltoztassa a modell előrejelzését…
AI RESEARCH
A KU Leuven kutatói létrehozták és közzétették a FindingEmo-t, egy olyan adatkészletet, amelynek célja az AI rendszerek megtanítása az emberek érzelmeinek…
Az Allen Institute for AI megalkotta az OLMo-t, a „valóban nyílt” nyelvi modellek családját. Az OLMo modellek különlegessége a „minden részletre kiterjedő”…
2024. február 8.
AI KUTATÁS
Az Altera bemutatta a Project Sid-et, egy masszív multi-ágens szimulációt, amely egy digitális világot népesít be több mint 1000 autonóm AI ágenssel. Ebben a…
AI ÁGENSEK
A MultiOn bemutatta az új „Agentic” API-ját, amely lehetővé teszi a fejlesztők számára olyan ágensek építését, amelyek képesek önállóan navigálni az…
AI ESZKÖZÖK
A MotherDuck és a Numbers Station együttműködéséből megszületett a DuckDB-NSQL, egy 7 milliárd paraméteres modell, amelyet kifejezetten a természetes nyelv…
AI MODELLEK
Az Allen Institute for AI (AI2) közzétette az OLMo-t (Open Language Model), egy valóban nyílt forráskódú, 7 milliárd paraméteres modellt. Sok más „nyíltnak”…
AI MODELLEK
Az Abacus AI bejelentette a Smaug-72B megjelenését, egy új nyelvi modellt, amely jelentős mérföldkövet ért el: ez az első open-source modell, amely 80 feletti…
AI MODELLEK
A Nomic AI megjelentette a Nomic Embed-et, az első olyan open-source szöveges embedding modellt, amely hatalmas, 8 192 tokenes kontextusablakot támogat. A…
2024. február 5.
Az Apple kutatói kifejlesztették a Web Rephrase Augmented Pre-training (WRAP) eljárást, amely egy módszer a szöveges adatkészletek szintetikusan generált…