MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

Friss AI hírek - 331. oldal

2024. június 10.
Kutatók több mint 1000 órányi szurikáta-hanganyagot és az animal2vec keretrendszert is közzétették
Egy multidiszciplináris kutatócsoport létrehozta a MeerKAT-ot, egy „1068 órás, nagyméretű adatkészletet, amely szabadon élő szurikáták által viselt hangrögzítő...
Az IrokoBench benchmark teljesítménybeli hiányosságokat mutat az afrikai nyelveknél az AI-modellekben
A Masakhane projekt pánafrikai kutatócsoportja kifejlesztette az IrokoBench-et, „egy emberi fordítással készült benchmarkot, amely különböző földrajzi régiók...
Kínai kutatók bevetették a Shukai RL ágenst a Naruto Mobile kereskedelmi verekedős játékban
A University of Science and Technology of China, a Tencent Games és a Kínai Tudományos Akadémia kutatói betanították a Shukai AI modellt a népszerű Naruto...
A Google ImageInWords keretrendszere hiperrészletes leírásokat generál képadatbázisokhoz
A Google kifejlesztette az ImageInWords (IIW) nevű, gondosan megtervezett, emberi közreműködésen alapuló (human-in-the-loop) annotációs keretrendszert...
2024. június 7.
A Meta 204 különböző nyelv fordítására képes AI eszközt fejlesztett ki
A Meta bejelentette a „No Language Left Behind” nevű, AI-vezérelt fordítóeszköz létrehozását, amelynek célja a digitális szakadék áthidalása. Az eszköz 204...
A Stability AI nyílt modellt adott ki etikus szövegből-hang generáláshoz
A Stability AI elindított egy nyílt AI modellt, amely lehetővé teszi a felhasználók számára, hogy egyszerű szöveges utasítások alapján kiváló minőségű...
A Sēkr alkalmazás mesterséges intelligenciát használ, hogy segítsen az utazóknak festői útvonalakat találni
Miközben a legtöbb navigációs alkalmazás a leggyorsabb útvonalra fókuszál, a Sēkr alkalmazás a „van life” (lakóautós életmód) kedvelőit szolgálja ki, akik...
2024. június 6.
A Mamba-2 sebességi rekordokat dönt és bevezeti az SSD keretrendszert a nyelvmodellezésben
A Princeton és a CMU kutatói közzétették a Mamba-2-t, egy jelentősen gyorsabb nyelvi modellt, amely megőrzi versenyképes teljesítményét a nyelvmodellezésben. A...
A Google LLM-jei felnőtt szintű teljesítményt értek el a mentális állapotokra vonatkozó következtetésben
A Google kutatói a magasabb rendű tudatelméletet (theory of mind) vizsgálták a nagy nyelvi modellekben, és megállapították, hogy a GPT-4 és a Flan-PaLM képes...
A Mobile-Agent-v2 30%-kal javítja az autonóm feladatvégzést a telefonokon
Kutatók open-source szoftverként közzétették a Mobile-Agent-v2-t, egy többágensű (multi-agent) architektúrát, amelyet mobilkészülékek autonóm vezérlésére...
A Jina AI kiadta a Jina CLIP v1 nyílt forráskódú multimodális embedding modelljét
A Jina AI megjelentette a Jina CLIP v1-et, egy új multimodális embedding modellt, amely jelentősen felülmúlja az eredeti OpenAI CLIP modellt. Kiválóan teljesít...
A ByteDance Seed-TTS az embertől megkülönböztethetetlen beszédet generál érzelmi kontrollal
A ByteDance bemutatta a Seed-TTS-t, egy új Text-to-Speech modellcsaládot, amely gyakorlatilag az emberi hangtól megkülönböztethetetlen beszédet képes...
A Stability AI kiadta a Stable Audio Opent a kiváló minőségű hanggeneráláshoz
A Stability AI megjelentette a Stable Audio Opent, egy open-source modellt, amely kiváló minőségű hangmintákat és hangeffekteket generál egyszerű szöveges...
A ChatGPT leállása rávilágított az AI-függőségre és a felhasználói szokásokra
Kedden a Z generáció és a millenniálok a 2018-as nagy Snapchat-átalakítás óta a legtraumatikusabb eseményt élték át: a ChatGPT több órára leállt. Ugyanígy...
2024. június 3.
GPT-2 visszatekintés: Az AI skálázási és biztonsági előrejelzéseinek öt éve
Öt évvel ezelőtt az OpenAI kutatói kifejlesztették a GPT-2-t, egy nyelvi modellt, amely bemutatta a "skálázási törvények" (Scaling Laws) korai hatásait. A...
A központosított hatalom és a szabályozási túllépés kockázatai az AI irányelvekben
Az AI irányelvekben bekövetkezett legutóbbi változások az agresszív szabályozási ötletek felé mozdultak el, mint például az AI rendszerek fejlesztéséhez...
A szisztematikus monitorozás és a harmadik fél általi AI mérés mellett szóló érvek
A központosított engedélyeztetéssel szembeni szkepticizmus ellenére továbbra is erős érvek szólnak amellett, hogy a kormányoknak szisztematikusan figyelemmel...
Hogyan készítsünk AI videókat Krea AI szöveges utasításokkal
A Krea AI nemrégiben egy erőteljes AI videógenerátort adott ki, amely lehetővé teszi a felhasználók számára, hogy ingyenesen készítsenek videókat képek és...
2024. június 2.
Az OpenAI bemutatta a GPT-4o multimodális modellt valós idejű interaktivitással
Az OpenAI bemutatta a GPT-4o-t, egy élvonalbeli multimodális modellt, amely szöveget, látványt és hangot is feldolgoz, a GPT-4 Turbo-hoz képest kiváló...
A Google bejelentette a Gemini 1.5 Pro-t 2 millió tokenes kontextusablakkal
A Google I/O 2024 konferencián a Google leleplezte a Gemini 1.5 Pro-t, amely immár kétmillió tokenig bővített kontextusablakkal büszkélkedhet, valamint a...