MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2023. szeptember 7.
A Meta publikálta a Code Llama tanításáról és értékeléséről szóló technikai dokumentációt
A Meta egy átfogó kutatási jelentést tett közzé, amely részletezi a Code Llama fejlesztését. A dokumentum mély betekintést nyújt a modell tanítási folyamatába…
2023. szeptember 5.
Az Andreessen Horowitz nyílt forráskódú AI támogatási programot indít
A neves kockázati tőkealap-kezelő firm, az Andreessen Horowitz bejelentette az „a16z Open Source AI Grant programot”, amelynek célja, hogy finanszírozást…
Az Egyesült Királyság kormánya vázolja a közelgő AI Biztonsági Csúcstalálkozó célkitűzéseit
Az év későbbi szakaszában az Egyesült Királyság kormánya egy az AI biztonságának szentelt csúcstalálkozót fog rendezni. „Az AI Biztonsági Csúcstalálkozó…
Biztonsági kockázatok és védekezési mechanizmusok azonosítása a generatív AI rendszerekben
Milyen fenyegetéseket hordoznak a generatív AI rendszerek, és hogyan védekezhetünk ellenük vagy enyhíthetjük azokat? Ez a témája egy új tanulmánynak, amely egy…
Az Oxfordi kutatók GPU-gyorsított tőzsdei komponens-szimulátort építettek
Az Oxfordi Egyetem kutatói megalkották a JAX-LOB-ot, egy szoftvert, amely egy limitáras ajánlati könyv (limit order book - LOB) szimulálására szolgál GPU-n. A…
Az Alibaba kiadta a Qwen-VL Frontier nagy vizuális-nyelvi modellt
Az Alibaba Group kutatói megépítették a Qwen-VL-t, egy nyelvi modellt, amely képes képek elemzésére. Betanították a Qwen-VL-Chat-et is, amelyet úgy hangoltak,…
2023. augusztus 28.
A Meta kiadta a programozásra tervezett Code Llama nagy nyelvi modellcsaládot
A Facebook megépítette és közzétette a Code Llama-t, a kódolásra tervezett nagy nyelvi modellek családját. A modellek támogatják a Python, C++, Java, PHP,…
Tudományos keretrendszert javasolnak a mesterséges intelligencia rendszerek tudatosságának értékelésére
Kutatók egy népes, interdiszciplináris csoportja mérföldkőnek számító tanulmányt tett közzé, amely segíthet eldönteni, hogy az AI rendszerek rendelkeznek-e…
A DeepMind kifejlesztette a megerősített önoktatást (ReST) a nyelvi modellek gyorsabb fejlesztése érdekében
A Google DeepMind kutatói kifejlesztették a „Reinforced Self-Training” (ReST) eljárást, amely egy technika a nyelvi modellek RL (megerősítéses tanulás) útján…
2023. augusztus 21.
A DivingWithPenguins adathalmaz mélytanulást használ a víz alatti vadvilág viselkedésének megfigyelésére
A Bristoli Egyetem, az Exeteri Egyetem és a BirdLife South Africa kutatói létrehozták a „DivingWithPenguins” adathalmazt, amely pingvinekre rögzített videókból…
Reflexiók az AI centralizációjáról, a biztonságról és a fejlesztés jövőjéről
Jack Clark elmélkedik az AI ökoszisztéma jelenlegi állapotáról, megjegyezve a gyors technológiai fejlődés, a változó politikai párbeszédek és az AI fősodorba…
2023. augusztus 20.
Érvek a központosított LLM multiprocesszor API-réteg mellett
Sahar Mor a fizetési iparágból merít párhuzamot, és feltérképezi a nyelvi modellekhez szánt „multiprocesszor” koncepcióját. Olyan nagyvállalatok, mint az Uber…
2023. augusztus 14.
A CoreWeave 2,3 milliárd dolláros hitelt vett fel Nvidia chipek fedezete mellett
Talán okosabb módja a GPU-k kifizetésének a tulajdonrész eladása helyett... A CoreWeave felhőszolgáltató 2,3 milliárd dollárt gyűjtött össze – eddig minden…
Egy új felmérés szerint az amerikaiak az AI-fejlesztés lassítását támogatják
Az új AI Policy Institute (TIAP) agytröszt egy olyan felméréssel indult, amely szerint "az [amerikai] szavazók döntő többsége, politikai hovatartozástól…
Javasolt felügyeleti irányelvek a szövetségi kormány AI finanszírozásához
A Center for Democracy & Technology útmutatót adott ki a szövetségi kormány számára az AI-rendszerek finanszírozásának és beszerzésének szigorúbb…
2023. augusztus 6.
Alapvető open-source repository-k, amiket minden generatív AI fejlesztőnek ismernie kell
Sok Large Language Model (LLM) területen dolgozó fejlesztő gyakran túl későn ébred rá, hogy léteznek már olyan open-source könyvtárak azokhoz a funkciókhoz,…
2023. július 31.
A SciBench egyetemi szintű tudományos problémamegoldás alapján értékeli a nyelvi modelleket
Az UCLA és a University of Washington kutatói létrehozták a SciBench-et, egy adatkészletet és benchmarkot annak tesztelésére, hogy a nyelvi modellek mennyire…
Kínai kutatók AI-t használnak funkcionális RISC-V CPU automatikus tervezéséhez
A Kínai Tudományos Akadémia, a Cambricon Technologies Corporation és a Kínai Tudományos és Technológiai Egyetem kutatói bemutatták, hogyan használható az AI…
A Meta a Microsofttal együttműködésben nyíltan közzéteszi a Llama 2 súlyait
A Facebook megjelentette a Llama 2-t, egy nagy teljesítményű nyelvi modellt. Jelenleg a Llama 2 a világ legképzettebb olyan nyelvi modellje, amelynek súlyai…
2023. július 29.
A Meta kiadta a Llama 2 nyílt forráskódú modellt, amely felülmúlja a korábbi LLM-eket
A Meta közzétette a Llama 2-t, nyílt forráskódú nagy nyelvi modelljének új verzióját, amely versenyképes teljesítményt nyújt a ChatGPT-vel és a Barddal…