MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2023. szeptember 18.
Az Adept kiadta a nagy teljesítményű, megengedő licencű Persimmon-8B nyelvi modellt
Az Adept AI startup kiadta a Persimmon-8B-t, amelyet „a 8B kategória legjobb, teljesen megengedő licencű modelljének” nevez. A modell 16 ezer tokenes…
Megerősítéses tanuláson alapuló drónrendszer győzte le a profi emberi pilótákat a versenyzésben
Egy autonóm AI-rendszer által irányított drón legyőzte az emberi pilótákat egy profi szintű, belső nézetű (FPV) drónversenyen, ami jelentős mérföldkő a „való…
Bolygóméretű, szintetikus szuperintelligenciát befogadó szuperszámítógépek elméleti fizikája
Anders Sandberg közzétett egy tanulmányt „The Physics of Information Processing Superobjects: Daily Life Among the Jupiter Brains” címmel, amely a bolygóméretű…
Az Imbue 200 millió dolláros B-sorozatú tőkebevonást hajtott végre érvelésalapú AI-ágensek fejlesztésére
Az Imbue, korábbi nevén Generally Intelligent, 200 millió dollárt gyűjtött össze egy B-sorozatú finanszírozási körben olyan praktikus AI-ágensek építésére,…
2023. szeptember 10.
A Meta kiadta a Code Llama-t, elindítva a kódoló modellek új hullámát
A Meta megjelentette a Code Llama-t, egy élvonalbeli modellt, amely a Llama 2-re épül, és kifejezetten kódgenerálásra, valamint kóddal kapcsolatos…
A Falcon 180B új mércét állít fel a legnagyobb nyílt forráskódú LLM-ként
A TII kiadta a Falcon 180B-t, amely jelenleg a valaha volt legnagyobb nyílt forráskódú nyelvi modell. 3,5 billió tokenen tanították, és jelentős ugrást jelent…
A Meta speciális multimodális eszközöket indít OCR-hez és fordításhoz
A nyelvi modelleken túl a Meta AI egy sor olyan multimodális eszközt mutatott be, amelyeket komplex vizuális és hangalapú feladatok kezelésére terveztek. Ide…
A Google Research szerint az AI-visszajelzés megegyezik az emberi teljesítménnyel az RLHF-ben
A Google kutatói tanulmányt tettek közzé az AI-visszajelzésen alapuló megerősítéses tanulásról (RLAIF), amely kimutatta, hogy az azonos szinten teljesít, mint…
Az autonóm ágensek és szimulációs környezetek a kereskedelmi felhasználás felé mozdulnak el
Augusztusban megugrott az autonóm AI ágensekhez és szimulált környezetekhez készült keretrendszerek száma. A Stanford nyílt forráskódúvá tette befolyásos…
2023. szeptember 7.
A Meta publikálta a Code Llama tanításáról és értékeléséről szóló technikai dokumentációt
A Meta egy átfogó kutatási jelentést tett közzé, amely részletezi a Code Llama fejlesztését. A dokumentum mély betekintést nyújt a modell tanítási folyamatába…
2023. szeptember 5.
Az Andreessen Horowitz nyílt forráskódú AI támogatási programot indít
A neves kockázati tőkealap-kezelő firm, az Andreessen Horowitz bejelentette az „a16z Open Source AI Grant programot”, amelynek célja, hogy finanszírozást…
Az Egyesült Királyság kormánya vázolja a közelgő AI Biztonsági Csúcstalálkozó célkitűzéseit
Az év későbbi szakaszában az Egyesült Királyság kormánya egy az AI biztonságának szentelt csúcstalálkozót fog rendezni. „Az AI Biztonsági Csúcstalálkozó…
Biztonsági kockázatok és védekezési mechanizmusok azonosítása a generatív AI rendszerekben
Milyen fenyegetéseket hordoznak a generatív AI rendszerek, és hogyan védekezhetünk ellenük vagy enyhíthetjük azokat? Ez a témája egy új tanulmánynak, amely egy…
Az Oxfordi kutatók GPU-gyorsított tőzsdei komponens-szimulátort építettek
Az Oxfordi Egyetem kutatói megalkották a JAX-LOB-ot, egy szoftvert, amely egy limitáras ajánlati könyv (limit order book - LOB) szimulálására szolgál GPU-n. A…
Az Alibaba kiadta a Qwen-VL Frontier nagy vizuális-nyelvi modellt
Az Alibaba Group kutatói megépítették a Qwen-VL-t, egy nyelvi modellt, amely képes képek elemzésére. Betanították a Qwen-VL-Chat-et is, amelyet úgy hangoltak,…
2023. augusztus 28.
A Meta kiadta a programozásra tervezett Code Llama nagy nyelvi modellcsaládot
A Facebook megépítette és közzétette a Code Llama-t, a kódolásra tervezett nagy nyelvi modellek családját. A modellek támogatják a Python, C++, Java, PHP,…
2023. augusztus 20.
Érvek a központosított LLM multiprocesszor API-réteg mellett
Sahar Mor a fizetési iparágból merít párhuzamot, és feltérképezi a nyelvi modellekhez szánt „multiprocesszor” koncepcióját. Olyan nagyvállalatok, mint az Uber…
2023. augusztus 14.
Javasolt felügyeleti irányelvek a szövetségi kormány AI finanszírozásához
A Center for Democracy & Technology útmutatót adott ki a szövetségi kormány számára az AI-rendszerek finanszírozásának és beszerzésének szigorúbb…
2023. augusztus 6.
Alapvető open-source repository-k, amiket minden generatív AI fejlesztőnek ismernie kell
Sok Large Language Model (LLM) területen dolgozó fejlesztő gyakran túl későn ébred rá, hogy léteznek már olyan open-source könyvtárak azokhoz a funkciókhoz,…
2023. július 31.
A SciBench egyetemi szintű tudományos problémamegoldás alapján értékeli a nyelvi modelleket
Az UCLA és a University of Washington kutatói létrehozták a SciBench-et, egy adatkészletet és benchmarkot annak tesztelésére, hogy a nyelvi modellek mennyire…