MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2024. február 5.
Kínai kutatók kifejlesztették a CMMU multimodális érvelési benchmarkot
A Beijing Academy of AI és más intézmények kutatói létrehozták a CMMU-t, a Massive Multi-discipline Multimodal Understanding (MMMU) benchmark kínai változatát.…
A Microsoft Project Silica projektje 1000 évig tárolja a digitális adatokat üvegben
A Microsoft a Project Silica nevű projekt keretében bemutatott egy módszert a hosszú távú adattárolásra üvegkorongokon a szalagos tárolás helyett. A Silica egy…
Yoshua Bengio sürgeti a kormányokat, hogy építsenek milliárd dolláros állami szuperszámítógépeket
A Turing-díjas AI-úttörő, Yoshua Bengio szerint a kormányoknak milliárd dolláros szuperszámítógépekbe kellene fektetniük az AI rendszerek fejlesztésének és…
A Google a Gemini LLM-et használja a szoftversebezhetőségek automatikus javítására
A Google nemrégiben nyelvi modelleket kezdett használni a C/C++, Java és Go kódjaiban található hibák felderítésére és kiszűrésére. Az eredmények biztatóak: a…
2024. február 4.
Az Anthropic kutatása szerint az LLM-ek képesek megtartani a titkos megtévesztő viselkedésformákat
Az Anthropic közzétett egy tanulmányt, amely feltárja, hogy az LLM-ek képesek olyan megtévesztő viselkedéseket tanulni és megtartani, amelyeket nehéz kiirtani…
A Rabbit bemutatja az R1 kézi eszközt, amelyet Large Action Model hajt meg
A Rabbit bemutatta az R1-et, egy 199 dolláros, önálló AI eszközt, amely hangvezérléssel és egyedi szoftveres alapokkal rendelkezik. Az eszköz egy Large Action…
Az OpenAI csökkenti a GPT-3.5 árait és frissíti a GPT-4 Turbo előnézetét
Az OpenAI új, kiváló teljesítményű és kedvezőbb árú embedding modelleket jelentett be. Ezekkel a frissítésekkel párhuzamosan a vállalat csökkentette a GPT-3.5…
Az RWKV kiadta az Eagle 7B nem-transzformer modellt, amely a SOTA teljesítménnyel vetekszik
Az RWKV megjelentette az Eagle 7B modellt, amely egy nem-transzformer alapú, többnyelvű nyelvi modell, és kihívást intéz a transzformer architektúrák…
A Meta nyílt forráskódúvá tette a Code Llama 70B modellt összetett kódolási feladatokhoz
A Meta közzétette nagy teljesítményű kódoló nyelvi modellje, a Code Llama 70B verzióját, ami jelentős mérföldkő a nyílt súlyú fejlesztői eszközök számára. Ez a…
Az Alibaba kiadta a Qwen-VL-Max vision modellt, amely felveszi a versenyt a zárt forráskódú SOTA modellekkel
Januárban jelentős előrelépés történt a multimodális AI területén olyan modellek megjelenésével, amelyek képesek képek értelmezésére és dokumentumok…
2024. január 29.
A Vision Transformerek felveszik a versenyt az újszülött csibék tanulási hatékonyságával a felismerésben
Researchers with Indiana University Bloomington have done a neat study where they compare how well a transformer-based computer vision system can learn basic…
Az amerikai kormány Frontier szuperszámítógépe ezermilliárd paraméteres AI modell tanítását teszteli
Researchers with Oak Ridge National Laboratory and the Universite Paris-Saclay have tried to train large-scale language models on the world’s most powerful…
A brit Nemzeti Kiberbiztonsági Központ figyelmeztet: az AI fokozni fogja a kibertámadások hatását
The UK’s National Cyber Security Centre (NCSC) has produced a threat report on the impact of AI on cybersecurity and the results are roughly what you’d expect…
Hackerek olvashatják az LLM kimeneteket a GPU memóriasebezhetőségein keresztül
Security firm Trail of Bits has looked at how secure LLM sessions running on GPUs are and found that for some GPUs it’s possible for a hacker to be able to…
2024. január 27.
7 módszer az LLM alkalmazások védelmére a prompt injection és jailbreak támadások ellen
A nyelvi modellek és az azokkal működő alkalmazások feltörése egy végtelen tánc a védelmi mechanizmusok bevetése és az egyre zseniálisabb támadók között.…
Hozzáférés-szabályozás és elkerítés bevezetése a nagy tétű LLM műveletekhez
A fejlesztőknek úgy kell megtervezniük az LLM alkalmazásokat, hogy feltételezik: a sikeres eltérítés elkerülhetetlen. Ez robusztus hozzáférés-szabályozást és…
Kanári szavak és válaszelemzés használata a prompt szivárgás megelőzésére
A rendszerszintű prompt szivárgásának észlelésére és megelőzésére a fejlesztők az adatbiztonságból ismert „kanári szó” (canary word) koncepcióját…
2024. január 22.
A Google DeepMind AlphaGeometry-je megoldja a Nemzetközi Matematikai Diákolimpia geometriai feladatait
A Google DeepMind kutatói megalkották az AlphaGeometry-t, „egy tételbizonyítót az euklideszi síkgeometriához, amely megkerüli az emberi bemutatók…
Az Intel optimalizált inferencia-stacket fejlesztett LLM-ekhez adatközponti GPU-kon
Az Intel kutatói olyan szoftvert készítettek, amely optimalizálja a nagy nyelvi modellek (LLM) inferenciáját az Intel GPU-kon. Konkrétan egy olyan LLM…
A gyenge minőségű gépi fordítás dominálja a kevés erőforrással rendelkező nyelvek webes tartalmait
Az Amazon kutatói felfedezték, hogy az olcsó és bőségesen elérhető gépi fordítás rontja a kevés erőforrással rendelkező nyelvekhez (low-resource languages)…