A Beijing Academy of AI és más intézmények kutatói létrehozták a CMMU-t, a Massive Multi-discipline Multimodal Understanding (MMMU) benchmark kínai változatát.…
2024. február 5.
A Microsoft a Project Silica nevű projekt keretében bemutatott egy módszert a hosszú távú adattárolásra üvegkorongokon a szalagos tárolás helyett. A Silica egy…
A Turing-díjas AI-úttörő, Yoshua Bengio szerint a kormányoknak milliárd dolláros szuperszámítógépekbe kellene fektetniük az AI rendszerek fejlesztésének és…
A Google nemrégiben nyelvi modelleket kezdett használni a C/C++, Java és Go kódjaiban található hibák felderítésére és kiszűrésére. Az eredmények biztatóak: a…
2024. február 4.
Kutatás
Az Anthropic közzétett egy tanulmányt, amely feltárja, hogy az LLM-ek képesek olyan megtévesztő viselkedéseket tanulni és megtartani, amelyeket nehéz kiirtani…
Ipari bejelentések
A Rabbit bemutatta az R1-et, egy 199 dolláros, önálló AI eszközt, amely hangvezérléssel és egyedi szoftveres alapokkal rendelkezik. Az eszköz egy Large Action…
Ipari bejelentések
Az OpenAI új, kiváló teljesítményű és kedvezőbb árú embedding modelleket jelentett be. Ezekkel a frissítésekkel párhuzamosan a vállalat csökkentette a GPT-3.5…
NYÍLT FORRÁSKÓD
Az RWKV megjelentette az Eagle 7B modellt, amely egy nem-transzformer alapú, többnyelvű nyelvi modell, és kihívást intéz a transzformer architektúrák…
NYÍLT FORRÁSKÓD
A Meta közzétette nagy teljesítményű kódoló nyelvi modellje, a Code Llama 70B verzióját, ami jelentős mérföldkő a nyílt súlyú fejlesztői eszközök számára. Ez a…
NYÍLT FORRÁSKÓD
Januárban jelentős előrelépés történt a multimodális AI területén olyan modellek megjelenésével, amelyek képesek képek értelmezésére és dokumentumok…
2024. január 29.
Researchers with Indiana University Bloomington have done a neat study where they compare how well a transformer-based computer vision system can learn basic…
Az amerikai kormány Frontier szuperszámítógépe ezermilliárd paraméteres AI modell tanítását teszteli
Researchers with Oak Ridge National Laboratory and the Universite Paris-Saclay have tried to train large-scale language models on the world’s most powerful…
The UK’s National Cyber Security Centre (NCSC) has produced a threat report on the impact of AI on cybersecurity and the results are roughly what you’d expect…
Security firm Trail of Bits has looked at how secure LLM sessions running on GPUs are and found that for some GPUs it’s possible for a hacker to be able to…
2024. január 27.
AI BIZTONSÁG
A nyelvi modellek és az azokkal működő alkalmazások feltörése egy végtelen tánc a védelmi mechanizmusok bevetése és az egyre zseniálisabb támadók között.…
AI BIZTONSÁG
A fejlesztőknek úgy kell megtervezniük az LLM alkalmazásokat, hogy feltételezik: a sikeres eltérítés elkerülhetetlen. Ez robusztus hozzáférés-szabályozást és…
AI BIZTONSÁG
A rendszerszintű prompt szivárgásának észlelésére és megelőzésére a fejlesztők az adatbiztonságból ismert „kanári szó” (canary word) koncepcióját…
2024. január 22.
AI RESEARCH
A Google DeepMind kutatói megalkották az AlphaGeometry-t, „egy tételbizonyítót az euklideszi síkgeometriához, amely megkerüli az emberi bemutatók…
AI HARDWARE
Az Intel kutatói olyan szoftvert készítettek, amely optimalizálja a nagy nyelvi modellek (LLM) inferenciáját az Intel GPU-kon. Konkrétan egy olyan LLM…
AI IMPACT
Az Amazon kutatói felfedezték, hogy az olcsó és bőségesen elérhető gépi fordítás rontja a kevés erőforrással rendelkező nyelvekhez (low-resource languages)…