MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2024. június 6.
A Google LLM-jei felnőtt szintű teljesítményt értek el a mentális állapotokra vonatkozó következtetésben
A Google kutatói a magasabb rendű tudatelméletet (theory of mind) vizsgálták a nagy nyelvi modellekben, és megállapították, hogy a GPT-4 és a Flan-PaLM képes…
A Mobile-Agent-v2 30%-kal javítja az autonóm feladatvégzést a telefonokon
Kutatók open-source szoftverként közzétették a Mobile-Agent-v2-t, egy többágensű (multi-agent) architektúrát, amelyet mobilkészülékek autonóm vezérlésére…
A Jina AI kiadta a Jina CLIP v1 nyílt forráskódú multimodális embedding modelljét
A Jina AI megjelentette a Jina CLIP v1-et, egy új multimodális embedding modellt, amely jelentősen felülmúlja az eredeti OpenAI CLIP modellt. Kiválóan teljesít…
A ByteDance Seed-TTS az embertől megkülönböztethetetlen beszédet generál érzelmi kontrollal
A ByteDance bemutatta a Seed-TTS-t, egy új Text-to-Speech modellcsaládot, amely gyakorlatilag az emberi hangtól megkülönböztethetetlen beszédet képes…
A Stability AI kiadta a Stable Audio Opent a kiváló minőségű hanggeneráláshoz
A Stability AI megjelentette a Stable Audio Opent, egy open-source modellt, amely kiváló minőségű hangmintákat és hangeffekteket generál egyszerű szöveges…
2024. június 3.
GPT-2 visszatekintés: Az AI skálázási és biztonsági előrejelzéseinek öt éve
Öt évvel ezelőtt az OpenAI kutatói kifejlesztették a GPT-2-t, egy nyelvi modellt, amely bemutatta a "skálázási törvények" (Scaling Laws) korai hatásait. A…
A központosított hatalom és a szabályozási túllépés kockázatai az AI irányelvekben
Az AI irányelvekben bekövetkezett legutóbbi változások az agresszív szabályozási ötletek felé mozdultak el, mint például az AI rendszerek fejlesztéséhez…
A szisztematikus monitorozás és a harmadik fél általi AI mérés mellett szóló érvek
A központosított engedélyeztetéssel szembeni szkepticizmus ellenére továbbra is erős érvek szólnak amellett, hogy a kormányoknak szisztematikusan figyelemmel…
2024. június 2.
Az OpenAI bemutatta a GPT-4o multimodális modellt valós idejű interaktivitással
Az OpenAI bemutatta a GPT-4o-t, egy élvonalbeli multimodális modellt, amely szöveget, látványt és hangot is feldolgoz, a GPT-4 Turbo-hoz képest kiváló…
A Google bejelentette a Gemini 1.5 Pro-t 2 millió tokenes kontextusablakkal
A Google I/O 2024 konferencián a Google leleplezte a Gemini 1.5 Pro-t, amely immár kétmillió tokenig bővített kontextusablakkal büszkélkedhet, valamint a…
A Microsoft bemutatja a Copilot+ PC-ket és az autonóm AI ágenseket
A Microsoft bemutatta a Copilot+ PC-ket, az AI-optimalizált Windows eszközök új kategóriáját, amelyek fejlett chipekkel és egész napos akkumulátor-üzemidővel…
Az Anthropic kutatása feltérképezi a koncepciókat az LLM neurális hálózatokon belül
Az Anthropic részletes tanulmányt tett közzé, amely betekintést nyújt az LLM-ek „agyába”, bemutatva, hogyan jelenik meg több millió fogalom – például a nemek,…
A Google és a Microsoft új nyílt forráskódú kisméretű nyelvi modelleket jelentett be
A Microsoft nyílt forráskódúvá tette az új Phi-3 modelleket, beleértve egy 7B, 14B és egy új, látási képességekkel rendelkező multimodális variánst, 128k…
2024. május 30.
A Mistral kiadta a Codestral 22B kódoló modellt, amely több mint 80 nyelvet támogat
A Mistral megjelentette a Codestralt, az első olyan nagy nyelvi modelljét, amelyet kifejezetten kódgenerálási feladatokra terveztek. Ez a modell egy nyílt…
MiniCPM-Llama3-V 2.5: Az eszközön futó multimodális modell felveszi a versenyt a GPT-4V teljesítményével
Kutatók kiadták a MiniCPM-Llama3-V 2.5-öt, egy 8B paraméteres multimodális modellt, amely az összesített teljesítményben vetekszik az olyan saját tulajdonú…
Az AutoCoder felülmúlja a GPT-4 Turbót a Human Eval kódolási teljesítménymérésen
Kutatók bemutatták az AutoCoder-t, egy új kódoló modellt, amelyet az automatizált programozás határainak feszegetésére terveztek. Ez az első kódoló modell,…
A HippoRAG keretrendszer akár 20 százalékkal növeli a RAG hatékonyságát
Kutatók bemutatták a HippoRAG-et, egy újszerű keresési keretrendszert, amely jelentősen javítja a nagy nyelvi modellek képességét az új információk…
Elindult a FinRobot open-source platform specializált pénzügyi AI ágensekkel
Az AI4Finance Foundation bemutatta a FinRobot-ot, egy open-source platformot, amelyet speciális pénzügyi AI ágensek tárolására és telepítésére terveztek.…
A Cover Agent automatizálja a tesztgenerálást a szoftvercsomagok minőségének javítása érdekében
A Cover Agent egy új open-source csomag, amelyet arra terveztek, hogy automatikusan generáljon megfelelő teszteket a meglévő szoftverteszt-készletek…
2024. május 27.
A Berkeley kutatói speciális, kínai katonai hajók célzására szolgáló AI adatkészletet fedeztek fel
Az UC Berkeley kutatói egy „Zhousidun” (fordítása: „Zeusz pajzsa”) nevű kínai adatkészletet találtak a Roboflow-n, egy gépi tanulási (ML) adatokat és…