MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2026. március 2.
Az AI javítja a kezdők teljesítményét a kettős felhasználású biológiai fegyverekkel kapcsolatos feladatokban
Az AI rendszerek segíthetnek a kezdőknek jobban teljesíteni a biológiai fegyverekkel kapcsolatos feladatokban, bár továbbra is meglehetősen ineffektívek, és…
Az LLM-ek alulmúlják az emberi teljesítményt az új játék benchmarkban
Az MIT, a Harvard, a Brit Kolumbiai Egyetem, a Princetoni Egyetem, a Cambridge-i Egyetem és a Valènciai Műszaki Egyetem kutatói létrehozták és kiadták az AI…
2026. február 26.
Claude biztonsági politikájával és katonai felhasználásával kapcsolatos konfliktusokkal néz szembe
Az Anthropic felülvizsgálta „felelős skálázási politikáját” (harmadik verzió), amely vitathatatlanul rugalmasabbá vált. Ez a változás potenciálisan lehetővé…
Claude bővíti funkcióit feladatütemezéssel, pluginokkal és távoli hozzáféréssel
Az Anthropic több új funkciót is bevezetett Claude AI-jához. A felhasználók mostantól közvetlenül a Claude Cowork-on belül ütemezhetnek feladatokat. Vállalati…
Az AI ügynökök emberihez hasonló számítógépes interakciós képességeket kapnak
Jelentős elmozdulás tapasztalható az AI fejlesztésében, az „ügynöki” eszközök egyre inkább lehetővé teszik az AI ügynökök számára, hogy emberihez hasonló módon…
A Google Labs felvásárolja a Producer AI-t, frissíti a Flow termékét
A Google Labs bejelentette a Producer AI, egy 2025 augusztusában indított zenegeneráló eszköz felvásárlását. A felvásárlás után a Producer AI mostantól a…
2026. február 24.
Claude Code frissítések: git, alkalmazás előnézet, biztonság
Claude Code frissítések – beépített támogatás a git worktree-khez párhuzamos ágensek számára, a CC desktop képes futó alkalmazások előnézetét megjeleníteni, és…
Az OpenAI Websocketjei és új beszéd-beszéd modellje
Websocketek a Responses API-ban – alacsony késleltetésű, hosszú ideig futó, intenzív eszközhívásokat használó ágensek számára. Emellett az OpenAI-nak van egy…
2026. február 23.
Az AI mérés kulcsfontosságú a hatékony politikához és kormányzáshoz
Jacob Steinhardt, egy AI kutató, egy nagyszerű blogbejegyzésben fejtette ki az AI rendszerek tulajdonságainak mérésére szolgáló technikai eszközökbe való…
Az LLM-ek agresszívebbek az embereknél a nukleáris háborús szimulációkban
A King’s College London egyik kutatója megvizsgálta, hogyan viselkedik három LLM – a GPT-5.2, a Claude Sonnet 4 és a Gemini 3 Flash – különböző szimulált…
Kína ForesightSafety Bench: Átfogó LLM biztonsági értékelés
Minden különbség ellenére Kína és az USA között, érdemes időnként belepillantani a két ország AI értékelési kultúrájába, és itt meglepő hasonlóságokra…
LABBench2: Az AI-nak hiányoznak a sokoldalú tudományos készségei a biológiai kutatáshoz
Az Edison Scientific AI startup, a University of California at Berkeley, a FutureHouse és a Broad Institute kutatói elkészítették és kiadták a LABBench2-t, egy…
2026. február 19.
Big Upgrade for Claude Sonnet, Developer Comms Controversy
Claude Sonnet 4.6 is out. It’s better than Opus 4.5 across most of the benchmarks and even surpasses Opus 4.6 in two categories: office tasks and financial…
Gemini Integrates Lyria 3 for Music Generation
Google's new music generation model Lyria 3 is now integrated in Gemini, and it can create music with lyrics based on your prompts, images or even videos. It…
2026. február 17.
Dreamer platform launches public beta for agentic app building
Hey folks, I’ve been running my own AI agent for a while now. It reads my emails, checks my calendar, manages my projects, and runs on a Mac Mini in my house…
Google's Gemini Deep Think 3 excels in academic benchmarks
Gemini Deep Think 3 - Based on Gemini 3 Pro, scores 84.6% on ARC-AGI 2 (vs 68.8% from Opus 4.6), available for Gemini Ultra subscribers, and that’s… it. They…
2026. február 16.
Közgazdász: Az „emberi érintés” menti meg az állásokat az AI automatizációtól
Közgazdász: Ne aggódjon az AI-vezérelt munkanélküliség miatt, mert az emberek szeretik megfizetni az „emberi érintést”:…Még akkor is, ha a technológia lehetővé…
A Meta felfedezi az új Kunlun ajánlórendszer skálázási törvényeit
A Kunlun egy újabb jó példa arra, hogy hogyan néz ki az ipari AI… A Facebook részleteket tett közzé a Kunlunról, egy ajánlórendszerről, amely hatékonyabb, mint…
Bostrom: Kövessük a szuperintelligenciát az emberi egészségért a kockázatok ellenére
A leállás vagy lassítás az exponenciális növekedés legvégén talán értelmes, de kockázatos… Nick Bostrom, egy tudós, aki sok embert bevezetett a…
AIRS-BENCH: AI ügynökök alapvető ML kutatási feladatokat végeznek
És számíthatunk arra, hogy a mai modellek sokkal jobbak lesznek ebben, mint amit a tanulmány sugall… A Meta, az Oxfordi Egyetem és a University College London…