MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Ai modellek

A(z) Ai modellek kategória legfrissebb mesterséges intelligencia hírei magyar nyelven.

73 hír ebben a kategóriában
Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez
Josef Chen és Kaikaku kiadta az Epicure-t, egy többnyelvű összetevő-beágyazó (ingredient-embedding) modellt, amelyet 4,1 millió recepten képeztek ki 7 nyelven,...
Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje
A Claude Mythos jelentős izgalmat vált ki, mint olyan modell, amelyről azt beszélik, olyan erőteljes, hogy az Anthropic vonakodik nyilvánosan kiadni. Bár...
Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt
Az Anthropic véletlenül közel 3000 publikálatlan dokumentumot tett közzé egy nem biztonságos CMS-adatbázis alapértelmezett beállítása miatt, felfedve egy új...
Az NVIDIA Nemotron-3 120B modellje nagy sebességgel fut helyi GPU-kon
Az NVIDIA kifejlesztette a 120 milliárd paraméteres Nemotron-3 AI modellt, amely a Mixture of Experts (MoE) technológiának köszönhetően olyan gyorsan fut, mint...
A MiniMax M2.7 önfejlesztő modell csúcskategóriás kódolási teljesítményt ér el alacsonyabb áron
A MiniMax kiadta az M2.7-et, egy olyan modellt, amely a tanítása során több mint 100 optimalizációs kört futtatott le saját magán, 56%-ot érve el a SWE-Bench...
Kiderült, hogy a Hunter Alpha nevű titokzatos, billió-paraméteres modell valójában a Xiaomi MiMo-V2-Pro-ja
A Xiaomi billió-paraméteres modellje, a MiMo-V2-Pro, egy hétig "Hunter Alpha" néven futott az OpenRouteren, és az egész fejlesztői közösség a DeepSeek-nek...
A Google kiadta a Gemini Embedding 2-t a multimodális adatleképezéshez
A Google megjelentette a Gemini Embedding 2-t, egy multimodális beágyazási (embedding) modellt, amely szöveget, képeket, videókat, hanganyagokat és PDF-eket...
Az OpenAI, a Google és az Alibaba gyorsabb és hatékonyabb kis AI modelleket indított el
Az elmúlt 24 órában három nagy szereplő is új modelleket mutatott be, amelyek a nyers intelligencia helyett a sebességre és a hatékonyságra összpontosítanak. A...
Az Alibaba kiadta a Qwen 3.5 nyílt súlyú modellt, amely felveszi a versenyt a GPT-5.2-vel és a Claude-dal
Az Alibaba megjelentette a Qwen 3.5-öt, egy ingyenes, nyílt súlyú modellt, amelyet arra terveztek, hogy közvetlenül versenyezzen az olyan piacvezetőkkel, mint...
A Logical Intelligence bemutatja a Konát, az első következtetésen alapuló energiamodellt
A jelenleg használt összes AI alkalmazás, a ChatGPT-től a Gemini-ig, a soron következő szó megjóslásával működik egy szekvenciában. Bár ez hatékony, Eve Bodnia...
Az OpenAI elindította a GPT-5.3-Codexet továbbfejlesztett érveléssel és autonóm építéssel
Az OpenAI bemutatta a GPT-5.3-Codexet, amely ötvözi a továbbfejlesztett kódolási teljesítményt az érvelési képességekkel, és 25 százalékkal gyorsabban fut. A...
Az Anthropic és az OpenAI ugyanazon a napon adta ki új zászlóshajó modelljeit
Közvetlen versenypiaci összecsapásban az Anthropic megjelentette a Claude Opus 4.6-ot, az OpenAI pedig a GPT-5.3-Codexet ugyanazon a napon. Mindkét vállalat az...
A ByteDance és az Alibaba jelentős AI modellbemutatókat tervez februárra
A vezető kínai technológiai óriások, a ByteDance és az Alibaba jelentős AI modellbemutatókra készülnek február közepén. Ezek a frissítések kiterjednek a...
A DeepSeek-OCR 2 az emberi logikai sorrendet utánozva javítja a dokumentumolvasást
A DeepSeek AI megjelentette a DeepSeek-OCR 2-t, egy továbbfejlesztett dokumentumolvasó rendszert, amely úgy értelmezi az oldalakat, ahogyan az emberek –...
Az IBM Granite 4.0 a hatékonyságra és a megbízható üzleti AI-ra összpontosít
Az IBM-nél dolgozó David Cox szerint az AI-t úgy kellene kezelni, mint az elektromosságot – unalmasnak, megbízhatónak és mindenütt jelenlévőnek kellene lennie,...
Az Arcee AI elindította a Trinity Large 400B Sparse MoE nyílt modellt
A Trinity Large egy 400 milliárd paraméteres sparse MoE (Mixture of Experts) modell, amely 2-3-szor gyorsabb a versenytársainál, mivel tokenenként csak 13...
Az IBM Granite 4.0 hibrid architektúrája megoldja az LLM memória- és késleltetési skálázási problémáit
Az IBM munkatársa, David Cox nemrég részletezte, hogyan használ a Granite 4.0 hibrid architektúrákat a KV cache (key value cache) probléma megoldására, ahol a...
A Pathway bemutatta az agy ihlette Baby Dragon Hatchling architektúrát a Transzformerek kiváltására
Zuzanna Stamirowska, a Pathway vezérigazgatója kutatást tett közzé az általa első „poszt-transzformer” frontier modellnek nevezett Baby Dragon Hatchlingről...
A MiniMax kiadta az M2.1 ágens alapú modellt a Claude költségének 10%-áért
A MiniMax megjelentette az M2.1-et, egy új, open-source ágens alapú modellt, amely a beszámolók szerint túlteljesíti az Anthropic Claude Sonnet 4.5-ös...
A Google kiadja a Gemini 3 Flash-t és átalakítja az AI árazási dinamikáját
A Gemini 3 Flash egy új modell, amelyet arra terveztek, hogy a felhasználást a korábbi generációk drága modelljeiről (mint a 2.5 Pro) terelje át, miközben...
Az OpenAI kiadta a GPT 5.2-t három teljesítményre optimalizált változattal
Az OpenAI megjelentette a GPT 5.2-t három változatban: instant, thinking és pro. A csekély verziószám-növekedés elrejti a GPT-5.1-hez képesti fejlődés valódi...
Az Anthropic kiadta a Claude Opus 4.5-öt rekorddöntő kódolási teljesítménnyel
Az Anthropic elindította új zászlóshajó modelljét, a Claude Opus 4.5-öt, amelyet úgy terveztek, hogy okosabb és gyorsabb legyen elődeinél. A modell az első...
A Google bemutatta a Gemini 3 Pro-t rekorddöntő látási képességekkel
Hivatalosan is elrajtolt a Gemini 3 Pro, amely a beszámolók szerint az iparági tesztek többségében legyőzi a GPT-5.1-et és a Claude 3.5 Sonnet-et, az SWE-Bench...
Az OpenAI és az xAI új modelleket adott ki a Gemini 3 kihívására
Válaszul a Google legújabb bejelentésére, az OpenAI és az xAI is bemutatta saját modellfrissítéseit, amelyek konkrét technikai munkafolyamatokat céloznak meg....
A Meta megjelentette a LeJePA-t, Yann LeCun AI-legenda utolsó tanulmányát
A Meta LeJePA-ja Yann LeCun utolsó kutatási hozzájárulása a távozása előtt. A tanulmány bizonyítja, hogy az izotróp Gauss-eloszlások matematikailag optimálisak...
Az OpenAI kiadta a GPT-5.1 Thinking és Instant modelleket
A GPT-5.1 kizárólag a ChatGPT-ben jelent meg, az API-hozzáférés később várható. Ez a kiadás két különálló modellt vezet be: a GPT-5.1-Thinking és a...
A rejtélyes Polaris Alpha modellről azt gyanítják, hogy egy GPT-5 variáns
Egy új, Polaris Alpha nevű modell jelent meg az OpenRouteren, olyan fejlett képességeket bemutatva, amelyek miatt sokan azt gyanítják, hogy az OpenAI készülő...
Kiszivárgott a Google Nano Banana 2 AI modellje, fejlett képgenerálást mutatva
A Google Nano Banana 2 AI képalkotó modellje állítólag kiszivárgott a Media.io platformon, fejlett képgenerálási képességeket mutatva be, mielőtt...
Az OpenAI nyílt súlyú safeguard modelleket adott ki és frissítette a Sorát
Az OpenAI két új, nyílt súlyú modellt jelentetett meg „gpt-oss-safeguard” néven. Ezek a gpt-oss modellek finomhangolt változatai, amelyek 20B és 120B...
A MiniMax M2 nyílt forráskódú modell az 5. legokosabb globálisan
A MiniMax nyílt forráskódúként adta ki M2 modelljét, lehetővé téve bármely API szolgáltató számára a futtatását. Az Artificial Analysis adatai szerint az M2...
A Cognition kiadta a speciális SWE-grep modelleket kódkereséshez
A Cognition két új speciális modellt tanított be, az SWE-grep-et és az SWE-grep-mini-t, amelyeket kifejezetten kódbázisokban való releváns kontextuskeresésre...
A Claude Sonnet 4.5 jelentős ugrást mutat a helyzettudatos viselkedés terén
A bizonyítékok folyamatosan érkeznek. Múlt hónapban elindítottuk a Sonnet 4.5-öt, amely kiváló a kódolásban és a hosszú távú ágens-alapú munkában. De ha...
Rejtélyes „Cheetah” modell jelent meg a Cursor IDE-ben, rendkívül gyors teljesítménnyel
Egy titokzatos „Cheetah” modell tűnt fel a Cursor IDE-ben. A felhasználók fedezték fel az új modellt a fejlesztői környezetükben, de látszólag senki sem tudja,...
Az Anthropic kiadta a Claude Sonnet 4.5-öt rekorddöntő programozási benchmark eredményekkel
Az Anthropic megjelentette a Claude Sonnet 4.5-öt, egy új modellt, amely megdönti a programozási benchmarkok rekordjait, és képes több mint 30 órán át tartó...
A DeepSeek hatékony új modellt indított, amely felével csökkenti az API költségeket
A DeepSeek bemutatta új zászlóshajó modelljét, a DeepSeek-V3.2-Exp-et, amely hosszabb kontextusablakkal, valamint kiemelkedő kódolási és érvelési képességekkel...
Az OpenAI elindította a GPT-5-Codexet a gyorsabb és pontosabb kódolásért
Az OpenAI kifejezetten kódolási feladatokra fejlesztett ki egy egyedi GPT-5 verziót, GPT-5-Codex néven. Bár a modell általános érvelésben nem lényegesen...
Kína két hatalmas, billió paraméteres AI modellt adott ki
Miközben az amerikai AI laborok egyre inkább elzárják csúcsmodelljeiket, a kínai Alibaba és Moonshot egyetlen hétvége alatt két egyedülálló, billió paraméteres...
Az OpenAI kiadta a GPT-Realtime modellt és frissítette az API-t
Az OpenAI bemutatta a gpt-realtime-ot, egy új, kifejezetten fejlesztőknek szánt speech-to-speech modellt. Az új modellel együtt a Realtime API is frissült:...
Az OpenAI új open-source modellt tesztel összetett tudományos promptokkal
Az OpenAI megkezdte egy vadonatúj open-source modell tesztelését, eltérve a korábbi, zárt forráskódú fejlesztésre fókuszáló stratégiájától. A kezdeti tesztek...
Az Anthropic kiadta a Claude Opus 4.1-et javított terminál-alapú kódolási teljesítménnyel
Az Anthropic megjelentette a Claude Opus 4.1-et, amely egy kisebb frissítés a korábbi Opus 4-hez képest, de jelentős javulást kínál a terminál-alapú...
A Google csendben megjelentette a Gemini 2.5 Deep Think-et az Ultra előfizetőknek
A Google csendben elérhetővé tette a Gemini 2.5 Deep Think modellt. Ez kizárólag a havi 250 dolláros Gemini Ultra csomag előfizetői számára érhető el, így még...
A Google elindítja a Kaggle Game Arenát a modellek logikai következtetésének tesztelésére
A Google a Kaggle-en keresztül indítja el a Game Arenát (RL környezeteket), ahol a modellek játékokban mérhetik össze tudásukat, elsőként sakkban. Ezeket a...
Pletykák a GPT-5, a Claude 4.1 és a Gemini közelgő megjelenéseiről
Ezen a héten több új bejelentés is várható. A híresztelések szerint az OpenAI nyílt súlyú (open-weight) modellje valószínűleg két méretben, 20b és 120b...
Az abu-dzabi TII kiadta a Falcon-H1 hibrid Attention-Mamba modellcsaládot
Az abu-dzabi Technology Innovation Institute (TII) kutatói kiadták a Falcon-H1-et, egy nyílt súlyú nagy nyelvi modell családot, amely a szabványos transformer...
Titokzatos GPT-5 variánsok tűntek fel az LM Arenán, kiemelkedő kódolási képességekkel
Hat rejtélyes modell – olyan nevekkel, mint „Zenith”, „Summit” és „Lobster” – jelent meg az LM Arenán a hétvégén. Az AI-közösség meggyőződése, hogy ezek a...
A Mistral kiadta a Voxtral hangalapú átíró modellcsaládot vállalati felhasználásra
A Voxtral, a Mistral új hangalapú átíró modellcsaládja megérdemli a figyelmet. Két változatban érkezik: 3B és 24B – a 3B-s változat kellemesen kicsi, így elfut...
A Moonshot AI Kimi K2-je a Claude 4-et hívja ki a kreatív írás területén
A Moonshot AI nagy feltűnést kelt az open-model világban a Kimi K2-vel, amely egy masszív, 1 billió paraméteres Mixture of Experts (MoE) modell. Bár még nem...
A Mistral kiadta a Magistral érvelő modellt, de elmarad a DeepSeek R1 mögött
A Mistral betanította első érvelő modelljét, a Magistral-t. A modell pontszámai megközelítik a DeepSeek „R1” modelljét, de a matematika és a kódolás fontos...
Az OpenAI megjelentette az o3-Pro gondolkodó modellt, és drasztikusan csökkentette az árakat
Az OpenAI hivatalosan is elindította az o3-Pro-t, az eddigi legmegbízhatóbb és legképzettebb következtetési modelljét, miközben a meglévő o3 modell árát...
Az OpenAI javította a GPT-4o személyiségproblémáit a túlzott behízelgésről szóló jelentések után
A 4o, a ChatGPT alapértelmezett modellje a múlt héten kapott egy frissítést, ami után elkezdett fűnek-fának behízelkedni. Az OpenAI egy...
Az Alibaba kiadta a Qwen3 nyílt súlyú modelljeit hibrid következtetési képességekkel
A Qwen új 30B MoE modellje a korai Claude 3.5 Sonnet-hez hasonló élményt nyújt. Tegnap jelent meg a Qwen3 nyílt súlyú modellcsaládja a szokásos Qwen csomaggal,...
Az Alibaba kiadta a Babel többnyelvű modelleket, amelyek a globális népesség 90%-át lefedik
Az Alibaba bemutatta a „Babel” nevezetű, két új, nyílt hozzáférésű nyelvi modellt, amelyeket 25 nyelv támogatására terveztek, és összesen mintegy 7 milliárd...
Az OpenAI bemutatta az o3 logikai modellt, amely új „szuperintelligencia” mérőszámokat ér el
Az OpenAI bemutatta legújabb logikai modelljét, az o3-at, amely elmozdulást jelent az egyszerű következő szó megjóslásától az összetett megoldás-generálási...
Az Amazon bemutatja a Nova AI modellcsaládot és az egyedi Trainium 2 chipeket
Az AWS AI-hírek sorozatát jelentette be a RE:Invent 2024 eseményen, többek között leleplezték a „Project Rainier”-t, amely egy több mint 100 000 Trainium 2...
A Tencent kiadta a Hunyuan-Large-ot, egy világszínvonalú kínai nyílt súlyú MoE modellt
A Tencent bemutatta a Hunyuan-Large-ot, egy 389 milliárd paraméteres (ebből 52 milliárd aktív) Mixture-of-Experts (MoE) modellt, amely jelenleg a világ legjobb...
A Meta kiadta a kvantált Llama 3.2 modelleket mobil eszközökre
A Meta megjelentette első kvantált Llama 3.2 modelljeit, tömörített 1B és 3B paraméteres verziókat kínálva, amelyeket okostelefonokon való natív futtatásra...
A Stability AI kiadta a Stable Diffusion 3.5-öt továbbfejlesztett testreszabási lehetőségekkel
A Stability AI bejelentette zászlóshajó open-source képgeneráló modelljének legújabb verzióját, a Stable Diffusion 3.5-öt. Ez a kiadás a promptok pontosságának...
A Google kiadta a Gemma nyílt modelleket, hogy versenybe szálljon a LLaMa-val és a Mistrallal
A Google megalkotta és közzétette a Gemma-t, két nyíltan hozzáférhető, kisméretű és nagy teljesítményű AI modellt. A legfontosabb újdonság, hogy a Gemma...
A Nomic AI kiadta a Nomic Embed-et, egy hosszú kontextusú, nyílt embedding modellt
A Nomic AI megjelentette a Nomic Embed-et, az első olyan open-source szöveges embedding modellt, amely hatalmas, 8 192 tokenes kontextusablakot támogat. A...
Az Abacus AI kiadta a Smaug-72B-t, amely túlszárnyalja a Claude 2-t és a GPT-3.5-öt
Az Abacus AI bejelentette a Smaug-72B megjelenését, egy új nyelvi modellt, amely jelentős mérföldkövet ért el: ez az első open-source modell, amely 80 feletti...
Az AI2 elindította az OLMo-t, a teljesen nyílt forráskódú, csúcskategóriás nyelvi modellt
Az Allen Institute for AI (AI2) közzétette az OLMo-t (Open Language Model), egy valóban nyílt forráskódú, 7 milliárd paraméteres modellt. Sok más „nyíltnak”...
CogAgent: Új látás-nyelvi modell az autonóm okostelefonos navigációhoz
A Tsinghua Egyetem és a Zhipu AI kutatói bemutatták a CogAgentet, egy korszerű látás-nyelvi modellt, amelyet kifejezetten a grafikus felhasználói felületeken...
A kínai 01.ai startup kiadta a nagy teljesítményű Yi nyílt hozzáférésű modellsorozatot
A kínai 01.ai startup közzétette a Yi modellsorozatot, amely jelenleg a világ legerősebb nyíltan hozzáférhető modelljei közé tartozik. A sorozat tartalmazza a...
Az OpenAI bejelentette a GPT-4 Turbo-t és az egyedi GPT-ket a DevDay-en
Az OpenAI megtartotta első fejlesztői konferenciáját, a DevDay-t, ahol jelentős frissítéseket mutatott be ökoszisztémájában. A legfontosabb bejelentés a GPT-4...
Elon Musk xAI-ja elindítja a Grok LLM-et valós idejű adathozzáféréssel
Az Elon Musk által alapított xAI mesterséges intelligencia vállalat hivatalosan is megjelentette a Grokot, a ChatGPT versenytársát. A cég szerint a Grokot úgy...
Az Adept kiadta a Fuyu-8B-t, egy kompakt multimodális modellt digitális ágensekhez
Az Adept bemutatta a Fuyu-8B-t, amelyet a világ legkisebb és leghatékonyabb, kifejezetten digitális ágensekhez tervezett multimodális modelljeként jellemeznek....
Az OpenAI bemutatja a DALL-E 3-at natív ChatGPT integrációval
Az OpenAI bejelentette a DALL-E 3-at, a legújabb képgeneráló modelljét, amelyet úgy terveztek, hogy a korábbi verzióknál lényegesen több árnyalatot és...
Az Adept kiadta a nagy teljesítményű, megengedő licencű Persimmon-8B nyelvi modellt
Az Adept AI startup kiadta a Persimmon-8B-t, amelyet „a 8B kategória legjobb, teljesen megengedő licencű modelljének” nevez. A modell 16 ezer tokenes...
A ChatGPT-4 továbbra is a piacvezető AI chatbot a növekvő konkurencia ellenére
A ChatGPT-4 olyan az AI világában, mint LeBron James. Persze, beszélnek a teljesítmény csökkenéséről, és igen, egyre nagyobb a verseny. De még mindig ebben a...
Az Inflection AI startup közzétette az Inflection-1 modell teljesítményének részleteit
Az Inflection AI startup közzétett néhány részletet az Inflection-1 nevű nyelvi modelljéről. Az Inflection egy viszonylag ismeretlen startup, amelynek...
A Stability AI kiadta a StableLM nyílt forráskódú nagy nyelvi modellcsaládot
A Stability AI, a nyílt forráskódú „Stable Diffusion” modellt világra bocsátó vállalat, megjelentetett egy 3 milliárd és egy 7 milliárd paraméteres nyelvi...
A Bloomberg kifejezetten pénzügyi feladatokra fejlesztette ki a BloombergGPT-t
A Bloomberg bemutatta a BloombergGPT-t, egy új AI modellt, amelyet kifejezetten pénzügyi feladatok kezelésére terveztek egy nemrég megjelent kutatási...
A Facebook LLaMa modelljének súlyai kiszivárogtak a BitTorrenten a korlátozott kiadás után
A Facebook létrehozta és részben közzétette a LLaMa-t, egy 7 milliárd és 65 milliárd közötti paraméterszámú nyelvi modellcsaládot, amely pariban van olyan...