AI modellek - MI Történik?

Epicure: Egy többnyelvű AI összetevő-beágyazó modell receptanalízishez

Josef Chen és Kaikaku kiadta az Epicure-t, egy többnyelvű összetevő-beágyazó (ingredient-embedding) modellt, amelyet 4,1 millió recepten képeztek ki 7 nyelven,...

eredeti forrás · 2026. május 28.

AI modellek

Claude Mythos: Az Anthropic állítólag rendkívül erős, még meg nem jelent AI modellje

A Claude Mythos jelentős izgalmat vált ki, mint olyan modell, amelyről azt beszélik, olyan erőteljes, hogy az Anthropic vonakodik nyilvánosan kiadni. Bár...

eredeti forrás · 2026. április 15.

AI modellek

Az Anthropic egy védetlen adatbázison keresztül szivárogtatta ki a nagy teljesítményű Claude Mythos modellt

Az Anthropic véletlenül közel 3000 publikálatlan dokumentumot tett közzé egy nem biztonságos CMS-adatbázis alapértelmezett beállítása miatt, felfedve egy új...

eredeti forrás · 2026. március 30.

AI modellek

Az NVIDIA Nemotron-3 120B modellje nagy sebességgel fut helyi GPU-kon

Az NVIDIA kifejlesztette a 120 milliárd paraméteres Nemotron-3 AI modellt, amely a Mixture of Experts (MoE) technológiának köszönhetően olyan gyorsan fut, mint...

eredeti forrás · 2026. március 19.

AI modellek

A MiniMax M2.7 önfejlesztő modell csúcskategóriás kódolási teljesítményt ér el alacsonyabb áron

A MiniMax kiadta az M2.7-et, egy olyan modellt, amely a tanítása során több mint 100 optimalizációs kört futtatott le saját magán, 56%-ot érve el a SWE-Bench...

eredeti forrás · 2026. március 19.

AI modellek

Kiderült, hogy a Hunter Alpha nevű titokzatos, billió-paraméteres modell valójában a Xiaomi MiMo-V2-Pro-ja

A Xiaomi billió-paraméteres modellje, a MiMo-V2-Pro, egy hétig "Hunter Alpha" néven futott az OpenRouteren, és az egész fejlesztői közösség a DeepSeek-nek...

eredeti forrás · 2026. március 19.

AI modellek

A Google kiadta a Gemini Embedding 2-t a multimodális adatleképezéshez

A Google megjelentette a Gemini Embedding 2-t, egy multimodális beágyazási (embedding) modellt, amely szöveget, képeket, videókat, hanganyagokat és PDF-eket...

eredeti forrás · 2026. március 11.

AI modellek

Az OpenAI, a Google és az Alibaba gyorsabb és hatékonyabb kis AI modelleket indított el

Az elmúlt 24 órában három nagy szereplő is új modelleket mutatott be, amelyek a nyers intelligencia helyett a sebességre és a hatékonyságra összpontosítanak. A...

eredeti forrás · 2026. március 4.

AI modellek

Az Alibaba kiadta a Qwen 3.5 nyílt súlyú modellt, amely felveszi a versenyt a GPT-5.2-vel és a Claude-dal

Az Alibaba megjelentette a Qwen 3.5-öt, egy ingyenes, nyílt súlyú modellt, amelyet arra terveztek, hogy közvetlenül versenyezzen az olyan piacvezetőkkel, mint...

eredeti forrás · 2026. február 17.

AI modellek

A Logical Intelligence bemutatja a Konát, az első következtetésen alapuló energiamodellt

A jelenleg használt összes AI alkalmazás, a ChatGPT-től a Gemini-ig, a soron következő szó megjóslásával működik egy szekvenciában. Bár ez hatékony, Eve Bodnia...

eredeti forrás · 2026. február 10.

AI modellek

Az OpenAI elindította a GPT-5.3-Codexet továbbfejlesztett érveléssel és autonóm építéssel

Az OpenAI bemutatta a GPT-5.3-Codexet, amely ötvözi a továbbfejlesztett kódolási teljesítményt az érvelési képességekkel, és 25 százalékkal gyorsabban fut. A...

eredeti forrás · 2026. február 9.

AI modellek

Az Anthropic és az OpenAI ugyanazon a napon adta ki új zászlóshajó modelljeit

Közvetlen versenypiaci összecsapásban az Anthropic megjelentette a Claude Opus 4.6-ot, az OpenAI pedig a GPT-5.3-Codexet ugyanazon a napon. Mindkét vállalat az...

eredeti forrás · 2026. február 6.

AI modellek

A DeepSeek-OCR 2 az emberi logikai sorrendet utánozva javítja a dokumentumolvasást

A DeepSeek AI megjelentette a DeepSeek-OCR 2-t, egy továbbfejlesztett dokumentumolvasó rendszert, amely úgy értelmezi az oldalakat, ahogyan az emberek –...

eredeti forrás · 2026. február 2.

AI modellek

A ByteDance és az Alibaba jelentős AI modellbemutatókat tervez februárra

A vezető kínai technológiai óriások, a ByteDance és az Alibaba jelentős AI modellbemutatókra készülnek február közepén. Ezek a frissítések kiterjednek a...

eredeti forrás · 2026. február 2.

AI modellek

Az IBM Granite 4.0 a hatékonyságra és a megbízható üzleti AI-ra összpontosít

Az IBM-nél dolgozó David Cox szerint az AI-t úgy kellene kezelni, mint az elektromosságot – unalmasnak, megbízhatónak és mindenütt jelenlévőnek kellene lennie,...

eredeti forrás · 2026. január 29.

AI modellek

Az Arcee AI elindította a Trinity Large 400B Sparse MoE nyílt modellt

A Trinity Large egy 400 milliárd paraméteres sparse MoE (Mixture of Experts) modell, amely 2-3-szor gyorsabb a versenytársainál, mivel tokenenként csak 13...

eredeti forrás · 2026. január 28.

AI modellek

Az IBM Granite 4.0 hibrid architektúrája megoldja az LLM memória- és késleltetési skálázási problémáit

Az IBM munkatársa, David Cox nemrég részletezte, hogyan használ a Granite 4.0 hibrid architektúrákat a KV cache (key value cache) probléma megoldására, ahol a...

eredeti forrás · 2026. január 16.

AI modellek

A Pathway bemutatta az agy ihlette Baby Dragon Hatchling architektúrát a Transzformerek kiváltására

Zuzanna Stamirowska, a Pathway vezérigazgatója kutatást tett közzé az általa első „poszt-transzformer” frontier modellnek nevezett Baby Dragon Hatchlingről...

eredeti forrás · 2026. január 6.

AI modellek

A MiniMax kiadta az M2.1 ágens alapú modellt a Claude költségének 10%-áért

A MiniMax megjelentette az M2.1-et, egy új, open-source ágens alapú modellt, amely a beszámolók szerint túlteljesíti az Anthropic Claude Sonnet 4.5-ös...

eredeti forrás · 2026. január 1.

AI modellek

A Google kiadja a Gemini 3 Flash-t és átalakítja az AI árazási dinamikáját

A Gemini 3 Flash egy új modell, amelyet arra terveztek, hogy a felhasználást a korábbi generációk drága modelljeiről (mint a 2.5 Pro) terelje át, miközben...

eredeti forrás · 2025. december 18.

AI modellek

Az OpenAI kiadta a GPT 5.2-t három teljesítményre optimalizált változattal

Az OpenAI megjelentette a GPT 5.2-t három változatban: instant, thinking és pro. A csekély verziószám-növekedés elrejti a GPT-5.1-hez képesti fejlődés valódi...

eredeti forrás · 2025. december 16.

AI modellek

Az Anthropic kiadta a Claude Opus 4.5-öt rekorddöntő kódolási teljesítménnyel

Az Anthropic elindította új zászlóshajó modelljét, a Claude Opus 4.5-öt, amelyet úgy terveztek, hogy okosabb és gyorsabb legyen elődeinél. A modell az első...

eredeti forrás · 2025. november 25.

AI modellek

A Google bemutatta a Gemini 3 Pro-t rekorddöntő látási képességekkel

Hivatalosan is elrajtolt a Gemini 3 Pro, amely a beszámolók szerint az iparági tesztek többségében legyőzi a GPT-5.1-et és a Claude 3.5 Sonnet-et, az SWE-Bench...

eredeti forrás · 2025. november 20.

AI modellek

Az OpenAI és az xAI új modelleket adott ki a Gemini 3 kihívására

Válaszul a Google legújabb bejelentésére, az OpenAI és az xAI is bemutatta saját modellfrissítéseit, amelyek konkrét technikai munkafolyamatokat céloznak meg....

eredeti forrás · 2025. november 20.

AI modellek

A Meta megjelentette a LeJePA-t, Yann LeCun AI-legenda utolsó tanulmányát

A Meta LeJePA-ja Yann LeCun utolsó kutatási hozzájárulása a távozása előtt. A tanulmány bizonyítja, hogy az izotróp Gauss-eloszlások matematikailag optimálisak...

eredeti forrás · 2025. november 16.

AI modellek

Az OpenAI kiadta a GPT-5.1 Thinking és Instant modelleket

A GPT-5.1 kizárólag a ChatGPT-ben jelent meg, az API-hozzáférés később várható. Ez a kiadás két különálló modellt vezet be: a GPT-5.1-Thinking és a...

eredeti forrás · 2025. november 13.

AI modellek

A rejtélyes Polaris Alpha modellről azt gyanítják, hogy egy GPT-5 variáns

Egy új, Polaris Alpha nevű modell jelent meg az OpenRouteren, olyan fejlett képességeket bemutatva, amelyek miatt sokan azt gyanítják, hogy az OpenAI készülő...

eredeti forrás · 2025. november 10.

AI modellek

Kiszivárgott a Google Nano Banana 2 AI modellje, fejlett képgenerálást mutatva

A Google Nano Banana 2 AI képalkotó modellje állítólag kiszivárgott a Media.io platformon, fejlett képgenerálási képességeket mutatva be, mielőtt...

eredeti forrás · 2025. november 10.

AI modellek

Az OpenAI nyílt súlyú safeguard modelleket adott ki és frissítette a Sorát

Az OpenAI két új, nyílt súlyú modellt jelentetett meg „gpt-oss-safeguard” néven. Ezek a gpt-oss modellek finomhangolt változatai, amelyek 20B és 120B...

eredeti forrás · 2025. október 30.

AI modellek

A MiniMax M2 nyílt forráskódú modell az 5. legokosabb globálisan

A MiniMax nyílt forráskódúként adta ki M2 modelljét, lehetővé téve bármely API szolgáltató számára a futtatását. Az Artificial Analysis adatai szerint az M2...

eredeti forrás · 2025. október 27.

AI modellek

A Cognition kiadta a speciális SWE-grep modelleket kódkereséshez

A Cognition két új speciális modellt tanított be, az SWE-grep-et és az SWE-grep-mini-t, amelyeket kifejezetten kódbázisokban való releváns kontextuskeresésre...

eredeti forrás · 2025. október 21.

AI modellek

A Claude Sonnet 4.5 jelentős ugrást mutat a helyzettudatos viselkedés terén

A bizonyítékok folyamatosan érkeznek. Múlt hónapban elindítottuk a Sonnet 4.5-öt, amely kiváló a kódolásban és a hosszú távú ágens-alapú munkában. De ha...

eredeti forrás · 2025. október 13.

AI modellek

Rejtélyes „Cheetah” modell jelent meg a Cursor IDE-ben, rendkívül gyors teljesítménnyel

Egy titokzatos „Cheetah” modell tűnt fel a Cursor IDE-ben. A felhasználók fedezték fel az új modellt a fejlesztői környezetükben, de látszólag senki sem tudja,...

eredeti forrás · 2025. október 6.

AI modellek

Az Anthropic kiadta a Claude Sonnet 4.5-öt rekorddöntő programozási benchmark eredményekkel

Az Anthropic megjelentette a Claude Sonnet 4.5-öt, egy új modellt, amely megdönti a programozási benchmarkok rekordjait, és képes több mint 30 órán át tartó...

eredeti forrás · 2025. szeptember 30.

AI modellek

A DeepSeek hatékony új modellt indított, amely felével csökkenti az API költségeket

A DeepSeek bemutatta új zászlóshajó modelljét, a DeepSeek-V3.2-Exp-et, amely hosszabb kontextusablakkal, valamint kiemelkedő kódolási és érvelési képességekkel...

eredeti forrás · 2025. szeptember 30.

AI modellek

Az OpenAI elindította a GPT-5-Codexet a gyorsabb és pontosabb kódolásért

Az OpenAI kifejezetten kódolási feladatokra fejlesztett ki egy egyedi GPT-5 verziót, GPT-5-Codex néven. Bár a modell általános érvelésben nem lényegesen...

eredeti forrás · 2025. szeptember 16.

AI modellek

Kína két hatalmas, billió paraméteres AI modellt adott ki

Miközben az amerikai AI laborok egyre inkább elzárják csúcsmodelljeiket, a kínai Alibaba és Moonshot egyetlen hétvége alatt két egyedülálló, billió paraméteres...

eredeti forrás · 2025. szeptember 8.

AI modellek

Az OpenAI kiadta a GPT-Realtime modellt és frissítette az API-t

Az OpenAI bemutatta a gpt-realtime-ot, egy új, kifejezetten fejlesztőknek szánt speech-to-speech modellt. Az új modellel együtt a Realtime API is frissült:...

eredeti forrás · 2025. szeptember 2.

AI modellek

Az OpenAI új open-source modellt tesztel összetett tudományos promptokkal

Az OpenAI megkezdte egy vadonatúj open-source modell tesztelését, eltérve a korábbi, zárt forráskódú fejlesztésre fókuszáló stratégiájától. A kezdeti tesztek...

eredeti forrás · 2025. augusztus 22.

AI modellek

Az Anthropic kiadta a Claude Opus 4.1-et javított terminál-alapú kódolási teljesítménnyel

Az Anthropic megjelentette a Claude Opus 4.1-et, amely egy kisebb frissítés a korábbi Opus 4-hez képest, de jelentős javulást kínál a terminál-alapú...

eredeti forrás · 2025. augusztus 7.

AI modellek

A Google csendben megjelentette a Gemini 2.5 Deep Think-et az Ultra előfizetőknek

A Google csendben elérhetővé tette a Gemini 2.5 Deep Think modellt. Ez kizárólag a havi 250 dolláros Gemini Ultra csomag előfizetői számára érhető el, így még...

eredeti forrás · 2025. augusztus 5.

AI modellek

A Google elindítja a Kaggle Game Arenát a modellek logikai következtetésének tesztelésére

A Google a Kaggle-en keresztül indítja el a Game Arenát (RL környezeteket), ahol a modellek játékokban mérhetik össze tudásukat, elsőként sakkban. Ezeket a...

eredeti forrás · 2025. augusztus 5.

AI modellek

Pletykák a GPT-5, a Claude 4.1 és a Gemini közelgő megjelenéseiről

Ezen a héten több új bejelentés is várható. A híresztelések szerint az OpenAI nyílt súlyú (open-weight) modellje valószínűleg két méretben, 20b és 120b...

eredeti forrás · 2025. augusztus 5.

AI modellek

Az abu-dzabi TII kiadta a Falcon-H1 hibrid Attention-Mamba modellcsaládot

Az abu-dzabi Technology Innovation Institute (TII) kutatói kiadták a Falcon-H1-et, egy nyílt súlyú nagy nyelvi modell családot, amely a szabványos transformer...

eredeti forrás · 2025. augusztus 4.

AI modellek

Titokzatos GPT-5 variánsok tűntek fel az LM Arenán, kiemelkedő kódolási képességekkel

Hat rejtélyes modell – olyan nevekkel, mint „Zenith”, „Summit” és „Lobster” – jelent meg az LM Arenán a hétvégén. Az AI-közösség meggyőződése, hogy ezek a...

eredeti forrás · 2025. július 28.

AI modellek

A Mistral kiadta a Voxtral hangalapú átíró modellcsaládot vállalati felhasználásra

A Voxtral, a Mistral új hangalapú átíró modellcsaládja megérdemli a figyelmet. Két változatban érkezik: 3B és 24B – a 3B-s változat kellemesen kicsi, így elfut...

eredeti forrás · 2025. július 17.

AI modellek

A Moonshot AI Kimi K2-je a Claude 4-et hívja ki a kreatív írás területén

A Moonshot AI nagy feltűnést kelt az open-model világban a Kimi K2-vel, amely egy masszív, 1 billió paraméteres Mixture of Experts (MoE) modell. Bár még nem...

eredeti forrás · 2025. július 15.

AI modellek

A Mistral kiadta a Magistral érvelő modellt, de elmarad a DeepSeek R1 mögött

A Mistral betanította első érvelő modelljét, a Magistral-t. A modell pontszámai megközelítik a DeepSeek „R1” modelljét, de a matematika és a kódolás fontos...

eredeti forrás · 2025. június 23.

AI modellek

Az OpenAI megjelentette az o3-Pro gondolkodó modellt, és drasztikusan csökkentette az árakat

Az OpenAI hivatalosan is elindította az o3-Pro-t, az eddigi legmegbízhatóbb és legképzettebb következtetési modelljét, miközben a meglévő o3 modell árát...

eredeti forrás · 2025. június 11.

AI modellek

Az OpenAI javította a GPT-4o személyiségproblémáit a túlzott behízelgésről szóló jelentések után

A 4o, a ChatGPT alapértelmezett modellje a múlt héten kapott egy frissítést, ami után elkezdett fűnek-fának behízelkedni. Az OpenAI egy...

eredeti forrás · 2025. április 29.

AI modellek

Az Alibaba kiadta a Qwen3 nyílt súlyú modelljeit hibrid következtetési képességekkel

A Qwen új 30B MoE modellje a korai Claude 3.5 Sonnet-hez hasonló élményt nyújt. Tegnap jelent meg a Qwen3 nyílt súlyú modellcsaládja a szokásos Qwen csomaggal,...

eredeti forrás · 2025. április 29.

AI modellek

Az Alibaba kiadta a Babel többnyelvű modelleket, amelyek a globális népesség 90%-át lefedik

Az Alibaba bemutatta a „Babel” nevezetű, két új, nyílt hozzáférésű nyelvi modellt, amelyeket 25 nyelv támogatására terveztek, és összesen mintegy 7 milliárd...

eredeti forrás · 2025. március 17.