Josef Chen és Kaikaku kiadta az Epicure-t, egy többnyelvű összetevő-beágyazó (ingredient-embedding) modellt, amelyet 4,1 millió recepten képeztek ki 7 nyelven,...
Ai modellek
A(z) Ai modellek kategória legfrissebb mesterséges intelligencia hírei magyar nyelven.
73 hír ebben a kategóriában
Ai modellek
Ai modellek
A Claude Mythos jelentős izgalmat vált ki, mint olyan modell, amelyről azt beszélik, olyan erőteljes, hogy az Anthropic vonakodik nyilvánosan kiadni. Bár...
Ai modellek
Az Anthropic véletlenül közel 3000 publikálatlan dokumentumot tett közzé egy nem biztonságos CMS-adatbázis alapértelmezett beállítása miatt, felfedve egy új...
Ai modellek
Az NVIDIA kifejlesztette a 120 milliárd paraméteres Nemotron-3 AI modellt, amely a Mixture of Experts (MoE) technológiának köszönhetően olyan gyorsan fut, mint...
Ai modellek
A MiniMax kiadta az M2.7-et, egy olyan modellt, amely a tanítása során több mint 100 optimalizációs kört futtatott le saját magán, 56%-ot érve el a SWE-Bench...
Ai modellek
A Xiaomi billió-paraméteres modellje, a MiMo-V2-Pro, egy hétig "Hunter Alpha" néven futott az OpenRouteren, és az egész fejlesztői közösség a DeepSeek-nek...
Ai modellek
A Google megjelentette a Gemini Embedding 2-t, egy multimodális beágyazási (embedding) modellt, amely szöveget, képeket, videókat, hanganyagokat és PDF-eket...
Ai modellek
Az elmúlt 24 órában három nagy szereplő is új modelleket mutatott be, amelyek a nyers intelligencia helyett a sebességre és a hatékonyságra összpontosítanak. A...
Ai modellek
Az Alibaba megjelentette a Qwen 3.5-öt, egy ingyenes, nyílt súlyú modellt, amelyet arra terveztek, hogy közvetlenül versenyezzen az olyan piacvezetőkkel, mint...
Ai modellek
A jelenleg használt összes AI alkalmazás, a ChatGPT-től a Gemini-ig, a soron következő szó megjóslásával működik egy szekvenciában. Bár ez hatékony, Eve Bodnia...
Ai modellek
Az OpenAI bemutatta a GPT-5.3-Codexet, amely ötvözi a továbbfejlesztett kódolási teljesítményt az érvelési képességekkel, és 25 százalékkal gyorsabban fut. A...
Ai modellek
Közvetlen versenypiaci összecsapásban az Anthropic megjelentette a Claude Opus 4.6-ot, az OpenAI pedig a GPT-5.3-Codexet ugyanazon a napon. Mindkét vállalat az...
Ai modellek
A vezető kínai technológiai óriások, a ByteDance és az Alibaba jelentős AI modellbemutatókra készülnek február közepén. Ezek a frissítések kiterjednek a...
Ai modellek
A DeepSeek AI megjelentette a DeepSeek-OCR 2-t, egy továbbfejlesztett dokumentumolvasó rendszert, amely úgy értelmezi az oldalakat, ahogyan az emberek –...
Ai modellek
Az IBM-nél dolgozó David Cox szerint az AI-t úgy kellene kezelni, mint az elektromosságot – unalmasnak, megbízhatónak és mindenütt jelenlévőnek kellene lennie,...
Ai modellek
A Trinity Large egy 400 milliárd paraméteres sparse MoE (Mixture of Experts) modell, amely 2-3-szor gyorsabb a versenytársainál, mivel tokenenként csak 13...
Ai modellek
Az IBM munkatársa, David Cox nemrég részletezte, hogyan használ a Granite 4.0 hibrid architektúrákat a KV cache (key value cache) probléma megoldására, ahol a...
Ai modellek
Zuzanna Stamirowska, a Pathway vezérigazgatója kutatást tett közzé az általa első „poszt-transzformer” frontier modellnek nevezett Baby Dragon Hatchlingről...
Ai modellek
A MiniMax megjelentette az M2.1-et, egy új, open-source ágens alapú modellt, amely a beszámolók szerint túlteljesíti az Anthropic Claude Sonnet 4.5-ös...
Ai modellek
A Gemini 3 Flash egy új modell, amelyet arra terveztek, hogy a felhasználást a korábbi generációk drága modelljeiről (mint a 2.5 Pro) terelje át, miközben...
Ai modellek
Az OpenAI megjelentette a GPT 5.2-t három változatban: instant, thinking és pro. A csekély verziószám-növekedés elrejti a GPT-5.1-hez képesti fejlődés valódi...
Ai modellek
Az Anthropic elindította új zászlóshajó modelljét, a Claude Opus 4.5-öt, amelyet úgy terveztek, hogy okosabb és gyorsabb legyen elődeinél. A modell az első...
Ai modellek
Hivatalosan is elrajtolt a Gemini 3 Pro, amely a beszámolók szerint az iparági tesztek többségében legyőzi a GPT-5.1-et és a Claude 3.5 Sonnet-et, az SWE-Bench...
Ai modellek
Válaszul a Google legújabb bejelentésére, az OpenAI és az xAI is bemutatta saját modellfrissítéseit, amelyek konkrét technikai munkafolyamatokat céloznak meg....
Ai modellek
A Meta LeJePA-ja Yann LeCun utolsó kutatási hozzájárulása a távozása előtt. A tanulmány bizonyítja, hogy az izotróp Gauss-eloszlások matematikailag optimálisak...
Ai modellek
A GPT-5.1 kizárólag a ChatGPT-ben jelent meg, az API-hozzáférés később várható. Ez a kiadás két különálló modellt vezet be: a GPT-5.1-Thinking és a...
Ai modellek
Egy új, Polaris Alpha nevű modell jelent meg az OpenRouteren, olyan fejlett képességeket bemutatva, amelyek miatt sokan azt gyanítják, hogy az OpenAI készülő...
Ai modellek
A Google Nano Banana 2 AI képalkotó modellje állítólag kiszivárgott a Media.io platformon, fejlett képgenerálási képességeket mutatva be, mielőtt...
Ai modellek
Az OpenAI két új, nyílt súlyú modellt jelentetett meg „gpt-oss-safeguard” néven. Ezek a gpt-oss modellek finomhangolt változatai, amelyek 20B és 120B...
Ai modellek
A MiniMax nyílt forráskódúként adta ki M2 modelljét, lehetővé téve bármely API szolgáltató számára a futtatását. Az Artificial Analysis adatai szerint az M2...
Ai modellek
A Cognition két új speciális modellt tanított be, az SWE-grep-et és az SWE-grep-mini-t, amelyeket kifejezetten kódbázisokban való releváns kontextuskeresésre...
Ai modellek
A bizonyítékok folyamatosan érkeznek. Múlt hónapban elindítottuk a Sonnet 4.5-öt, amely kiváló a kódolásban és a hosszú távú ágens-alapú munkában. De ha...
Ai modellek
Egy titokzatos „Cheetah” modell tűnt fel a Cursor IDE-ben. A felhasználók fedezték fel az új modellt a fejlesztői környezetükben, de látszólag senki sem tudja,...
Ai modellek
Az Anthropic megjelentette a Claude Sonnet 4.5-öt, egy új modellt, amely megdönti a programozási benchmarkok rekordjait, és képes több mint 30 órán át tartó...
Ai modellek
A DeepSeek bemutatta új zászlóshajó modelljét, a DeepSeek-V3.2-Exp-et, amely hosszabb kontextusablakkal, valamint kiemelkedő kódolási és érvelési képességekkel...
Ai modellek
Az OpenAI kifejezetten kódolási feladatokra fejlesztett ki egy egyedi GPT-5 verziót, GPT-5-Codex néven. Bár a modell általános érvelésben nem lényegesen...
Ai modellek
Miközben az amerikai AI laborok egyre inkább elzárják csúcsmodelljeiket, a kínai Alibaba és Moonshot egyetlen hétvége alatt két egyedülálló, billió paraméteres...
Ai modellek
Az OpenAI bemutatta a gpt-realtime-ot, egy új, kifejezetten fejlesztőknek szánt speech-to-speech modellt. Az új modellel együtt a Realtime API is frissült:...
Ai modellek
Az OpenAI megkezdte egy vadonatúj open-source modell tesztelését, eltérve a korábbi, zárt forráskódú fejlesztésre fókuszáló stratégiájától. A kezdeti tesztek...
Ai modellek
Az Anthropic megjelentette a Claude Opus 4.1-et, amely egy kisebb frissítés a korábbi Opus 4-hez képest, de jelentős javulást kínál a terminál-alapú...
Ai modellek
A Google csendben elérhetővé tette a Gemini 2.5 Deep Think modellt. Ez kizárólag a havi 250 dolláros Gemini Ultra csomag előfizetői számára érhető el, így még...
Ai modellek
A Google a Kaggle-en keresztül indítja el a Game Arenát (RL környezeteket), ahol a modellek játékokban mérhetik össze tudásukat, elsőként sakkban. Ezeket a...
Ai modellek
Ezen a héten több új bejelentés is várható. A híresztelések szerint az OpenAI nyílt súlyú (open-weight) modellje valószínűleg két méretben, 20b és 120b...
Ai modellek
Az abu-dzabi Technology Innovation Institute (TII) kutatói kiadták a Falcon-H1-et, egy nyílt súlyú nagy nyelvi modell családot, amely a szabványos transformer...
Ai modellek
Hat rejtélyes modell – olyan nevekkel, mint „Zenith”, „Summit” és „Lobster” – jelent meg az LM Arenán a hétvégén. Az AI-közösség meggyőződése, hogy ezek a...
Ai modellek
A Voxtral, a Mistral új hangalapú átíró modellcsaládja megérdemli a figyelmet. Két változatban érkezik: 3B és 24B – a 3B-s változat kellemesen kicsi, így elfut...
Ai modellek
A Moonshot AI nagy feltűnést kelt az open-model világban a Kimi K2-vel, amely egy masszív, 1 billió paraméteres Mixture of Experts (MoE) modell. Bár még nem...
Ai modellek
A Mistral betanította első érvelő modelljét, a Magistral-t. A modell pontszámai megközelítik a DeepSeek „R1” modelljét, de a matematika és a kódolás fontos...
Ai modellek
Az OpenAI hivatalosan is elindította az o3-Pro-t, az eddigi legmegbízhatóbb és legképzettebb következtetési modelljét, miközben a meglévő o3 modell árát...
Ai modellek
A 4o, a ChatGPT alapértelmezett modellje a múlt héten kapott egy frissítést, ami után elkezdett fűnek-fának behízelkedni. Az OpenAI egy...
Ai modellek
A Qwen új 30B MoE modellje a korai Claude 3.5 Sonnet-hez hasonló élményt nyújt. Tegnap jelent meg a Qwen3 nyílt súlyú modellcsaládja a szokásos Qwen csomaggal,...
Ai modellek
Az Alibaba bemutatta a „Babel” nevezetű, két új, nyílt hozzáférésű nyelvi modellt, amelyeket 25 nyelv támogatására terveztek, és összesen mintegy 7 milliárd...
Ai modellek
Az OpenAI bemutatta legújabb logikai modelljét, az o3-at, amely elmozdulást jelent az egyszerű következő szó megjóslásától az összetett megoldás-generálási...
Ai modellek
Az AWS AI-hírek sorozatát jelentette be a RE:Invent 2024 eseményen, többek között leleplezték a „Project Rainier”-t, amely egy több mint 100 000 Trainium 2...
Ai modellek
A Tencent bemutatta a Hunyuan-Large-ot, egy 389 milliárd paraméteres (ebből 52 milliárd aktív) Mixture-of-Experts (MoE) modellt, amely jelenleg a világ legjobb...
Ai modellek
A Meta megjelentette első kvantált Llama 3.2 modelljeit, tömörített 1B és 3B paraméteres verziókat kínálva, amelyeket okostelefonokon való natív futtatásra...
Ai modellek
A Stability AI bejelentette zászlóshajó open-source képgeneráló modelljének legújabb verzióját, a Stable Diffusion 3.5-öt. Ez a kiadás a promptok pontosságának...
Ai modellek
A Google megalkotta és közzétette a Gemma-t, két nyíltan hozzáférhető, kisméretű és nagy teljesítményű AI modellt. A legfontosabb újdonság, hogy a Gemma...
Ai modellek
A Nomic AI megjelentette a Nomic Embed-et, az első olyan open-source szöveges embedding modellt, amely hatalmas, 8 192 tokenes kontextusablakot támogat. A...
Ai modellek
Az Abacus AI bejelentette a Smaug-72B megjelenését, egy új nyelvi modellt, amely jelentős mérföldkövet ért el: ez az első open-source modell, amely 80 feletti...
Ai modellek
Az Allen Institute for AI (AI2) közzétette az OLMo-t (Open Language Model), egy valóban nyílt forráskódú, 7 milliárd paraméteres modellt. Sok más „nyíltnak”...
Ai modellek
A Tsinghua Egyetem és a Zhipu AI kutatói bemutatták a CogAgentet, egy korszerű látás-nyelvi modellt, amelyet kifejezetten a grafikus felhasználói felületeken...
Ai modellek
A kínai 01.ai startup közzétette a Yi modellsorozatot, amely jelenleg a világ legerősebb nyíltan hozzáférhető modelljei közé tartozik. A sorozat tartalmazza a...
Ai modellek
Az OpenAI megtartotta első fejlesztői konferenciáját, a DevDay-t, ahol jelentős frissítéseket mutatott be ökoszisztémájában. A legfontosabb bejelentés a GPT-4...
Ai modellek
Az Elon Musk által alapított xAI mesterséges intelligencia vállalat hivatalosan is megjelentette a Grokot, a ChatGPT versenytársát. A cég szerint a Grokot úgy...
Ai modellek
Az Adept bemutatta a Fuyu-8B-t, amelyet a világ legkisebb és leghatékonyabb, kifejezetten digitális ágensekhez tervezett multimodális modelljeként jellemeznek....
Ai modellek
Az OpenAI bejelentette a DALL-E 3-at, a legújabb képgeneráló modelljét, amelyet úgy terveztek, hogy a korábbi verzióknál lényegesen több árnyalatot és...
Ai modellek
Az Adept AI startup kiadta a Persimmon-8B-t, amelyet „a 8B kategória legjobb, teljesen megengedő licencű modelljének” nevez. A modell 16 ezer tokenes...
Ai modellek
A ChatGPT-4 olyan az AI világában, mint LeBron James. Persze, beszélnek a teljesítmény csökkenéséről, és igen, egyre nagyobb a verseny. De még mindig ebben a...
Ai modellek
Az Inflection AI startup közzétett néhány részletet az Inflection-1 nevű nyelvi modelljéről. Az Inflection egy viszonylag ismeretlen startup, amelynek...
Ai modellek
A Stability AI, a nyílt forráskódú „Stable Diffusion” modellt világra bocsátó vállalat, megjelentetett egy 3 milliárd és egy 7 milliárd paraméteres nyelvi...
Ai modellek
A Bloomberg bemutatta a BloombergGPT-t, egy új AI modellt, amelyet kifejezetten pénzügyi feladatok kezelésére terveztek egy nemrég megjelent kutatási...
Ai modellek
A Facebook létrehozta és részben közzétette a LLaMa-t, egy 7 milliárd és 65 milliárd közötti paraméterszámú nyelvi modellcsaládot, amely pariban van olyan...