MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Kiemelt hírek

A(z) Kiemelt hírek kategória legfrissebb mesterséges intelligencia hírei magyar nyelven.

45 hír ebben a kategóriában
Az Apple bemutatja a Ferret-UI 2-t az automatizált mobil- és webes feladatvégrehajtáshoz
Az Apple kifejlesztette és nyíltan közzétette a Ferret-UI 2-t, egy multimodális nagy nyelvi modellt, amelyet kifejezetten a mobil eszközökön és webböngészőkön...
Az Anthropic Claude 3.5 Sonnet új mércét állít fel a szoftvermérnöki feladatokban
Az Anthropic nemrég frissített Claude 3.5 Sonnet modellje új, a technológia jelenlegi állását képviselő 49%-os teljesítményt ért el az SWE-bench teszten, amely...
A Runway bemutatja az Act-One eszközt a kifejező karakteranimációkhoz
A Runway elindította az Act-One-t, egy élvonalbeli eszközt, amelyet arra terveztek, hogy az egyszerű videó- és hangbemeneteket rendkívül kifejező...
Az Ideogram kiadja a Canvas-t a fejlett AI képszerkesztéshez és képkiterjesztéshez
Az Ideogram bemutatta a Canvas-t, egy AI-alapú képszerkesztő munkaterületet, amely kifinomult inpainting és outpainting képességeket kínál. Az eszköz dedikált...
A Sequoia Capital jelentése vázolja az inferencia-idejű érvelésre való áttérést
A Sequoia Capital jelentést tett közzé a generatív AI fejlődéséről, fókuszban az „1-es rendszerű gondolkodásról” a „2-es rendszerű gondolkodásra” való...
Az AI2 kiadta a Molmo multimodális modelleket, amelyek lekörözik a Gemini-t és a Claude 3.5-öt
Az AI2 megjelentette a Molmo-t – a multimodális modellek egy új családját, amelynek legkisebb változata (1B) majdnem eléri a GPT-4V szintjét, a közepes modell...
A Meta kiadta a Llama 3.2-t edge-optimalizált és multimodális modellekkel
A Meta megjelentette a Llama 3.2-t – egy új nyílt modellcsaládot, amely edge-optimalizált szöveges modelleket (1B és 3B), valamint a Meta első nagy...
A Mistral kiadta a Pixtral 12B-t, az első nyílt multimodális modelljét
A Mistral nyíltan közzétette a Pixtral 12B-t, amivel a vállalat először lépett be a multimodális modellek piacára. Ez az új modell képes szöveges és képi...
A Fish Audio kiadta a Fish Speech 1.4-et azonnali hangklónozással
A Fish Audio bemutatta a Fish Speech 1.4-et, egy fejlett, többnyelvű hangmodellt, amelyet a globális fejlesztők számára terveztek. A rendszer azonnali...
A Replit bejelentette a Replit Agent-et a szoftverfejlesztési feladatok automatizálására
A Replit bejelentette a Replit Agent-et, egy speciális AI eszközt, amely automatizálja a komplex szoftverfejlesztési munkafolyamatokat. Az ágenst olyan...
A Stanford tanulmánya szerint az LLM-ek által generált ötletek újszerűbbek az emberi szakértőkénél
A Stanford Egyetem tanulmánya kimutatja, hogy a nagy nyelvi modellek (LLM-ek) által generált ötleteket a közvetlen összehasonlítások során gyakran újszerűbbnek...
Az Alibaba Cloud kiadta a Qwen2-VL nyílt látás-nyelvi modellcsaládot
Az Alibaba Cloud nyilvánosan közzétette a Qwen2-VL-t – egy kereskedelmileg is használható nyílt látás-nyelvi (vision-language) modellcsaládot (72B, 2B), amely...
Az LM Studio 0.3.0 dokumentumalapú csevegéssel és GPU-kiegyenlítéssel bővült
Az LM Studio kiadta a 0.3.0-s verziót, amely RAG-alapú dokumentum-csevegést, OpenAI-szerű JSON kimeneti támogatást és automatikus GPU/CPU kiegyenlítést kínál a...
Az OpenAI elindította a GPT-4o finomhangolási lehetőségeit
Az OpenAI mostantól lehetővé teszi a fejlesztők számára a GPT-4o finomhangolását, így egyedi igényekre szabhatják a modell válaszait specifikus területeken. Ez...
Az Ideogram 2.0 új mércét állít fel a szövegből képet generáló technológiák terén
Az Ideogram kiadta text-to-image modelljének 2.0-s verzióját, amely állításuk szerint túlszárnyalja a DALL-E 3, a Midjourney és a FLUX Pro teljesítményét. Az...
Elon Musk xAI-ja bemutatta a Grok-2-t és a Grok-2 mini-t a csúcsmodellek riválisaként
Elon Musk xAI cége bemutatta a Grok-2 és Grok-2 mini modelleket, ami jelentős előrelépést jelent a nyelvmodell-kínálatukban. Ezek a modellek fejlett...
Az Anthropic bemutatja a Prompt Caching funkciót az API költségek drasztikus csökkentése érdekében
Az Anthropic egy új prompt gyorsítótárazási (prompt caching) funkciót vezetett be az API-ján, hogy javítsa a fejlesztők hatékonyságát. Ez a frissítés a...
A Cosine megjelentette a Genie-t, az autonóm AI szoftvermérnököt, amely kiemelkedő pontszámot ért el a SWE-Bench teszten
A Cosine kiadta a Genie-t, egy autonóm AI szoftvermérnököt, amelyet az emberi fejlesztők kognitív folyamatainak leképezésére terveztek. Az eszköz célja az...
A MultiOn és a Stanford bemutatta az Agent Q-t az autonóm webes feladatok sikeres elvégzéséhez
A MultiOn és a Stanford kutatói bemutatták az Agent Q-t, egy finomhangolt LLaMa 70B ágenst, amely képes az önjavításra és az autonóm fejlődésre. Az ágens valós...
A Sakana AI bemutatja a "The AI Scientist" rendszert a kutatás teljes körű automatizálására
A Sakana AI kifejlesztette a "The AI Scientist" nevű újszerű rendszert, amely nagy nyelvi modellek segítségével automatizálja a teljes tudományos kutatási...
A Black Forest Labs elindította a FLUX.1 open-source képgeneráló modelleket
A Black Forest Labs kilépett a titoktartásból (stealth mode) és megjelentette a FLUX.1-et, amely nyílt forráskódú, kereskedelmi célokra is engedélyezett...
Az OpenAI bemutatta a SearchGPT prototípust a Google kereső kihívójaként
Az OpenAI bemutatta a SearchGPT prototípust, amely az új keresési funkciók előfutára, és az AI modellek erejét ötvözi a webes információkkal. A Google Search...
A Google kiadta a kompakt Gemma-2-2B modellt, amely felülmúlja nagyobb versenytársait
A Google megjelentette a Gemma-2-2B-t, egy üzleti célokra is felhasználható, kompakt, 2 milliárd paraméteres modellt. Kis mérete ellenére figyelemre méltó...
A Meta elindította a Segment Anything Model 2-t a valós idejű videószegmentáláshoz
A Meta közzétette a Segment Anything Model (SAM) 2-t, amely egy valós időben promptolható objektumszegmentációs modell képekhez és videókhoz egyaránt....
A DeepMind AlphaProof és AlphaGeometry 2 modelljei IMO-szintű matematikai feladatokat oldanak meg
A DeepMind bemutatta az AlphaProof és AlphaGeometry 2 nevezetű fejlett AI modelleket, amelyek összetett matematikai problémákat oldanak meg. Ezek a rendszerek...
A Stability AI közzétette a Stable Audio Open technikai kutatási jelentését
A Stability AI kiadta a Stable Audio modell technikai jelentését, amely mélyreható betekintést nyújt a szövegből hangot generáló (text-to-audio) rendszerének...
A Mistral kiadta a Codestral-Mamba 7B-t a hatékony kódgeneráláshoz
A Mistral a Mamba architektúra készítőivel együttműködve megjelentette a Codestral-Mamba 7B-t. Ezt a modellt a saját méretkategóriájában a legerősebb...
A Patronus AI kiadta a Lynx-et a csúcstechnológiás hallucináció-detektáláshoz
A Lynx a Patronus AI által kiadott új, kereskedelmileg szabadon felhasználható hallucináció-detektáló modell. A modellt az AI-alkalmazások megbízhatóságának...
A Hugging Face elindította a SmolLM sorozatot az eszközön futtatható nyelvi modellekhez
A Hugging Face megjelentette a SmolLM sorozatot, amely egy új, korszerű, eszközön futtatható (on-device) multimodális Large Language Model széria. Ezeket a...
Az Európai Unió közzétette az EU AI Act végleges szövegét
Az Európai Unió közzétette az EU AI Act teljes és végleges szövegét a Hivatalos Lapjában. Ez a mérföldkőnek számító jogszabály kockázatalapú szabályozást vezet...
A Perplexity AI frissítette a Pro Search funkciót a többlépcsős érvelési feladatokhoz
A Perplexity AI bemutatta a Pro Search továbbfejlesztett változatát, amely képes többlépcsős érvelésre és összetett számítási feladatok elvégzésére. Ez a...
Korábbi Meta kutatók bemutatták az ESM3 biológiai nyelvi modellt
A Meta AI korábbi kutatói egy EvolutionaryScale nevű új vállalkozás keretében megjelentették az ESM3-at. Ezt a nyelvi modellt a biológiai tudományokhoz...
Az Anthropic bevezette a Projects funkciót az egyedi RAG és a csapatmegosztás érdekében
Az Anthropic egy jelentős platformfrissítést jelentett be „Projects” néven, amely lehetővé teszi a Claude Pro és Team felhasználók számára, hogy munkájukat...
A Meta megjelentette a Chameleon multimodális modelleket és zene-generálási kutatásait
A Meta négy új AI kutatási modellt tett közzé az innováció nagy léptékű felgyorsítása érdekében. A kiadás részét képezi a multimodális Chameleon modellcsalád...
A Runway elindította a Gen-3 Alphát a hiperrealisztikus AI videógenerálásért
A Runway bemutatta a Gen-3 Alphát, egy olyan AI modellt, amely kiváló minőségű, hiperrealisztikus videók létrehozására képes. A modell kifejező emberi...
Az új Kling és Dream Machine AI videómodellek kihívást jelentenek az OpenAI Sora számára
A nagy felbontású text-to-video generálásért folyó verseny intenzívebbé vált a Kling és a Luma AI Dream Machine megjelenésével. A Kling fejlett 3D AI...
A Mamba-2 sebességi rekordokat dönt és bevezeti az SSD keretrendszert a nyelvmodellezésben
A Princeton és a CMU kutatói közzétették a Mamba-2-t, egy jelentősen gyorsabb nyelvi modellt, amely megőrzi versenyképes teljesítményét a nyelvmodellezésben. A...
A Stability AI kiadta a Stable Audio Opent a kiváló minőségű hanggeneráláshoz
A Stability AI megjelentette a Stable Audio Opent, egy open-source modellt, amely kiváló minőségű hangmintákat és hangeffekteket generál egyszerű szöveges...
A Mistral kiadta a Codestral 22B kódoló modellt, amely több mint 80 nyelvet támogat
A Mistral megjelentette a Codestralt, az első olyan nagy nyelvi modelljét, amelyet kifejezetten kódgenerálási feladatokra terveztek. Ez a modell egy nyílt...
Megérkezett a ChatGPT memória funkciója minden Plus felhasználó számára
Az OpenAI memória funkciókkal ruházta fel a ChatGPT-t – a chatbot mostantól "emlékezni" fog a beszélgetések során megosztott fontos részletekre, például a...
A Microsoft kiadta a kompakt, nyílt AI modellekből álló Phi-3 családot
A Microsoft közzétette a Phi-3 nyílt forráskódú modellcsaládot, amely a nagy teljesítményt és a kompakt architektúrát ötvözi. A kiemelkedő phi-3-mini modell...
Az Apple bemutatta az OpenELM hatékonyságközpontú nyelvi modelleket az iPhone-hoz
Az Apple bemutatta az OpenELM sorozatot, amely olyan nyílt forráskódú nyelvi modellekből áll, amelyeket kifejezetten az iPhone AI-képességeinek javítására...
A Google Med-Gemini rekordot döntött az orvosi diagnózis pontosságában
A Google kifejlesztette a Med-Gemini-t, a Gemini modell speciális, multimodális változatát, amelyet kifejezetten az egészségügyre szabtak. A modell új iparági...
A Stanford AI Index Report 2024 a gazdasági hatásokra és az aggodalmakra világít rá
A Stanford 2024-es AI Index jelentése átfogó elemzést nyújt a mesterséges intelligencia állapotáról. Az eredmények rávilágítanak arra, hogy az AI bizonyos...
A Synthesia elindította a következő generációs expresszív avatarokat az Express-1 modell segítségével
A Synthesia bemutatta az expresszív avatarok következő generációját, amelyet az új Express-1 modell hajt meg. Ezeket az avatarokat a videókommunikáció...