MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2023. november 12.
A Hugging Face kiadta a Zephyr és a Distil-Whisper open-source modelleket
A Hugging Face kiadta a Zephyr-t, egy Mistral-alapú chat-modell sorozatot, amely az AlpacaEval teszten az Anthropic Claude 2-höz hasonló teljesítményt nyújt.…
A DeepMind bemutatta a Step-Back Prompting módszert az LLM-ek fejlettebb logikai érveléséhez
A DeepMind bemutatta a Step-Back Prompting eljárást – amely egy kétlépcsős absztrakciós és érvelési folyamat. Ez jelentős teljesítményjavulást eredményez,…
Az Nvidia bemutatja a SteerLM-et az LLM-ek valós idejű testreszabásához
Az Nvidia bemutatta a SteerLM-et – egy olyan technikát, amely lehetővé teszi az LLM-ek valós idejű testreszabását az inferencia során. A módszer kimagasló…
2023. november 9.
Az OpenAI bejelentette a GPT-4 Turbo-t és az egyedi GPT-ket a DevDay-en
Az OpenAI megtartotta első fejlesztői konferenciáját, a DevDay-t, ahol jelentős frissítéseket mutatott be ökoszisztémájában. A legfontosabb bejelentés a GPT-4…
Elon Musk xAI-ja elindítja a Grok LLM-et valós idejű adathozzáféréssel
Az Elon Musk által alapított xAI mesterséges intelligencia vállalat hivatalosan is megjelentette a Grokot, a ChatGPT versenytársát. A cég szerint a Grokot úgy…
A Runway Motion Brush-sal és nagy felbontású frissítésekkel javítja a Gen-2 videógenerálást
A Runway több jelentős frissítést jelentett be Gen-2 szöveg-videó modelljéhez, amelyek célja, hogy a készítőknek részletesebb irányítást biztosítsanak. A…
2023. november 7.
Az OpenAI bemutatja a GPT-4 Turbo-t 128k kontextussal és alacsonyabb költségekkel
A GPT-4 Turbo a GPT-4 egy olcsóbb és gyorsabb változata. Frissített tudásbázisa 2023 áprilisáig terjed, és az OpenAI ígérete szerint folyamatosan naprakészen…
Az OpenAI jelentős árcsökkentést jelentett be a GPT modellcsalád esetében
Az új GPT-4 Turbo API 2,75-ször olcsóbb lesz, mint a GPT-4. Ugyanez vonatkozik a GPT-3.5 Turbo 16k modellre is. A GPT-3.5 4k kontextusú verzióját használó…
Az OpenAI új Text-to-Speech API-t indított hat emberi minőségű hanggal
A fejlesztők mostantól emberi minőségű beszédet generálhatnak szövegből egy új text-to-speech API-n keresztül. A jelenlegi TTS modell hat előre beállított…
Az OpenAI kiadta a Whisper v3-at a továbbfejlesztett automatikus beszédfelismerésért
A Whisper large-v3 az OpenAI következő generációs automatikus beszédfelismerő (ASR) modellje, amely minden nyelven jobb teljesítményt nyújt. A Whisper 2022.…
Az új Assistants API egyszerűsíti az ágens-szerű AI és az adatlekérdezés építését
Az Assistants API használatával a fejlesztők ágens-szerű AI-t hozhatnak létre alkalmazásaikban, olyan speciális funkciókkal felszerelve, mint a Code…
Az OpenAI bemutatja a testreszabható „GPT-ket” és a GPT Store terveit
A felhasználók mostantól testreszabott ChatGPT verziókat hozhatnak létre – ezeket GPT-knek nevezik – specifikus célokra, például tanuláshoz, munkához vagy…
2023. november 6.
Az NVIDIA egyedi LLM-eket használ a chiptervezés és a mérnöki elemzések felgyorsítására
Az NVIDIA saját, védett chiptervezési adatait használta fel olyan testreszabott nyelvi modellek kidolgozásához, amelyek segítenek a mérnökeinek a…
Alacsony késleltetésű hangátalakító AI-t tettek közzé kutatók a valós idejű hangmódosításhoz
A Koe AI startup kutatói részleteket és kódot tettek közzé, amely segít az alacsony késleltetésű hangátalakító AI modellek betanításában. A hangátalakító…
A Hikvision a hírek szerint etnikai kisebbség-azonosítási szolgáltatásokat kínál számítógépes látás segítségével
A kínai Hikvision vállalat „etnikai kisebbségi” azonosítást kínál számítógépes látáson keresztül az IPVM iparági kiadvány szerint. Ez közvetlenül ellentmond a…
Globális akadémikusok sürgető szakpolitikai szabályozást javasolnak a fejlett AI kockázatainak kezelésére
Tisztelt akadémikusok egy csoportja az Egyesült Államokból, Észak-Amerikából, Kínából, Európából és más országokból egy rövid tanulmányt tett közzé, amely a…
2023. november 2.
A DeepSeek-Coder nyílt forráskódú modelljei felülmúlják a GPT-3.5-öt a kódolási teszteken
A DeepSeek-AI csapata kiadta a DeepSeek-Coder-t, egy nyílt forráskódú, kódközpontú modellsorozatot 1,3 és 33 milliárd paraméter közötti méretekben. Ezeket a…
Az Adept kiadta a Fuyu-8B-t, egy kompakt multimodális modellt digitális ágensekhez
Az Adept bemutatta a Fuyu-8B-t, amelyet a világ legkisebb és leghatékonyabb, kifejezetten digitális ágensekhez tervezett multimodális modelljeként jellemeznek.…
Az OpenAI egységes 'All-in-one' modellbe gyúrja össze a ChatGPT eszközeit
Az OpenAI hivatalosan is megkezdte a ChatGPT Plus jelentős frissítésének bevezetését, egy olyan egységes felületet kínálva, amely szükségtelenné teszi a…
2023. október 30.
Dokumentumfeldolgozás forradalmasítása multimodális GPT-4V-vel
2020 júniusában az OpenAI leleplezte a GPT-3-at. A dokumentumfeldolgozás veteránjaként régóta felismertem az uralkodó dokumentum-kinyerési technológiák…