MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Nyelvi modellek

A(z) Nyelvi modellek kategória legfrissebb mesterséges intelligencia hírei magyar nyelven.

16 hír ebben a kategóriában
Az Apple bemutatja a GSM-Symbolic benchmarkot az LLM-ek matematikai érvelésének értékelésére
Az Apple bevezette a GSM-Symbolic-ot, egy továbbfejlesztett benchmarkot, amelyet a nagy nyelvi modellek matematikai érvelési képességeinek értékelésére...
Az Anthropic Contextual Retrieval megoldása akár 49 százalékkal csökkenti a RAG hibákat
Az Anthropic kiadta a Contextual Retrieval funkciót, amely javítja a RAG visszakeresési pontosságát azáltal, hogy a dokumentumrészleteket a Claude által...
A DeepMind SCoRe módszere külső felügyelet nélkül javítja az LLM-ek önjavító képességét
A DeepMind kifejlesztette a SCoRe-t – egy megerősítéses tanuláson alapuló megközelítést, amely külső felügyelet nélkül 15,6%-kal javítja az LLM-ek önjavítását...
A Google frissítette a Gemini 1.5 Pro és Flash modelleket alacsonyabb árazással
A Google bemutatta az új Gemini 1.5 Pro és Flash modelleket, amelyek gyorsabb válaszidővel, több mint 50%-kal csökkentett árakkal és jobb...
A Meta öntanító értékelője emberi címkézés nélkül javítja az LLM-ek teljesítményét
A Meta kutatói kifejlesztettek egy "Self-Taught Evaluator"-t (öntanító értékelő), amely szintetikus adatokat használ egy LLM-as-a-Judge modell iteratív...
A Galileo közzétette az LLM Hallucinációs Indexet RAG feladatokhoz
A Galileo megjelentette az LLM Hallucinációs Indexet, amely 22 vezető modellt értékel három konkrét Retrieval-Augmented Generation (RAG) feladaton keresztül....
SaulLM: Jogi szektorra és domain-adaptációra szabott nyílt modellek
Kutatók kiadták a SaulLM-54B és SaulLM-141B nyílt nagy nyelvi modelleket, amelyeket kifejezetten a jogi szektor igényeire szabtak. Ezek a modellek...
Az Nvidia kifejlesztette a ChatQA 2-t a továbbfejlesztett RAG és hosszú kontextus kezeléséhez
Az Nvidia bemutatta a ChatQA 2-t, egy Llama 3-alapú modellt, amely 128K-s kontextusablakkal rendelkezik, és kifejezetten a Retrieval-Augmented Generation (RAG)...
A Microsoft bemutatja a SpreadsheetLLM-et a táblázatkezelési feladatok optimalizálására
A Microsoft kutatói bemutatták a SpreadsheetLLM-et, egy újszerű kódolási módszert, amelyet kifejezetten a nagy nyelvi modellek (LLM) táblázatokkal kapcsolatos...
A Speculative RAG keretrendszer növeli a pontosságot és csökkenti a késleltetést
Az UCSD és a Google kutatói bemutatták a Speculative RAG keretrendszert, amely a nagy és kis nyelvi modellek erősségeit ötvözi a Retrieval-Augmented Generation...
A Meta bemutatja a MobileLLM-et a hatékony eszközön belüli nyelvi modellezéshez
A Meta kutatói előálltak a MobileLLM-mel, amely egy mobileszközökre optimalizált, hatékony Large Language Model. Az innovatív architektúra 4,3%-os...
A Stanford és a UCSD Test-Time Training rétegeket fejlesztett a hosszú kontextusokhoz
A Stanford és a UCSD kutatói bemutatták a Test-Time Training (TTT) rétegeket, a szekvencia-modellező rétegek egy új osztályát. Ezek a rétegek lineáris...
A Microsoft és a Tsinghua Egyetem bemutatta a skálázható Instruction Pre-Training keretrendszert
A Microsoft és a Tsinghua Egyetem kutatói bemutatták az Instruction Pre-Training elnevezésű, skálázható, felügyelt multitask keretrendszert. Ez a módszer...
A PowerInfer-2 keretrendszer nagy sebességű LLM inference-t tesz lehetővé okostelefonokon
Kutatók bemutatták a PowerInfer-2-t, egy okostelefonokra tervezett, optimalizált inference keretrendszert. A rendszer támogatja a Mixtral 47B modelleket...
A Google LLM-jei felnőtt szintű teljesítményt értek el a mentális állapotokra vonatkozó következtetésben
A Google kutatói a magasabb rendű tudatelméletet (theory of mind) vizsgálták a nagy nyelvi modellekben, és megállapították, hogy a GPT-4 és a Flan-PaLM képes...
Az Nvidia ChatQA felülmúlja a GPT-4-et a Retrieval-Augmented Generation feladatokban
Az Nvidia kifejlesztette a ChatQA-t – egy olyan modellcsaládot, amely innovatív finomhangolási és keresési (retrieval) technikákat alkalmazva múlja felül a...