Nyelvi modellek

Az Apple bemutatja a GSM-Symbolic benchmarkot az LLM-ek matematikai érvelésének értékelésére

Az Apple bevezette a GSM-Symbolic-ot, egy továbbfejlesztett benchmarkot, amelyet a nagy nyelvi modellek matematikai érvelési képességeinek értékelésére...

eredeti forrás · 2024. október 17.

Nyelvi modellek

Az Anthropic Contextual Retrieval megoldása akár 49 százalékkal csökkenti a RAG hibákat

Az Anthropic kiadta a Contextual Retrieval funkciót, amely javítja a RAG visszakeresési pontosságát azáltal, hogy a dokumentumrészleteket a Claude által...

eredeti forrás · 2024. szeptember 26.

Nyelvi modellek

A DeepMind SCoRe módszere külső felügyelet nélkül javítja az LLM-ek önjavító képességét

A DeepMind kifejlesztette a SCoRe-t – egy megerősítéses tanuláson alapuló megközelítést, amely külső felügyelet nélkül 15,6%-kal javítja az LLM-ek önjavítását...

eredeti forrás · 2024. szeptember 26.

Nyelvi modellek

A Google frissítette a Gemini 1.5 Pro és Flash modelleket alacsonyabb árazással

A Google bemutatta az új Gemini 1.5 Pro és Flash modelleket, amelyek gyorsabb válaszidővel, több mint 50%-kal csökkentett árakkal és jobb...

eredeti forrás · 2024. szeptember 26.

Nyelvi modellek

A Meta öntanító értékelője emberi címkézés nélkül javítja az LLM-ek teljesítményét

A Meta kutatói kifejlesztettek egy "Self-Taught Evaluator"-t (öntanító értékelő), amely szintetikus adatokat használ egy LLM-as-a-Judge modell iteratív...

eredeti forrás · 2024. augusztus 8.

Nyelvi modellek

A Galileo közzétette az LLM Hallucinációs Indexet RAG feladatokhoz

A Galileo megjelentette az LLM Hallucinációs Indexet, amely 22 vezető modellt értékel három konkrét Retrieval-Augmented Generation (RAG) feladaton keresztül....

eredeti forrás · 2024. augusztus 1.

Nyelvi modellek

SaulLM: Jogi szektorra és domain-adaptációra szabott nyílt modellek

Kutatók kiadták a SaulLM-54B és SaulLM-141B nyílt nagy nyelvi modelleket, amelyeket kifejezetten a jogi szektor igényeire szabtak. Ezek a modellek...

eredeti forrás · 2024. augusztus 1.

Nyelvi modellek

Az Nvidia kifejlesztette a ChatQA 2-t a továbbfejlesztett RAG és hosszú kontextus kezeléséhez

Az Nvidia bemutatta a ChatQA 2-t, egy Llama 3-alapú modellt, amely 128K-s kontextusablakkal rendelkezik, és kifejezetten a Retrieval-Augmented Generation (RAG)...

eredeti forrás · 2024. július 25.

Nyelvi modellek

A Microsoft bemutatja a SpreadsheetLLM-et a táblázatkezelési feladatok optimalizálására

A Microsoft kutatói bemutatták a SpreadsheetLLM-et, egy újszerű kódolási módszert, amelyet kifejezetten a nagy nyelvi modellek (LLM) táblázatokkal kapcsolatos...

eredeti forrás · 2024. július 18.

Nyelvi modellek

A Speculative RAG keretrendszer növeli a pontosságot és csökkenti a késleltetést

Az UCSD és a Google kutatói bemutatták a Speculative RAG keretrendszert, amely a nagy és kis nyelvi modellek erősségeit ötvözi a Retrieval-Augmented Generation...

eredeti forrás · 2024. július 18.

Nyelvi modellek

A Meta bemutatja a MobileLLM-et a hatékony eszközön belüli nyelvi modellezéshez

A Meta kutatói előálltak a MobileLLM-mel, amely egy mobileszközökre optimalizált, hatékony Large Language Model. Az innovatív architektúra 4,3%-os...

eredeti forrás · 2024. július 11.

Nyelvi modellek

A Stanford és a UCSD Test-Time Training rétegeket fejlesztett a hosszú kontextusokhoz

A Stanford és a UCSD kutatói bemutatták a Test-Time Training (TTT) rétegeket, a szekvencia-modellező rétegek egy új osztályát. Ezek a rétegek lineáris...

eredeti forrás · 2024. július 11.

Nyelvi modellek

A Microsoft és a Tsinghua Egyetem bemutatta a skálázható Instruction Pre-Training keretrendszert

A Microsoft és a Tsinghua Egyetem kutatói bemutatták az Instruction Pre-Training elnevezésű, skálázható, felügyelt multitask keretrendszert. Ez a módszer...

eredeti forrás · 2024. június 27.

Nyelvi modellek

A PowerInfer-2 keretrendszer nagy sebességű LLM inference-t tesz lehetővé okostelefonokon

Kutatók bemutatták a PowerInfer-2-t, egy okostelefonokra tervezett, optimalizált inference keretrendszert. A rendszer támogatja a Mixtral 47B modelleket...

eredeti forrás · 2024. június 20.

Nyelvi modellek

A Google LLM-jei felnőtt szintű teljesítményt értek el a mentális állapotokra vonatkozó következtetésben

A Google kutatói a magasabb rendű tudatelméletet (theory of mind) vizsgálták a nagy nyelvi modellekben, és megállapították, hogy a GPT-4 és a Flan-PaLM képes...

eredeti forrás · 2024. június 6.

Nyelvi modellek

Az Nvidia ChatQA felülmúlja a GPT-4-et a Retrieval-Augmented Generation feladatokban

Az Nvidia kifejlesztette a ChatQA-t – egy olyan modellcsaládot, amely innovatív finomhangolási és keresési (retrieval) technikákat alkalmazva múlja felül a...

eredeti forrás · 2024. május 23.