ADATOK
Az Nvidia ágens-alapú visszakeresési pipeline-t fejlesztett, amely következtetési képességgel bővíti a szemantikus keresést
Az Nvidia NeMo Retriever első helyezést ért el a ViDoRe v3 pipeline ranglistáján, és második helyet a BRIGHT benchmarkon egyetlen ágens-alapú visszakeresési architektúra használatával. A rendszer egy ReACT-alapú hurkot alkalmaz, amelyben egy LLM ágens iteratív módon kérdez le, értékel és finomítja a kereséseket olyan eszközökkel, mint a think, retrieve és final_results, dinamikusan alkalmazkodva stratégiájához ahelyett, hogy adatkészlet-specifikus heurisztikákra támaszkodna. A pipeline a Claude Opus 4.5-öt ötvözi a nemotron-colembed-vl-8b-v2 beágyazásokkal (embeddings), amivel 69,22 NDCG@10 pontszámot ért el a ViDoRe teszten, megelőzve azokat a specializált megoldásokat, amelyek egyes benchmarkokon kiválóak, de több tartományon átívelően már nehézségekkel küzdenek. Az Nvidia az eredeti Model Context Protocol szerverarchitektúrát egy szálbiztos (thread-safe) singleton retrieverre cserélte a telepítési bonyolultság és a hálózati többletköltség kiküszöbölése érdekében, bár minden lekérdezés még így is átlagosan 136 másodpercet vesz igénybe, és nagyjából 760 000 bemeneti tokent fogyaszt. A csapat azt tervezi, hogy ezeket a következtetési mintákat kisebb, nyílt súlyozású (open-weight) modellekbe desztillálja a késleltetés és a költségek csökkentése érdekében, a pontosság megőrzése mellett.
- ReACT-alapú hurkot alkalmaz az iteratív lekérdezés-értékeléshez és finomításhoz.
- Első helyezést ért el a ViDoRe v3 pipeline ranglistáján.
- Claude Opus 4.5-öt használ nemotron-colembed-vl-8b-v2 beágyazásokkal párosítva.
- Szálbiztos singleton retrieverre váltott a hálózati többletköltség csökkentése érdekében.
- A jövőbeli tervek között szerepel a következtetési minták desztillálása kisebb, nyílt súlyozású modellekbe.