A Kona lekörözi a vezető LLM-eket a nagy sebességű következtetés és a költséghatékonyság terén

2026. február 10. · MI Történik? · 1 perc olvasás

Egy Sudoku stresszteszt során a Logical Intelligence Kona modellje jelentős fölényt mutatott a vezető nyelvi modellekkel szemben a kényszerkielégítési problémák megoldásában. Miközben a csúcskategóriás modellek, mint a GPT-5.2, a Claude Opus, a Gemini és a DeepSeek együttesen mindössze 2%-os megoldási arányt értek el, a Kona a rejtvények 96,2%-át sikeresen megfejtette. A sebesség- és költségkülönbségek szintén szembetűnőek voltak, rávilágítva az energiaalapú következtetési modellek építészeti hatékonyságára a hagyományos nagy nyelvi modellekkel szemben.

96,2%-os megoldási arány a Kona esetében, szemben a vezető LLM-ek csoportjának 2%-os eredményével.
A Kona átlagosan 313 ezredmásodperc alatt oldotta meg a rejtvényeket, míg az LLM-eknek próbálkozásonként akár 90 másodpercre is szükségük volt.
Az LLM-ek teljes API költsége a demó alatt körülbelül 11 000 dollár volt.
A Kona üzemeltetési költsége ugyanezen demó alatt mindössze négy dollárt tett ki.
A Kona formális verifikációs ágense, az Aleph, gépileg ellenőrizhető bizonyítékokat tud létrehozni a kód helyes működésének biztosítására.

Miért fontos?

Ez a teszt rávilágít a kizárólag nyelvi alapú modellek alapvető logikai korlátaira, és bizonyítja, hogy a speciális következtetési architektúrák nagyságrendekkel olcsóbbak és gyorsabbak lehetnek a logikailag intenzív feladatoknál. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

Az OpenAI és az Anthropic eléri a 120 milliárd dolláros összesített évesített árbevételt

most

Az AI szabadalmak száma megugrott 2025-ben, az Agentic AI vezeti a növekedést

most

Építsen piros/kék/zöld AI felülvizsgálati hurkot a magas tétű kimenetekhez

most

Tudj meg többet

Nagy nyelvi modellek (LLM): Hogyan működnek a ChatGPT-féle rendszerek?