MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A kínai AI modell, a Kimi K2.5 független biztonsági értékelése

Kutatók egy csoportja tesztelte a Kimi K2.5-öt, valószínűleg a legjobb elérhető nagyszabású open-weight modellt, és összehasonlította a DeepSeek V3.2-vel, valamint a Claude Opus 4.5-tel és a GPT 5.2-vel. Eredményeik azt mutatják, hogy a modell „hasonló kettős felhasználású képességekkel rendelkezik, mint a GPT 5.2 és a Claude Opus 4.5, de jelentősen kevesebb elutasítással a CBRNE-vel kapcsolatos kérésekre”.
Miért fontos?

Főként ez a kutatás bizonyítja, hogy a Moonshot egy nagyon jó modellt készített! Igen, vannak biztonsági hibái, de az a érdekes, hogy kevésbé súlyosak, mint a DeepSeek V3.2-ben. Azt gondolom, ez nagyobb hitelt ad annak az elképzelésnek, hogy „az ostobább modellek kevésbé biztonságosak”, és hogy „az okosabb modellek természetesen hajlamosabbak a felületesebb biztonságra”. Számomra valószínűleg a legmegdöbbentőbb az, hogy a legnagyobb eltérés az alignment területén van, ahol úgy tűnik, nagyon is valóságos kelet-nyugati megosztottság létezik, ami gyökeresen eltérő pontszámokkal jár. De az olyan dolgokban, amelyek inkább tipikus képességeknek tűnnek (biológia, kiber – különösen a nehéz kódolási részek), az egész többnyire azt bizonyítja, hogy a kínai modellek valamelyest elmaradnak a nyugati élvonaltól, de nem annyira.

Eredeti forrás megtekintése (angol) →