MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A kínai AI modell, a Kimi K2.5 független biztonsági értékelése

Kutatók egy csoportja tesztelte a Kimi K2.5-öt, valószínűleg a legjobb elérhető nagyszabású open-weight modellt, és összehasonlította a DeepSeek V3.2-vel, valamint a Claude Opus 4.5-tel és a GPT 5.2-vel. Eredményeik azt mutatják, hogy a modell „hasonló kettős felhasználású képességekkel rendelkezik, mint a GPT 5.2 és a Claude Opus 4.5, de jelentősen kevesebb elutasítással a CBRNE-vel kapcsolatos kérésekre”.

Miért fontos?

Főként ez a kutatás bizonyítja, hogy a Moonshot egy nagyon jó modellt készített! Igen, vannak biztonsági hibái, de az a érdekes, hogy kevésbé súlyosak, mint a DeepSeek V3.2-ben. Azt gondolom, ez nagyobb hitelt ad annak az elképzelésnek, hogy „az ostobább modellek kevésbé biztonságosak”, és hogy „az okosabb modellek természetesen hajlamosabbak a felületesebb biztonságra”. Számomra valószínűleg a legmegdöbbentőbb az, hogy a legnagyobb eltérés az alignment területén van, ahol úgy tűnik, nagyon is valóságos kelet-nyugati megosztottság létezik, ami gyökeresen eltérő pontszámokkal jár. De az olyan dolgokban, amelyek inkább tipikus képességeknek tűnnek (biológia, kiber – különösen a nehéz kódolási részek), az egész többnyire azt bizonyítja, hogy a kínai modellek valamelyest elmaradnak a nyugati élvonaltól, de nem annyira.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
A Booster Robotics humanoidja falat is átütő rúgással debütált a futballbemutatón
1 órája
A Walmart és a Wing 40 millió amerikai számára teszi elérhetővé a drónos kiszállítást
2 órája
Az Aceii A1 mobil teniszrobot dinamikus AI-edzést kínál
2 órája
Tudj meg többet
DeepSeek: A kínai AI ami felforgatja a világot