AI IRÁNYÍTÁS
Az IAPS felmérése azonosítja a kulcsfontosságú AI megbízhatósági és biztonsági kutatási prioritásokat
Az Institute for AI Policy and Strategy kutatói több mint 50 kutatót kérdeztek meg, hogy azonosítsanak értékes és megvalósítható kutatási területeket azon finanszírozók számára, akik növelni szeretnék az AI biztonságos és felelősségteljes fejlesztésének esélyeit. Legfőbb megállapításuk szerint „a legmagasabbra értékelt megközelítések a feltörekvő kockázatokra való felkészülést hangsúlyozták, erős fókusszal a gyakorlati értékelésre és monitorozásra az elméleti munka helyett: a tíz legígéretesebb megközelítés közül hat a veszélyes képességek értékelésének javítására összpontosít, míg az első helyen végzett megközelítés a képességek előrejelzésére (capability forecasting) fókuszál.”
- A kutatók 53 szakembert kértek meg, hogy rangsoroljanak több mint 100 kutatási területet fontosság és megvalósíthatóság szerint.
- A felmérést 2024 decembere és 2025 márciusa között végezték.
- A három legígéretesebbnek ítélt kutatási típus: „Feltörekvő és feladat-specifikus skálázási minták”, „CBRN értékelések” és „A megtévesztés, a tervezkedés, a helyzetfelismerés és a meggyőzés értékelése”.
- Fontosnak, de jelenleg kevésbé megvalósíthatónak ítélt területek közé tartozik a „hozzáférés-vezérlés és interfész-megerősítés”, valamint az „ellátási lánc integritása és a biztonságos fejlesztés”.
Miért fontos?
Az AI irányításával kapcsolatos kihívások közül sok végső soron arra vezethető vissza, hogy képesek vagyunk-e egy AI rendszert tesztelni egy adott tulajdonságra – minél többet haladunk előre a mérés és az értékelés tudományában, annál könnyebb lesz hatékony szabályozási rendszert kiépíteni az egyre intelligensebb gépek világában. ---