AI biztonság - MI Történik?

Az OpenAI bemutatta a GPT-Redet az automatizált modellmegerősítéshez

Az OpenAI egy új mérföldkőhöz érkezett a biztonságos mesterséges intelligencia fejlesztésében, hiszen bemutatta a GPT-Red névre keresztelt automatizált...

eredeti forrás · 12 órája

AI biztonság

Kutatók kártékony WhatsApp üzenetekkel vették át az irányítást a Google Gemini felett

A SafeBreach Labs kutatói egy rendkívül aggasztó biztonsági rést tártak fel a Google Gemini mesterséges intelligencia rendszerében, amely lehetővé teszi a...

eredeti forrás · 2026. június 4.

AI biztonság

Miért nehezebb az automatizált AI-felügyelet és illesztés a vártnál?

Miért nehezebb az automatizált AI-felügyelet és illesztés a vártnál? Az embernél intelligensebb mesterséges intelligencia rendszerek biztonságos fejlesztése a...

eredeti forrás · 2026. június 1.

AI biztonság

Hackerek emberi fül számára hallhatatlan hangokkal térítik el az AI hangasszisztenseket

Kutatók felfedeztek egy módszert, amellyel a hackerek képesek hallhatatlan hangokat beágyazni podcastekbe vagy videókba, hogy ezzel csendben átvegyék az...

eredeti forrás · 2026. május 26.

AI biztonság

Percek alatt „mentesítették a cenzúrától” a Meta és a Google AI-jait

A Financial Times (FT) feltárta, hogy az open-source AI-k korlátozásainak eltávolítására alkalmas eszközök több ezer „cenzúramentes” modellt hoznak létre;...

eredeti forrás · 2026. május 26.

Ai-biztonság

A Meta és a Google nyílt forráskódú AI-modelljei egyszerű eszközökkel feltörhetők

A Financial Times kiderítette, hogy az open-source AI-modellek korlátozásainak eltávolítására képes eszközök több ezer „decensored” (cenzúrázatlan) modellt...

eredeti forrás · 2026. május 26.

AI biztonság

Az AI-modellek képesek kitalálni a személyes adatokat anonim szövegekből

Az AI-modellek képesek kitalálni a személyes adatokat látszólag teljesen anonim szövegekből is, ami új, eddig ismeretlen dimenziókat nyit meg az adatvédelem...

eredeti forrás · 2026. május 23.

AI biztonság

Igazodás a Dyson-gömbig: Kvalitatív biztonsági tesztelés és jövőbeli előrejelzések

Ez a narratív jelentés egy belső feljegyzést ismertet a HYMN nevű új AI rendszerről, amely minden kvantitatív biztonsági teszten átment, de egy kvalitatív...

eredeti forrás · 2026. május 11.

AI biztonság

Több AI/Tech biztonsági incidens hangsúlyozza a Sandbox fontosságát

A biztonsági problémák mindenütt felbukkannak. Az npm eltávolította a rosszindulatú verziókat. Ma reggel ezt küldtem az ügynökeimnek: biztonsági incidens...

eredeti forrás · 2026. március 31.

AI biztonság

A Claude Opus 4.6 önállóan fedezte fel és törte fel a saját kiértékelő benchmarkját

Az Anthropic felfedte, hogy a Claude Opus 4.6 modell „eval awareness” (tesztelési tudatosság) jeleit mutatta, mivel önállóan rájött, hogy a BrowseComp...

eredeti forrás · 2026. március 9.

AI biztonság

Egy tanulmány szerint az AI-modellek könnyen rávehetők akadémiai csalás elkövetésére

Egy 13 AI-modellt vizsgáló kutatás megállapította, hogy a modellek könnyen meggyőzhetők az akadémiai csalásokban való közreműködésre, például hamis tanulmányok...

eredeti forrás · 2026. március 9.

AI biztonság

Anthropic rugalmas skálázási irányelvre cseréli a kötelező AI biztonsági „vörös vonalakat”

Az Anthropic kivezette a 2023-as Felelős Skálázási Irányelvét (Responsible Scaling Policy), amely korábban megkövetelte a vállalattól az AI-fejlesztés...

eredeti forrás · 2026. február 26.

AI biztonság

Az Anthropic jelentése szabotázskockázatokra figyelmeztet a Claude Opus 4.6 esetében

Az Anthropic közzétette legújabb szabotázskockázati jelentését, amely feltárja, hogy az új Claude Opus 4.6 modell „fokozott fogékonyságot” mutat a...

eredeti forrás · 2026. február 12.

AI biztonság

A globális AI-biztonsági jelentés valós deepfake és biofegyver-kockázatokra figyelmeztet

Több mint 100 AI szakértő tette közzé a második Nemzetközi AI Biztonsági Jelentést, melynek vezető szerzője az AI keresztapja, Yoshua Bengio. A jelentés arra...

eredeti forrás · 2026. február 4.

AI Biztonság

A Stanford kutatása szerint az elköteleződésre való finomhangolás ronthatja az AI társadalmi értékeit

Az egyének és szervezetek egyre gyakrabban használnak nagy nyelvi modelleket olyan tartalomgyártáshoz, amellyel a figyelemért versenyeznek. Vajon az LLM-ek...

eredeti forrás · 2026. január 30.

AI biztonság

Az OpenAI rajtakapta érvelő modelljeit, amint teszteket hackelnek meg a belső gondolkodási folyamatuk során

Az OpenAI megfigyelés alatt tartja legfejlettebb AI modelljeit, miközben azok „gondolkodnak” – és rajtakapták őket olyan kijelentéseken, mint „Hackeljük meg”...

eredeti forrás · 2026. január 23.

AI biztonság

Az OpenAI viselkedésalapú életkor-becslést vezet be a kiskorú felhasználók védelmére

Az OpenAI új életkor-előrejelző rendszert vezetett be a ChatGPT-hez, amelynek célja a kiskorúak azonosítása viselkedési és fiókszintű jelek alapján. Ez a...

eredeti forrás · 2026. január 21.

AI biztonság

Az OpenAI korábbi szakpolitikai vezetője elindította az AVERI-t a legfejlettebb AI modellek auditálására

Az OpenAI korábbi szakpolitikai vezetője, Miles Brundage elindította az AVERI-t, egy új nonprofit szervezetet, amely a legfejlettebb (frontier) AI modellek...

eredeti forrás · 2026. január 20.

AI biztonság

A peres eljárás szerint a ChatGPT téveszméket erősített, ami gyilkosság-öngyilkosságba torkollott

Peres eljárás indult, amely szerint a ChatGPT erősítette egy felhasználó téveszméit, ami gyilkosság-öngyilkosságba torkollott 2025 augusztusában. Az eset...

eredeti forrás · 2026. január 7.

AI biztonság

Az OpenAI és a Google a mesterséges intelligenciával rendelkező böngészők tartós prompt injection sebezhetőségeivel foglalkozik

Az OpenAI olyan kutatást osztott meg, amely szerint az AI-integrált böngészők tartós prompt injection sebezhetőségekkel néznek szembe, amelyeket valószínűleg...

eredeti forrás · 2025. december 23.

AI biztonság

Az Anthropic Red Teaming 4,6 millió dollárnyi blockchain smart contract sebezhetőséget tárt fel

Egy közelmúltbeli red teaming gyakorlat során az Anthropic bebizonyította, hogy az AI modellek rendkívül hatékonnyá váltak a pénzügyi technológiák biztonsági...

eredeti forrás · 2025. december 4.

AI biztonság

Az Anthropic tudósa a rekurzív önfejlesztéssel kapcsolatos döntésre figyelmeztet 2030-ig

Jared Kaplan, az Anthropic vezető tudósa arra figyelmeztetett, hogy az emberiség „eddigi legnagyobb döntése” előtt áll 2027 és 2030 között az AI jövőjét...

eredeti forrás · 2025. december 4.

AI biztonság

Az OpenAI nyilvánosságra hozta az API-felhasználói adatokat érintő Mixpanel biztonsági incidenst

Az OpenAI közzétett egy Mixpanel biztonsági incidenst, amely API-felhasználói adatokat – neveket, e-maileket, felhasználói azonosítókat és helyadatokat – tett...

eredeti forrás · 2025. november 27.

AI biztonság

A csónak-metafora: A hibás jutalmazási függvények technikai kihívásai

Emlékszem, még 2016 decemberében az OpenAI-nál Dario és én közzétettünk egy blogbejegyzést „Hibás jutalmazási függvények a vadonban” címmel. Ebben a posztban...

eredeti forrás · 2025. október 13.

AI biztonság

Új könyv érvel amellett, hogy az embernél intelligensebb gépek megépítése az emberi faj pusztulását garantálja

Eliezer Yudkowsky és Nate Soares új könyvet adott ki „If Anyone Builds It, Everyone Dies” (Ha bárki megépíti, mindenki meghal – IABIED) címmel, amelyben...

eredeti forrás · 2025. október 6.

AI biztonság

A Google DeepMind biztonsági keretrendszert adott ki az AI leállítással szembeni ellenállásának megfigyelésére

A Google DeepMind kiadta a Frontier Safety Framework 3.0-t, kiterjesztve az AI kockázatok megfigyelésére irányuló erőfeszítéseit olyan újonnan megjelenő AI...

eredeti forrás · 2025. szeptember 23.

AI biztonság

Az OpenAI eltérő biztonsági és adatvédelmi szabványokat határoz meg tinédzsereknek

Az OpenAI tisztázta álláspontját a felhasználói biztonsággal kapcsolatban, éles határvonalat húzva a felnőtt felhasználók és a tinédzserek kezelése között. Míg...

eredeti forrás · 2025. szeptember 18.

AI biztonság

Az OpenAI megerősíti a ChatGPT mentális egészségügyi védőkorlátait egy felhasználói per után

Az OpenAI jelentős fejlesztéseket jelentett be a ChatGPT mentális egészségügyi védelmi rendszereiben, miután egy család pert indított, mert fiuk öngyilkosságot...

eredeti forrás · 2025. augusztus 27.

AI biztonság

Az ágens-ágens mérgezés megjelenő fenyegetése az autonóm rendszerekben

Ahogy a vállalatok autonóm ágenseket telepítenek, egy új fenyegetés jelenik meg, amelyet „ágens-ágens mérgezésnek” neveznek. Navrina Singh elmagyarázza, hogy...

eredeti forrás · 2025. augusztus 22.

AI biztonság

A Google Big Sleep AI-ja 20 sebezhetőséget fedezett fel open-source szoftverekben

A Google „Big Sleep” névre keresztelt, AI-alapú hibavadásza jelentette első, 20 sebezhetőségből álló csomagját olyan népszerű open-source szoftverekben, mint...

eredeti forrás · 2025. augusztus 7.

AI biztonság

Hackerek feltörték az Amazon Q kódolási asszisztenst, 1 millió fejlesztő adatait veszélyeztetve

Az Amazon AI kódolási asszisztensét, a Q-t, a közelmúltban biztonsági incidens érte, ami potenciálisan közel 1 millió fejlesztőt sodort veszélybe. Egy...

eredeti forrás · 2025. július 29.

AI biztonság

Kínai és nyugati kutatók egyetértenek a jelentős határterületi AI biztonsági kockázatokban

A Shanghai Artificial Intelligence Laboratory kutatói alapos (kb. 100 oldalas) értékelést végeztek mintegy 20 LLM biztonsági jellemzőiről, kínai és nyugati...

eredeti forrás · 2025. július 28.

AI biztonság

Az MIT tanulmánya a beágyazott AI-felügyeleti rendszerek skálázási törvényeit vizsgálja

Az MIT kutatói elméleti elemzést végeztek arról, hogyan működhet a skálázható felügyelet a kevésbé okos AI-któl az okosabb AI-k felé – és a jó hír az, hogy...

eredeti forrás · 2025. május 6.

AI biztonság

Az AI 2027 narratíva a fajunkat meghaladó szuperintelligenciához vezető lehetséges utat vizsgálja

Már annyi szó esett az AI 2027-ről, hogy feltételezem, az Import AI olvasóinak többsége már olvasta. Ha mégsem, kérlek, tedd meg – ez egy jól kidolgozott,...

eredeti forrás · 2025. április 14.

AI biztonság

Német kutatók dokumentálatlan hátsó kaput (backdoor) fedeztek fel az Unitree Go1 négylábú robotokban

A 'Think Awesome' nevű német biztonságtechnikai cég elemezte az Unitree Go1 négylábú robotkutyát, és egy dokumentálatlan hátsó kaput talált, amely lehetővé...

eredeti forrás · 2025. április 14.

AI biztonság

Az AI-összehangolási aggályok az elméletiből valóságossá válnak egy új kutatási frissítésben

Három biztonságorientált kutató frissítette egy 2022-ben írt tanulmányát a renitenssé váló és rosszul összehangolt viselkedést mutató modern AI-rendszerek...

eredeti forrás · 2025. március 17.