MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2023. június 26.
Kutatások szerint a mikromunka-platformok dolgozóinak jelentős része LLM-eket használ a feladatok elvégzéséhez
Az EPFL kutatói bizonyítékot találtak arra, hogy a mikromunka-platformok dolgozói (crowdworkers) elkezdték a generatív AI eszközöket, például a ChatGPT-t…
A modellek kizárólag szintetikus adatokon történő tanítása visszafordíthatatlan modellösszeomlást okoz
Az Oxfordi Egyetem, a Cambridge-i Egyetem, a Torontói Egyetem és az Imperial College London kutatói felfedezték, hogy az AI-rendszerek tönkretehetők, ha…
2023. június 12.
A Meta kiadta a BlenderBot 3x modellt és egy hatalmas emberi visszajelzési adatkészletet
A Facebook közzétette a BlenderBot 3x részleteit, amely egy olyan nagy nyelvi modell, amelyet a korábbi, BlenderBot nevű modell nyilvános használata során…
A Cohere a nagy modellek kvantálását javító tanítási stratégiákat vizsgálja
A Cohere AI vállalat kutatói elemzést tettek közzé arról, hogyan befolyásolják az AI-rendszerek tanítása során hozott döntések a kész modellek…
A Meta kiadta a MusicGen AI-t az irányítható hanggeneráláshoz
A Facebook megalkotta a MusicGen nevű AI-modellt, amely „egylépcsős nyelvi modellként, hatékony kódkönyv-összefűzési stratégia révén képes konzisztens zenét…
AI-vezetők globális nyilatkozatot írtak alá a kihalás veszélyeire figyelmeztetve
Több mint 200 AI-kutató és vállalkozó – köztük az Anthropic, a DeepMind és az OpenAI vezérigazgatói – aláírt egy nyilatkozatot, amely szerint az AI okozta…
Elindul az Apollo Research a harmadik féltől származó biztonsági értékelések biztosítására
Egy új, Apollo Research nevű AI-kutató szervezet jött létre, amelynek célja az AI-vállalatok biztonságának növelése: a) nem biztonságos AI-viselkedések…
2023. június 4.
Az Anthropic 100 000 tokenre növeli a Claude kontextusablakát
Anthropic's Claude, a primary competitor to OpenAI's GPT models, has announced support for a massive 100,000-token context window. This development…
A Google Med-PaLM 2 szakértői szintet ért el az orvosi vizsgákon
Google has rolled out Med-PaLM 2, a specialized variant of the PaLM model specifically optimized for medical questions and reasoning. The model has…
A Falcon LLM megszerezte az első helyet a Hugging Face nyílt ranglistáján
The Technology Innovation Institute (TII) has open-sourced Falcon, a powerful new large language model that is commercially permissible. Upon its release,…
A Meta AI bemutatta a LIMA modellt, amely minimális adattal is kimagasló teljesítményt nyújt
Meta AI has unveiled LIMA, a fine-tuned version of its 65B LLaMA model that focuses on high-quality training data rather than sheer volume. Despite a smaller…
A Microsoft bemutatta a pontos API hívások írására optimalizált Gorilla modellt
A Microsoft Research bemutatta a Gorillát, egy LLaMA-alapú modellt, amelyet kifejezetten API hívások generálására finomhangoltak. A Gorilla célja az LLM-ek…
2023. május 29.
Biztonsági auditon esett át a safetensors, és alapértelmezetté vált a nagy AI-szervezeteknél
Olyan AI-szervezetek, mint a Hugging Face, az EleutherAI és a Stability AI összefogtak, hogy finanszírozzák a „safetensors” biztonsági auditját. Ez egy…
George Hotz elindítja a Tiny Corp-ot, hogy az AMD az NVIDIA valódi versenytársává váljon
George Hotz, a legendás hacker és a Comma.ai alapítója új céget alapított Tiny Corp néven, amelynek célja az NVIDIA letaszítása a trónról, mint a világ vezető…
A QLoRA 16-szorosára csökkenti az LLM memóriaigényét az egyetlen GPU-n történő finomhangoláshoz
A Washingtoni Egyetem kutatói bemutatták a QLoRA-t, amely lehetővé teszi a nagy nyelvi modellek rendkívül hatékony finomhangolását csekély hardverigény…
DarkBERT: A sötét weben tanított nyelvi modell a kiberbűnözés felderítésére
A KAIST és az S2W Inc kutatói betanították a „DarkBERT”-et, egy szövegosztályozó modellt, amelyet a Tor-hálózatokon keresztül a sötét webről gyűjtött 6,1…
A Meta MMS projektje több mint 1100 nyelvre terjeszti ki a beszédelismerést
A Meta modellek egy családját fejlesztette ki és tette közzé a Massively Multilingual Speech (MMS) projekt keretében, amellyel az AI-t körülbelül 1000 nyelv…
2023. május 22.
A Palantir mesterséges intelligencia platformot indít katonai és védelmi alkalmazásokhoz
A Palantir, amely kiváló technikai infrastruktúrát biztosít védelmi és hírszerzési ügyfelek (valamint nagyvállalatok) számára, nagy fogadást tesz az AI-ra. Egy…
Szakértői felmérés emeli ki a konszenzust a biztonsági auditok és a red teaming kapcsán
Az AGI laboratóriumoknak „bevetés előtti kockázatértékeléseket, veszélyes képességek kiértékelését, harmadik fél általi modell-auditokat, a modellhasználatra…
A Google bemutatja a PaLM 2-t és integrálja a modellt alaptermékeibe
A Google megalkotta a PaLM 2-t, nagy méretű nyelvmodelljének második generációját – ami még érdekesebb, hogy a PaLM 2-t már számos különböző Google termékbe és…