MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2023. július 10.
A Databricks 1,3 milliárd dollárért felvásárolja a MosaicML generatív AI platformot
Software company Databricks has acquired AI training company MosaicML for $1.3 billion. The acquisition is a sign of how strategic AI is becoming to large…
2023. július 2.
A Microsoft Phi-1 a tankönyvi minőségű adatokra fókuszál a kódolás terén
Microsoft introduces phi-1 - a smaller and more efficient language model for code, trained on textbook quality data and synthetic exercises. The model shows…
A Meta AI kiadta a MusicGen-t a vezérelhető szöveg-hang generáláshoz
A Meta AI nagy feltűnést keltett a MusicGen kiadásával, amely egy gyönyörűen egyszerű és vezérelhető modell a szöveges utasításokon és bemeneti dallamokon…
A Google StyleDrop lehetővé teszi a művészi stílus precíz másolását egyetlen kép alapján
A képi és videós fronton a Google megjelentette a StyleDropot, egy sokoldalú módszert, amely kiemelkedő minőségben teszi lehetővé képek generálását…
A Microsoft Orca 13B a GPT-4 érvelését utánozza a teljesítmény növelése érdekében
A Microsoft bemutatja az Orcát – egy 13 milliárd paraméteres modellt, amely a kereskedelmi LLM-ek, például a GPT-4 érvelési folyamatát utánozza, felülmúlva a…
A Salesforce bemutatja az XGen-7B LLM-et bővített kontextusablakkal
A Salesforce bemutatja az XGen-7B-t – egy új, 7 milliárd paraméteres, 8k kontextusablakkal rendelkező LLM-et, amely a SOTA open-source LLM-ekhez, például az…
A MosaicML kiadta az MPT-30B nyílt forráskódú LLM-et kereskedelmi licenccel
Ebben a hónapban tanúi lehettünk további SOTA nyílt forráskódú nyelvi modellek felemelkedésének, mint például az MPT-30B. A MosaicML bemutatja az MPT-30B-t –…
2023. június 26.
A modellek kizárólag szintetikus adatokon történő tanítása visszafordíthatatlan modellösszeomlást okoz
Az Oxfordi Egyetem, a Cambridge-i Egyetem, a Torontói Egyetem és az Imperial College London kutatói felfedezték, hogy az AI-rendszerek tönkretehetők, ha…
Kutatások szerint a mikromunka-platformok dolgozóinak jelentős része LLM-eket használ a feladatok elvégzéséhez
Az EPFL kutatói bizonyítékot találtak arra, hogy a mikromunka-platformok dolgozói (crowdworkers) elkezdték a generatív AI eszközöket, például a ChatGPT-t…
Az Inflection AI startup közzétette az Inflection-1 modell teljesítményének részleteit
Az Inflection AI startup közzétett néhány részletet az Inflection-1 nevű nyelvi modelljéről. Az Inflection egy viszonylag ismeretlen startup, amelynek…
Az Egyesült Királyság globális csúcstalálkozót hirdetett a mesterséges intelligencia biztonságáról
Az Egyesült Királyság globális csúcstalálkozó megrendezését tervezi az AI biztonságának garantálása érdekében. A csúcstalálkozó „lehetőséget biztosít a vezető…
2023. június 12.
Elindul az Apollo Research a harmadik féltől származó biztonsági értékelések biztosítására
Egy új, Apollo Research nevű AI-kutató szervezet jött létre, amelynek célja az AI-vállalatok biztonságának növelése: a) nem biztonságos AI-viselkedések…
AI-vezetők globális nyilatkozatot írtak alá a kihalás veszélyeire figyelmeztetve
Több mint 200 AI-kutató és vállalkozó – köztük az Anthropic, a DeepMind és az OpenAI vezérigazgatói – aláírt egy nyilatkozatot, amely szerint az AI okozta…
A Meta kiadta a MusicGen AI-t az irányítható hanggeneráláshoz
A Facebook megalkotta a MusicGen nevű AI-modellt, amely „egylépcsős nyelvi modellként, hatékony kódkönyv-összefűzési stratégia révén képes konzisztens zenét…
A Cohere a nagy modellek kvantálását javító tanítási stratégiákat vizsgálja
A Cohere AI vállalat kutatói elemzést tettek közzé arról, hogyan befolyásolják az AI-rendszerek tanítása során hozott döntések a kész modellek…
A Meta kiadta a BlenderBot 3x modellt és egy hatalmas emberi visszajelzési adatkészletet
A Facebook közzétette a BlenderBot 3x részleteit, amely egy olyan nagy nyelvi modell, amelyet a korábbi, BlenderBot nevű modell nyilvános használata során…
2023. június 4.
A Microsoft bemutatta a pontos API hívások írására optimalizált Gorilla modellt
A Microsoft Research bemutatta a Gorillát, egy LLaMA-alapú modellt, amelyet kifejezetten API hívások generálására finomhangoltak. A Gorilla célja az LLM-ek…
A Meta AI bemutatta a LIMA modellt, amely minimális adattal is kimagasló teljesítményt nyújt
Meta AI has unveiled LIMA, a fine-tuned version of its 65B LLaMA model that focuses on high-quality training data rather than sheer volume. Despite a smaller…
A Falcon LLM megszerezte az első helyet a Hugging Face nyílt ranglistáján
The Technology Innovation Institute (TII) has open-sourced Falcon, a powerful new large language model that is commercially permissible. Upon its release,…
A Google Med-PaLM 2 szakértői szintet ért el az orvosi vizsgákon
Google has rolled out Med-PaLM 2, a specialized variant of the PaLM model specifically optimized for medical questions and reasoning. The model has…