MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

2023. július 31.
A Meta a Microsofttal együttműködésben nyíltan közzéteszi a Llama 2 súlyait
A Facebook megjelentette a Llama 2-t, egy nagy teljesítményű nyelvi modellt. Jelenleg a Llama 2 a világ legképzettebb olyan nyelvi modellje, amelynek súlyai…
2023. július 29.
A Meta kiadta a Llama 2 nyílt forráskódú modellt, amely felülmúlja a korábbi LLM-eket
A Meta közzétette a Llama 2-t, nyílt forráskódú nagy nyelvi modelljének új verzióját, amely versenyképes teljesítményt nyújt a ChatGPT-vel és a Barddal…
Az OpenAI minden Plus felhasználó számára elérhetővé tette a GPT-4-et és a Code Interpreter-t
Az OpenAI hivatalosan is megnyitotta a hozzáférést a GPT-4-hez és a nagy teljesítményű Code Interpreter eszközéhez minden ChatGPT Plus előfizető számára. A…
A Google DeepMind bemutatta a Med-PaLM Multimodal modellt a fejlett orvosbiológiai adatok értelmezéséhez
A Google DeepMind közzétette a Med-PaLM Multimodal-t, egy élvonalbeli orvosi AI-t, amely képes különféle orvosbiológiai adattípusok értelmezésére. Ez a modell…
Kutatók teljesítményromlást és sebezhetőségeket azonosítottak a vezető zárt forráskódú LLM-ekben
A Stanford, a Berkeley és a Carnegie Mellon legújabb tanulmányai aggodalmakat vetettek fel a zárt forráskódú AI modellek konzisztenciájával és biztonságával…
2023. július 27.
A Stability AI bemutatta a FreeWilly1 és FreeWilly2 nyelvi modelleket
A Stability AI két új, nagy teljesítményű nagy nyelvi modellt jelentett be, a FreeWilly1-et és a FreeWilly2-t, amelyek a ChatGPT-hez hasonló…
2023. július 2.
A MosaicML kiadta az MPT-30B nyílt forráskódú LLM-et kereskedelmi licenccel
Ebben a hónapban tanúi lehettünk további SOTA nyílt forráskódú nyelvi modellek felemelkedésének, mint például az MPT-30B. A MosaicML bemutatja az MPT-30B-t –…
A Salesforce bemutatja az XGen-7B LLM-et bővített kontextusablakkal
A Salesforce bemutatja az XGen-7B-t – egy új, 7 milliárd paraméteres, 8k kontextusablakkal rendelkező LLM-et, amely a SOTA open-source LLM-ekhez, például az…
A Microsoft Orca 13B a GPT-4 érvelését utánozza a teljesítmény növelése érdekében
A Microsoft bemutatja az Orcát – egy 13 milliárd paraméteres modellt, amely a kereskedelmi LLM-ek, például a GPT-4 érvelési folyamatát utánozza, felülmúlva a…
A Google StyleDrop lehetővé teszi a művészi stílus precíz másolását egyetlen kép alapján
A képi és videós fronton a Google megjelentette a StyleDropot, egy sokoldalú módszert, amely kiemelkedő minőségben teszi lehetővé képek generálását…
A Meta AI kiadta a MusicGen-t a vezérelhető szöveg-hang generáláshoz
A Meta AI nagy feltűnést keltett a MusicGen kiadásával, amely egy gyönyörűen egyszerű és vezérelhető modell a szöveges utasításokon és bemeneti dallamokon…
A Microsoft Phi-1 a tankönyvi minőségű adatokra fókuszál a kódolás terén
Microsoft introduces phi-1 - a smaller and more efficient language model for code, trained on textbook quality data and synthetic exercises. The model shows…
2023. június 26.
Az Egyesült Királyság globális csúcstalálkozót hirdetett a mesterséges intelligencia biztonságáról
Az Egyesült Királyság globális csúcstalálkozó megrendezését tervezi az AI biztonságának garantálása érdekében. A csúcstalálkozó „lehetőséget biztosít a vezető…
Az Inflection AI startup közzétette az Inflection-1 modell teljesítményének részleteit
Az Inflection AI startup közzétett néhány részletet az Inflection-1 nevű nyelvi modelljéről. Az Inflection egy viszonylag ismeretlen startup, amelynek…
2023. június 12.
A Meta kiadta a BlenderBot 3x modellt és egy hatalmas emberi visszajelzési adatkészletet
A Facebook közzétette a BlenderBot 3x részleteit, amely egy olyan nagy nyelvi modell, amelyet a korábbi, BlenderBot nevű modell nyilvános használata során…
A Cohere a nagy modellek kvantálását javító tanítási stratégiákat vizsgálja
A Cohere AI vállalat kutatói elemzést tettek közzé arról, hogyan befolyásolják az AI-rendszerek tanítása során hozott döntések a kész modellek…
A Meta kiadta a MusicGen AI-t az irányítható hanggeneráláshoz
A Facebook megalkotta a MusicGen nevű AI-modellt, amely „egylépcsős nyelvi modellként, hatékony kódkönyv-összefűzési stratégia révén képes konzisztens zenét…
AI-vezetők globális nyilatkozatot írtak alá a kihalás veszélyeire figyelmeztetve
Több mint 200 AI-kutató és vállalkozó – köztük az Anthropic, a DeepMind és az OpenAI vezérigazgatói – aláírt egy nyilatkozatot, amely szerint az AI okozta…
Elindul az Apollo Research a harmadik féltől származó biztonsági értékelések biztosítására
Egy új, Apollo Research nevű AI-kutató szervezet jött létre, amelynek célja az AI-vállalatok biztonságának növelése: a) nem biztonságos AI-viselkedések…
2023. június 4.
Az Anthropic 100 000 tokenre növeli a Claude kontextusablakát
Anthropic's Claude, a primary competitor to OpenAI's GPT models, has announced support for a massive 100,000-token context window. This development…