A Google Gemini 1.5 Pro elérhetővé válik a fejlesztők számára nyilvános előnézetben
A Google hivatalosan is mérföldkőhöz érkezett azzal, hogy a fejlesztők számára nyilvános előnézetben elérhetővé tette a Gemini 1.5 Pro AI-modellt. Ez a lépés nem csupán egy újabb frissítés a piacon, hanem egy komoly technológiai ugrás, hiszen az új modell nemcsak rendkívül intelligens, hanem multimodalitása révén képes az audio- és videótartalmak mélyreható elemzésére is. Az új fejlesztés legkiemelkedőbb tulajdonsága az elképesztő, 1 millió tokenes kontextusablak, amely lehetővé teszi, hogy az eszköz egyszerre több mint 700 000 szót, vagy akár egy órányi videót, illetve 11 órányi hanganyagot is feldolgozzon, alapjaiban változtatva meg ezzel az adatkezelés korlátait.
A Gemini 1.5 Pro érkezése élénkíti a versenyt a technológiai óriások között, amire az OpenAI a GPT-4 Turbo with Vision továbbfejlesztett változatának széles körű elérhetővé tételével reagált. Bár a szakmai közvéleményben és a szűkebb technológiai körökben az Anthropic által fejlesztett Claude jelenleg a chatbotok piacának egyik legelismertebb szereplője, a piaci statisztikák mást mutatnak. A Google Gemini iránti érdeklődés robbanásszerű, a modell látogatottsága már most eléri a ChatGPT forgalmának 25 százalékát, miközben a többi versenyző egyelőre jelentős lemaradásban van ezen a téren.
Ez az újítás azért kulcsfontosságú, mert a hatalmas kontextusablak az úgynevezett AI-ágensek korszakának előszobája, amely a 2024-es év egyik meghatározó AI-trendje lesz. Az, hogy a modellek képesek egyszerre ekkora mennyiségű információt kezelni és közben látni is a beadott tartalmakat, számtalan új gyakorlati alkalmazás előtt nyitja meg az utat. A fejlesztők már most olyan izgalmas eszközökön dolgoznak, mint a nyilvános beszédtechnikai tréner, amely elemzi az előadásmódot és a színpadi jelenlétet, az egykattintásos weboldal- és közösségimédia-auditor, vagy éppen a teljes körű belsőépítészeti tanácsadó. A technológia demokratizálódásával így az idei évben rengeteg olyan új, az eddigieknél jóval komplexebb AI-alapú megoldással fogunk találkozni, amelyek a mindennapi munkafolyamatokat és a kreatív folyamatokat is alapjaiban reformálják meg.
- Nyilvános beszédtechnikai tréner, aki elemzi az előadásmódodat és a színpadi jelenlétedet.
- Egykattintásos weboldal/közösségi média auditor és stratéga.
- Teljes körű belsőépítészeti tanácsadó.
A hatalmas kontextusablak kulcsfontosságú lépés az AI-ágensek felé, ami a „2024-es év nagy AI-trendje”. Ráadásul rengeteg lehetőség nyílik meg, amint hagyjuk, hogy az AI lásson is dolgokat. ---