MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Exa bemutatja a Websets nevű, AI adatbázis-stílusú webes keresőmotorját

Az Exa nevű keresős startup egy ambiciózus újítással lépett a piacra: elindították a Websets nevű keresőmotort, amely alapjaiban értelmezi újra az internetes információszerzést. A projekt célkitűzése nem kisebb, mint a világháló kaotikus adathalmazának egy jól strukturált, átlátható adatbázissá alakítása. A fejlesztés középpontjában a nagy nyelvi modelleknél (LLM) már bizonyított embedding technológia áll, amely lehetővé teszi a tartalom mélyebb, jelentésalapú feldolgozását a hagyományos, felszínes kulcsszóegyeztetés helyett. Ezzel az Exa egyfajta „tökéletes webes keresést” kíván megalkotni, ahol a relevancia már nem csak a szavak ismétlődésén, hanem a valódi kontextuson és fogalmi összefüggéseken alapul.

Míg a hagyományos keresőmotorok – mint amilyen a Google – a kulcsszavak puszta egyezésére támaszkodnak, az Exa megközelítése alapvetően más technológiai alapokon nyugszik. A rendszer a weboldalak tartalmát matematikai beágyazásokká, azaz embeddingekké kódolja. Ez a módszer képessé teszi az algoritmust arra, hogy felfogja a szövegek mögötti jelentést, így a keresés akkor is pontos találatokat ad, ha a felhasználó nem pont azokat a szavakat használja, amelyek a céloldalon szerepelnek. Érdekes stratégiai döntés a vállalat részéről, hogy nem a mennyiségi versenyre koncentrálnak: körülbelül 1 milliárd weboldalt dolgoztak fel, ami eltörpül a Google billiónyi oldalas indexe mellett. Azonban az Exa a megértés mélységét és a minőséget részesíti előnyben a puszta szélességgel szemben, egyfajta prémium tudásbázist hozva létre a weben.

Az új technológia használata egyelőre némi türelmet igényel a felhasználók részéről, hiszen a bonyolult matematikai műveletek és a mélyreható elemzés miatt egy-egy keresés feldolgozása akár több percet is igénybe vehet. Ez az áldozat azonban megtérül azokban az esetekben, amikor összetett adatigények merülnek fel, és a rendszer rendkívül specifikus, akár több száz vagy ezer releváns elemet tartalmazó listákat ad vissza. A platform kiemelkedően teljesít, ha specifikus típusú vállalatokat, szakértőket vagy ritka adatkészleteket kell felkutatni az internet zajában, amivel a hagyományos keresők gyakran küzdenek. A Websets az Exa első olyan terméke, amely közvetlenül a végfelhasználókat célozza meg, de a startup továbbra is kínál backend szolgáltatásokat és API hozzáférést azon vállalkozások számára, amelyek saját rendszereikbe szeretnék integrálni ezt a forradalmi technológiát.

A Websets megjelenése azért bír kiemelt jelentőséggel az AI-iparágban, mert merőben új irányt mutat a keresés evolúciójában. Miközben a legtöbb piaci szereplő és tech óriás arra fókuszál, hogy meglévő, klasszikus keresőmotorjait LLM-alapú chatbotokkal egészítse ki, az Exa az alapoktól építette fel újra a keresés logikáját. Ez a strukturált, adatbázis-központú megközelítés gyökeresen megváltoztathatja azt, ahogyan az információkat rendszerezzük és elérjük a jövőben. Bár a jelenlegi sebessége még nem teszi alkalmassá a mindennapi, azonnali válaszokat igénylő lekérdezésekre, a webes adatok közötti mély, rejtett mintázatok feltárásában a Websets olyan szintű hatékonyságot ígér, amely korábban elérhetetlen volt a kutatók és az adatokkal dolgozó szakemberek számára.

Miért fontos?

Miközben mások azon versenyeznek, hogy AI-modelleket szőjenek a klasszikus keresőmotorokba, az Exa az alapoktól gondolja újra a keresést. Bár jelenleg lassabb, mint a normál keresés, ez az adatbázis-stílusú megközelítés forradalmasíthatja a webes információk megtalálását és rendszerezését — különösen az interneten átívelő mélyebb, specifikus minták felszínre hozatalában.

Eredeti forrás megtekintése (angol) →
Kapcsolódó hírek
NYT-újságíró AI segítségével, ingatlanügynök nélkül adta el házát
most
Az Anthropic megerősítette, hogy a nagyteljesítményű Mythos modell hamarosan elérhető lesz a nyilvánosság számára
most
Az ElevenLabs Music v2 lehetővé teszi a szám közbeni műfajváltást és a gyors repet
most