MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

Az Anthropic Claude API Erőteljes Új PDF-feldolgozást Kap

Az Anthropic bevezetett egy erőteljes új PDF-feldolgozási funkciót a Claude API-jában, túlmutatva az alapvető szövegkinyerésen, és nagyrészt radar alatt maradt. Történelmileg sok LLM elakad, ha a dokumentumok komplex elemeket, például képeket, diagramokat és LaTeX képleteket tartalmaznak. De az Anthropic legújabb frissítése képes elemezni mind a szöveges, mind a vizuális tartalmat egy PDF-en belül – nincs szükség extra kódolási varázslatra. Úgy működik, hogy minden PDF-et két komponensre bont: a szöveget normál módon kinyerik, és a teljes oldalt képpé alakítják. Claude ezután összevonja a szöveges és vizuális kontextust a holisztikusabb megértés érdekében. Lényegében az LLM intelligenciát kombinálja alapvető computer vision technikákkal. Az API akár 32 MB vagy 100 oldalnyi PDF tartalmat is támogat, és az árképzés hasonló az LLM árképzéséhez, így nincs prémium költség a PDF elemzésért.
Miért fontos?

Ez az API drámaian racionalizálhatja a pénzügyi jelentések, jogi dokumentumok vagy bármely részletes értelmezést igénylő PDF kezelését. ---

Eredeti forrás megtekintése (angol) →