Az Anthropic Claude API Erőteljes Új PDF-feldolgozást Kap

2025. január 2. · MI Történik? · 1 perc olvasás

Az Anthropic bevezetett egy erőteljes új PDF-feldolgozási funkciót a Claude API-jában, túlmutatva az alapvető szövegkinyerésen, és nagyrészt radar alatt maradt. Történelmileg sok LLM elakad, ha a dokumentumok komplex elemeket, például képeket, diagramokat és LaTeX képleteket tartalmaznak. De az Anthropic legújabb frissítése képes elemezni mind a szöveges, mind a vizuális tartalmat egy PDF-en belül – nincs szükség extra kódolási varázslatra. Úgy működik, hogy minden PDF-et két komponensre bont: a szöveget normál módon kinyerik, és a teljes oldalt képpé alakítják. Claude ezután összevonja a szöveges és vizuális kontextust a holisztikusabb megértés érdekében. Lényegében az LLM intelligenciát kombinálja alapvető computer vision technikákkal. Az API akár 32 MB vagy 100 oldalnyi PDF tartalmat is támogat, és az árképzés hasonló az LLM árképzéséhez, így nincs prémium költség a PDF elemzésért.

PDF szövegek, képek és táblázatok automatikus elemzése további elemzés céljából, a csatolt PDF-fel kapcsolatos kérdések megválaszolásától az strukturálatlan adatok formázott JSON-okká alakításáig
Diagramokba és ábrákba való betekintés nyújtása a vizuális kontextus, nem csupán a szöveges címkék értékelésével
LaTeX kinyerése és értelmezése tudományos vagy műszaki dokumentációhoz

Miért fontos?

Ez az API drámaian racionalizálhatja a pénzügyi jelentések, jogi dokumentumok vagy bármely részletes értelmezést igénylő PDF kezelését. ---

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Google 2000 nyugdíjas Pixel telefonból épít szuperszámítógépet

1 órája

A Moonshot AI kiadta a nyílt forráskódú Kimi 2.7-Code modellt

3 órája

Az AARRI-Bench etikus és gondos kutatógyakornokként értékeli az AI-ágenseket

5 órája

Tudj meg többet

Claude AI: Az Anthropic chatbotja amit kevesen ismernek Magyarországon

ChatGPT vs Claude vs Gemini - Melyiket válaszd 2026-ban?