MI Történik?

Mesterséges intelligencia hírek magyarul — naponta frissülve

← Vissza a főoldalra

A Zerox OCR a GPT-4o Minit használja a kiváló minőségű dokumentumszöveg-kinyeréshez

Az OCR egyszerűbbé vált a Zerox OCR-nek köszönhetően, amely egy rendkívül egyszerű open-source megoldás a szöveg kinyerésére dokumentumokból AI feldolgozás céljából. A dokumentumok természetüknél fogva vizuálisak, tele trükkös elrendezésekkel, táblázatokkal és grafikonokkal, így a látásmodellek (vision models) tökéletesen alkalmasak a feladatra. A Zerox a GPT-4o Minit használja a vizuális dokumentumok karakterekké alakítására, az OCR mintájára. Bár alapvetőnek hangozhat, a Zerox OCR a gpt-4o-mini-vel egyszerre költséghatékony és jobb eredményeket nyújt a meglévő specializált megoldásokhoz képest, mint például az AWS Textract, a Google Document AI vagy az Azure Document AI.
Miért fontos?

A Zerox OCR költséghatékony alternatívát kínál a vállalati OCR szolgáltatásokkal szemben, miközben kiváló eredményeket ér el a modern LLM-ek vizuális érvelési képességeinek kihasználásával.

Eredeti forrás megtekintése (angol) →