PDF Extract Kit a specializált dokumentum-információ kinyeréséhez

2024. szeptember 22. · MI Történik? · 1 perc olvasás

Az információk kinyerése dokumentumokból az AI egyik legfontosabb célkitűzése volt. Egy új open-source projekt specializált AI modelleket vet be, hogy közvetlenül kezelje ezt a kihívást. A PDF-Extract-Kit egy átfogó folyamatrendszer (pipeline), amely több komponensre bontja a PDF-tartalom kinyerését. Különböző adathalmazokon tanítva, ezek a modellek különféle dokumentumtípusokat kezelnek, az akadémiai tanulmányoktól a pénzügyi jelentésekig.

Elrendezés detektálás (Layout detection) – a LayoutLMv3 használata a régiók, például képek, táblázatok, címek és szövegek pontos azonosítására
Táblázatfelismerés – a StructEqTable segítségével az összetett táblázatokat LaTeX formátumba konvertálja
OCR – a PaddleOCR alkalmazása a nagy teljesítményű szövegkinyeréshez több nyelven
Képletfelismerés – a YOLOv8 használata az inline és izolált képletek pontos detektálására
Képlet-visszafejtés – az UniMERNet alkalmazása, amely a kereskedelmi szoftverekkel vetekszik a képletfelismerés minőségében

Eredeti forrás megtekintése (angol) →

Kapcsolódó hírek

A Mondo Robotics bemutatta Benit, az autonóm kamerarobotot tartalomgyártók számára

4 órája

A Booster Robotics humanoidja falat is átütő rúgással debütált a futballbemutatón

6 órája

Az Aceii A1 mobil teniszrobot dinamikus AI-edzést kínál

7 órája