A PDF és a DOC valószínűleg a digitális dokumentumok leggyakoribb kiterjesztései manapság. Ez azt jelenti, hogy rendelkeznie kell egy PDF-olvasóval és egy DOC-kompatibilis alkalmazással, vagy el van ítélve.
Szerencsére van egy másik trükk, amely lehetővé teszi a PDF, DOC és más népszerű dokumentumformátumok olvasását anélkül, hogy telepítse a kapcsolódó szoftvereket. Csak használd a Text Mining Tool-t, egy egyszerű segédprogramot, amely kivonja a szöveget a programban betöltött fájlokból és megjeleníti a képernyőn. Ezután csak sima formátumban mentse el, vagy másolja közvetlenül a vágólapra későbbi felhasználásra.
A program nem tartalmaz más konfigurációs lehetőségeket, így könnyen kezelhetővé válik. A hátrányban nincs lehetőség a kimenetek testreszabására. Vizsgálataink során a PDF-dokumentumból töröltük a szöveget, és a kapott TXT-fájlok mindegyikét feltörtük, amikor a Notepad-ban nyílt meg (nem nyílt Wordpadon).
Szövegbányászati eszköz jó választás a PDF és a DOC szövegének egyszerű fájlokká való kitermelésére. Tartsa szem előtt, hogy mind a formátum, mind a képek elveszhetnek.
A Text Mining Tool a következő formátumokat támogatja:PDF, DOC, RTF, CHM, HTML
Hozzászólás nem található