PDFTextStream

Szoftver screenshot:
PDFTextStream
Szoftver adatai:
Változat: 2.6.0
Feltöltés dátuma: 20 Feb 15
Engedély: Shareware
Ár: 1900.00 $
Népszerűség: 2

Rating: nan/5 (Total Votes: 0)

PDFTextStream projekt egy PDF szöveg és metaadatok kinyerése könyvtár elérhető Java, Python, és a .NET.
Támogatja az összes verzió PDF dokumentum specifikáció, (beleértve v1.6, használt Acrobat 7), kitermelése szöveget kódolt kettős-bájtos karakterkészletet (például a kínai, japán és koreai), dekódolást 40 bites és 128 bites titkosított dokumentumokat, és kitermelése összes dokumentum metaadatok által nyújtott PDF dokumentumok (beleértve a formában adatokat, a könyvjelzők és jegyzetek).
Egyszerű integráció a Jakarta Lucene tartalmazza.

Mi az új ebben a kiadásban:

  • Ez a verzió tartalmazza a különböző javítások készül hogy biztosítsák PDFTextStream képes kitermelése szöveges PDF dokumentumokból, amelyek nem megfelelő a PDF specifikáció.
  • Ez is számos teljesítménybeli javulást.

Mi az új a 2.3.0 verzió:

  • Bekerült egy .isStruckThrough () metódus com. snowtide.pdf.TextUnit, jelezve, hogy a karakternek van áthúzva húzott át rajta.
  • Továbbfejlesztett PDFTextStream támogatja a beágyazott karakter leképezése.
  • A számítás a szóköz a szavak között javítottuk, hogy megfelelő számot szóköz, amely kifejezetten kódolt a forrás PDF dokumentumokat.
  • Továbbfejlesztett PDFTextStream hozzáállását kompozit tartalmi kódolás, ami korábban sikertelen lehet, ami bizonyos tartományok PDF tartalmat "figyelmen kívül hagyta" extrakció során.
  • Javítva egy hiba VisualOutputTarget ahol a szöveg egyetlen vonal lenne megosztani több sorba
  • Továbbfejlesztett függőleges igazítását szöveget extrahálják VisualOutputTarget
  • Továbbfejlesztett VisualOutputTarget-kivonatait megszüntetése hamis további jelek választják szorosan szomszédos szavakat

Mi az új 2.2.5:

  • Ez a kiadás támogatást ad kitermelése XFA formák adatok XML.
  • Ez jelentősen javítja a teljesítményt szövegkinyerés segítségével VisualOutputTarget. Támogatás a PDF dokumentumok 2GB-nál nagyobb.
  • A javítás a hiba, ha a kódolásban a beágyazott Type1 betűtípusok korábban nem megfelelően alkalmazzák-e bizonyos körülmények között.
  • A javítás a probléma, ahol újabb tartalmat frissített PDF dokumentumok néha figyelmen kívül hagyják.
  • A javítás a probléma, ha PDFDocEncoding-kódolt könyvjelzők és metaadatok nem éppen dekódolt megfelelően.
  • A .getDestinationName () metódus com.snowtide.pdf.Bookmark.

követelmények :

  • Apache Lucene

Hozzászólások a PDFTextStream

Hozzászólás nem található
Megjegyzés hozzáadása
Kapcsolja be a képeket!