Jericho HTML Parser

Szoftver screenshot:
Jericho HTML Parser
Szoftver adatai:
Változat: 3.4
Feltöltés dátuma: 10 Dec 15
Fejlesztő: Martin Jericho
Engedély: Ingyenes
Népszerűség: 105

Rating: 5.0/5 (Total Votes: 1)

szerkesztheti szerver oldali és kliens oldali címkék, megismételve szó szerint el nem számolt, vagy érvénytelen HTML.

Azt is előírja, magas szintű HTML űrlap képességeivel.

Tulajdonságok :

  • A jelenléte helytelenül formázott HTML nem zavarja az elemzés a többi a dokumentum, ami a könyvtár számára ideális & quot; valós & quot; HTML fojtó más értelmezők.
  • ASP, JSP, PSP, PHP és Mason szerver címkék kifejezetten az értelmező által ismert. Ez azt jelenti, hogy a normál HTML továbbra is elemzett megfelelően még ha vannak szerver címkék bennük, ami közös például amikor dinamikus beállításához elem attribútumait.
  • Egy új folyam alapú elemzés opciót a StreamedSource osztály, amely lehetővé teszi a memória hatékony feldolgozása nagy fájlokat egy esemény bejáró. Ez lényegében egy Stax alternatív azzal a képességgel, hogy feldolgozza a HTML és nem érvényesítő XML, valamint számos más funkciók nem érhetők el más streaming értelmezők.
  • a formanyomtatvány ez sem nem egy esemény, sem fa alapú elemző, hanem kombinációját alkalmazza egyszerű szöveges keresés, hatékony kulcsszó elismerést és a címkét helyzetben cache. A szöveg a teljes forrást dokumentum első betöltődik a memóriába, és akkor is csak az érintett szegmensek kereste a megfelelő karaktereket az egyes keresési műveletet.
  • képest egy fa alapú elemző, mint a DOM, a memória és erőforrás követelmények is sokkal jobb, ha csak kis része a dokumentumnak kell értelmezett vagy módosítani. Hibás vagy rosszul formázott HTML könnyen lehet figyelmen kívül hagyni, ellentétben fa alapú elemzők találhatóak, amelyek azonosítania kell minden csomópont a dokumentumban fentről lefelé.
  • Összehasonlítva egy esemény alapú elemző, például a SAX, a felület egy sokkal magasabb szintű és intuitívabb, és egy fa ábrázolása dokumentum elem hierarchia könnyen létre, ha szükséges.
  • A kezdetét és végét pozíciókat a forrás dokumentum összes elemzett szegmensek számára hozzáférhetők, így módosítását csak a kijelölt szegmensek a dokumentum anélkül, hogy helyreállítsa a teljes dokumentum egy fáról.
  • A sorok és oszlopok száma minden helyzetben a forrás dokumentum könnyen megközelíthető.
  • egy egyszerű, de átfogó felületet biztosít az elemzés és manipuláció HTML formában ellenőrzések, beleértve a kitermelés és a lakosság a kezdeti érték, és a konverziós a csak olvasható vagy az adatok megjelenítési módok. Elemzése formájában ellenőrzések is lehetővé teszi kapott adatok formájában kell tárolni és bemutatni a megfelelő módon.
  • beépített funkciókat kivonat minden szöveget HTML jelölőnyelv, amely alkalmas a lépéseket, amelyek szöveges kereső, mint az Apache Lucene.
  • beépített funkciók a HTML jelölőnyelv egyszerű szöveg formázását.
  • beépített funkciókat formázni HTML forráskód, hogy beljebb elemeket aszerint, hogy azok mélységgel a dokumentum elem hierarchiában. (Kattintson ide, hogy egy online bemutató)
  • beépített funkciókat kompakt HTML forráskód eltávolítva minden felesleges szóköz.
  • Egyéni tag típusok könnyen meghatározott és regisztrált elismerés az elemző által.

Mi az új ebben a kiadásban:

  • Added Forrás (File) kivitelező.
  • Added OutputDocument.getSegment () metódust.
  • Added OutputDocument.remove (int kezdődik, int végén) módszerrel.
  • Added Renderer.setHRLineLength () metódust.
  • Added RenderToText.jsp webapp mintát.
  • Added Segment.getRowColumnVector () metódust.
  • A kódolás felderítése most figyelmen kívül hagyja a közös kódolásban meghatározott meta tagek, hogy van egy kódot egység mérete összeegyeztethetetlen az előzetes kódolás.

Mi az új 3.1 verzió:

  • hibajavítások:
  • Végtelen hurok Segment.getAllStartTags ()
  • Végtelen hurok Segment.getAllElements ()
  • Segment.getFirst * módszereket visszatért szegmensek kívül a határoló szegmens.
  • Segment.getAllElements módszerek nem tért vissza minden zárt elemeket bizonyos körülmények között.
  • Fix dokumentációt hibákat Segment.getAllElements módszereket.
  • Added StreamedSource osztály.
  • módosításokat, amelyek befolyásolják a viselkedést, a meglévő programok:
  • Megváltozott ParseText osztályról interfész.
  • Segment.getNodeIterator () most visszatér referenciákkal külön csomópont.
  • Added tag keresési módszerek alapján attribútum értéke reguláris kifejezések.
  • Added tag keresési módszereken alapuló HTML class attribútum.
  • Added statikus Source.LegacyNodeIteratorCompatabilityMode ingatlan ideiglenesen helyreállítani Segment.getNodeIterator (Funkció), hogy a korábbi verziók.
  • Az eltávolított char [] alapú keresési módszerek ParseText.
  • Added CharacterReference.appendCharTo (Appendable) módszerrel.
  • Added OutputDocument (szegmens) kivitelező.
  • Added StreamedSourceCopy mintaprogram.

Hasonló program

eLyXer
eLyXer

6 Jun 15

DOMQL
DOMQL

6 Jun 15

h5ile
h5ile

6 Jun 15

Más szoftver fejlesztő Martin Jericho

Hozzászólások a Jericho HTML Parser

Hozzászólás nem található
Megjegyzés hozzáadása
Kapcsolja be a képeket!
Keresés kategória szerint