Jericho HTML Parser

Szoftver screenshot:
Jericho HTML Parser
Szoftver adatai:
Változat: 3.3
Feltöltés dátuma: 20 Feb 15
Fejlesztő: Martin Jericho
Engedély: Ingyenes
Népszerűség: 56

Rating: nan/5 (Total Votes: 0)

Jerich HTML értelmező egy nyílt forráskódú, egyszerű, mégis erőteljes könyvtár írva teljesen Java.
Ez lehetővé teszi a programozók manipulálni, és elemezni részei a HTML dokumentumot.
Jerich HTML elemzőnek magában foglalja a magas szintű HTML formában képességeivel.

Mi az új ebben a kiadásban:

  • hibajavítások:
  • [3581664] CharacterReference.decode () nem dekódolja szervezetek tartalmazó számjegy - & frac12; & Frac14; & Frac34; & Sup1; & Sup2; & Sup3; & There4;
  • [3311286] SourceCompactor nem tartja tiszteletben textarea
  • [3519131] leképező kimeneti helytelen, ha megépítendő, Element objektum.
  • [3538829] leképező kimenete font díszítés mondathatárokon helytelen.
  • Segment.getAllStartTags (név) és Segment.getFirstElement (név) nem működik, ha az érvelés tartalmaz nagybetűket is.
  • A végén határoló közös szerveren tag belsejében egy szökött szerveren tag hamisan elismert végén határoló a szökött tag.
  • változásokat, amelyek hatással lehetnek az VISELKEDÉSÉNEK meglévő programok:
  • [3427073] Segment.getStyleURISegments () már tartalmazza stíluselem tartalmának, valamint a stílus attribútum értékeket.
  • [3427927] Segment.getURIAttributes () már tartalmazza az archívum attribútumok az objektum és a applet elemeket.
  • Comments már nem ismerik belülről script elemek során teljes szekvenciális parse. Korábban elismerték őket a kompatibilitást a főbb böngészők, de modern böngésző viselkedése megváltozott.
  • Megváltozott a naplózási szintet az összes fájlrendszeren a INFO hibát, és a naplózási szintet a Source.fullSequentialParse () tanácsadói üzenetet WARN az INFO. A korábbi szintet adta a tanácsadói üzenetet a magasabb súlyossági mint az elemzési hibák, megakadályozva naplózó rendszerek bujkál a tanácsadó üzenetet, miközben mutatja elemzési hibáit. Karakterkódolás figyelmeztetések változatlanul WARN szinten.
  • Megváltozott a viselkedését a Renderer.renderHyperlinkURL (StartTag) módszert, hogy a relatív URL-címek nem válnak.
  • Megváltozott a viselkedését a leképező, hogy hivatkozás elem tartalma nem teszi, ha ez megegyezik a hivatkozás URL, figyelmen kívül hagyva a http: // előtag vagy / utótag.
  • EndTag.tidy () mostantól eltávolítja szóközöket a zárás előtt tartó.
  • Added Source (File) kivitelező.
  • Added OutputDocument.getSegment () metódust.
  • Added OutputDocument.remove (int kezdődik, int végén) módszerrel.
  • Added Renderer.setHRLineLength () metódust.
  • Added RenderToText.jsp webapp mintát.
  • Added Segment.getRowColumnVector () metódust.
  • kódolás felismerést most figyelmen kívül hagyja közös kódolásban meghatározott meta tagek, hogy van egy kódot egység mérete összeegyeztethetetlen az előzetes kódolás.
  • Továbbfejlesztett a következő logger API-k: slf4j-api-1.7.2, log4j-1.2.17

Mi az új 3.1-es verziója:

  • hibajavítások:
  • [2793556] Végtelen ciklus a Segment.getAllStartTags ()
  • Végtelen ciklus a Segment.getAllElements ()
  • Segment.getFirst * módszereket visszatért szegmensek kívül határoló szegmens.
  • Segment.getAllElements módszerek nem tért vissza minden zárt elemeket bizonyos körülmények között.
  • Fix dokumentációt hibákat Segment.getAllElements módszereket.
  • Added StreamedSource osztály.
  • változásokat, amelyek hatással lehetnek az VISELKEDÉSÉNEK meglévő programok:
  • Megváltozott ParseText osztályról interfész.
  • Segment.getNodeIterator () most visszatér referenciákkal külön csomópont.
  • Added tag keresési módszerek alapján attribútum értéke reguláris kifejezések.
  • Added tag keresési módszerek alapján HTML class attribútum.
  • Added statikus Source.LegacyNodeIteratorCompatabilityMode ingatlan ideiglenesen helyreállítani Segment.getNodeIterator () funkciót, hogy a korábbi verziók.
  • Az eltávolított char [] alapú keresési módszerek ParseText.
  • Added CharacterReference.appendCharTo (Appendable) módszerrel.
  • Added OutputDocument (szegmens) kivitelező.
  • Added StreamedSourceCopy mintaprogram.

Mi az új 3.0 verzió:

  • hibajavítások:
  • Karakter referenciák képviselő unicode kiegészítő karakterek nem helyesen dekódolni az UTF-16 kóddal egység párokat.
  • [2188446] Element.getDepth () és Element.getParentElement () visszaadott hibás eredmény, ha hívják parse on demand módban.
  • Comments Most már elismerten belül & lt; script & gt; elemek.
  • API változások, amelyek nem kompatibilisek:
  • Megváltozott csomag neve net.htmlparser.jericho
  • tulajdonságadato- kell most karakterlánc helyett CharSequence.
  • eltávolította az összes elavult módszerek / osztályok az előző változatokhoz képest.
  • Minden megtalálják * módszereket Idejétmúlt kap * módszerek alkalmazása érdekében következetes elnevezési konvenció minden tag keresési módszereket.
  • Tag, Element és HTMLElements osztályok már nem hajtsák végre a HTMLElementName felületet. (Statikus import helyett)
  • Minden gyűjtemény most stongly gépelt segítségével generikumok.
  • Megváltozott FormControlOutputStyle osztály enum.
  • Megváltozott FormControlType osztály enum.
  • Added CharStreamSource.appendTo (Appendable) módszerrel.
  • Added Source.iterator () metódust.
  • Forrás most végre Iterable.
  • Belsőleg használja StringBuilder a jobb teljesítmény érdekében.
  • Added Source.getNextStartTag (StartTagType) módszerrel.
  • Added Source.getNextEndTag (EndTagType) módszerrel.
  • Added Source.getPreviousStartTag (StartTagType) módszerrel.
  • Added Source.getPreviousEndTag (EndTagType) módszerrel.
  • Added Segment.getAllStartTags (StartTagType) módszerrel.
  • Added minden Segment.getFirst * módszereket.
  • Added Renderer.renderHyperlinkURL (StartTag) módszerrel.
  • Added HTMLSanitiser mintaprogram.
  • Frissített slf4j-api-1.5.6

követelmények :

  • Java 2 Standard Edition Runtime Environment

Hasonló program

buml
buml

14 Apr 15

vdexcsv
vdexcsv

11 May 15

Moo
Moo

20 Feb 15

didit
didit

12 May 15

Más szoftver fejlesztő Martin Jericho

Hozzászólások a Jericho HTML Parser

Hozzászólás nem található
Megjegyzés hozzáadása
Kapcsolja be a képeket!