Jericho HTML Parser

Szoftver screenshot:
Jericho HTML Parser
Szoftver adatai:
Változat: 3.3
Feltöltés dátuma: 20 Feb 15
Fejlesztő: Martin Jericho
Engedély: Ingyenes
Népszerűség: 56

Rating: nan/5 (Total Votes: 0)

Jerich HTML értelmező egy nyílt forráskódú, egyszerű, mégis erőteljes könyvtár írva teljesen Java.
Ez lehetővé teszi a programozók manipulálni, és elemezni részei a HTML dokumentumot.
Jerich HTML elemzőnek magában foglalja a magas szintű HTML formában képességeivel.

Mi az új ebben a kiadásban:

  • hibajavítások:
  • [3581664] CharacterReference.decode () nem dekódolja szervezetek tartalmazó számjegy - & frac12; & Frac14; & Frac34; & Sup1; & Sup2; & Sup3; & There4;
  • [3311286] SourceCompactor nem tartja tiszteletben textarea
  • [3519131] leképező kimeneti helytelen, ha megépítendő, Element objektum.
  • [3538829] leképező kimenete font díszítés mondathatárokon helytelen.
  • Segment.getAllStartTags (név) és Segment.getFirstElement (név) nem működik, ha az érvelés tartalmaz nagybetűket is.
  • A végén határoló közös szerveren tag belsejében egy szökött szerveren tag hamisan elismert végén határoló a szökött tag.
  • változásokat, amelyek hatással lehetnek az VISELKEDÉSÉNEK meglévő programok:
  • [3427073] Segment.getStyleURISegments () már tartalmazza stíluselem tartalmának, valamint a stílus attribútum értékeket.
  • [3427927] Segment.getURIAttributes () már tartalmazza az archívum attribútumok az objektum és a applet elemeket.
  • Comments már nem ismerik belülről script elemek során teljes szekvenciális parse. Korábban elismerték őket a kompatibilitást a főbb böngészők, de modern böngésző viselkedése megváltozott.
  • Megváltozott a naplózási szintet az összes fájlrendszeren a INFO hibát, és a naplózási szintet a Source.fullSequentialParse () tanácsadói üzenetet WARN az INFO. A korábbi szintet adta a tanácsadói üzenetet a magasabb súlyossági mint az elemzési hibák, megakadályozva naplózó rendszerek bujkál a tanácsadó üzenetet, miközben mutatja elemzési hibáit. Karakterkódolás figyelmeztetések változatlanul WARN szinten.
  • Megváltozott a viselkedését a Renderer.renderHyperlinkURL (StartTag) módszert, hogy a relatív URL-címek nem válnak.
  • Megváltozott a viselkedését a leképező, hogy hivatkozás elem tartalma nem teszi, ha ez megegyezik a hivatkozás URL, figyelmen kívül hagyva a http: // előtag vagy / utótag.
  • EndTag.tidy () mostantól eltávolítja szóközöket a zárás előtt tartó.
  • Added Source (File) kivitelező.
  • Added OutputDocument.getSegment () metódust.
  • Added OutputDocument.remove (int kezdődik, int végén) módszerrel.
  • Added Renderer.setHRLineLength () metódust.
  • Added RenderToText.jsp webapp mintát.
  • Added Segment.getRowColumnVector () metódust.
  • kódolás felismerést most figyelmen kívül hagyja közös kódolásban meghatározott meta tagek, hogy van egy kódot egység mérete összeegyeztethetetlen az előzetes kódolás.
  • Továbbfejlesztett a következő logger API-k: slf4j-api-1.7.2, log4j-1.2.17

Mi az új 3.1-es verziója:

  • hibajavítások:
  • [2793556] Végtelen ciklus a Segment.getAllStartTags ()
  • Végtelen ciklus a Segment.getAllElements ()
  • Segment.getFirst * módszereket visszatért szegmensek kívül határoló szegmens.
  • Segment.getAllElements módszerek nem tért vissza minden zárt elemeket bizonyos körülmények között.
  • Fix dokumentációt hibákat Segment.getAllElements módszereket.
  • Added StreamedSource osztály.
  • változásokat, amelyek hatással lehetnek az VISELKEDÉSÉNEK meglévő programok:
  • Megváltozott ParseText osztályról interfész.
  • Segment.getNodeIterator () most visszatér referenciákkal külön csomópont.
  • Added tag keresési módszerek alapján attribútum értéke reguláris kifejezések.
  • Added tag keresési módszerek alapján HTML class attribútum.
  • Added statikus Source.LegacyNodeIteratorCompatabilityMode ingatlan ideiglenesen helyreállítani Segment.getNodeIterator () funkciót, hogy a korábbi verziók.
  • Az eltávolított char [] alapú keresési módszerek ParseText.
  • Added CharacterReference.appendCharTo (Appendable) módszerrel.
  • Added OutputDocument (szegmens) kivitelező.
  • Added StreamedSourceCopy mintaprogram.

Mi az új 3.0 verzió:

  • hibajavítások:
  • Karakter referenciák képviselő unicode kiegészítő karakterek nem helyesen dekódolni az UTF-16 kóddal egység párokat.
  • [2188446] Element.getDepth () és Element.getParentElement () visszaadott hibás eredmény, ha hívják parse on demand módban.
  • Comments Most már elismerten belül & lt; script & gt; elemek.
  • API változások, amelyek nem kompatibilisek:
  • Megváltozott csomag neve net.htmlparser.jericho
  • tulajdonságadato- kell most karakterlánc helyett CharSequence.
  • eltávolította az összes elavult módszerek / osztályok az előző változatokhoz képest.
  • Minden megtalálják * módszereket Idejétmúlt kap * módszerek alkalmazása érdekében következetes elnevezési konvenció minden tag keresési módszereket.
  • Tag, Element és HTMLElements osztályok már nem hajtsák végre a HTMLElementName felületet. (Statikus import helyett)
  • Minden gyűjtemény most stongly gépelt segítségével generikumok.
  • Megváltozott FormControlOutputStyle osztály enum.
  • Megváltozott FormControlType osztály enum.
  • Added CharStreamSource.appendTo (Appendable) módszerrel.
  • Added Source.iterator () metódust.
  • Forrás most végre Iterable.
  • Belsőleg használja StringBuilder a jobb teljesítmény érdekében.
  • Added Source.getNextStartTag (StartTagType) módszerrel.
  • Added Source.getNextEndTag (EndTagType) módszerrel.
  • Added Source.getPreviousStartTag (StartTagType) módszerrel.
  • Added Source.getPreviousEndTag (EndTagType) módszerrel.
  • Added Segment.getAllStartTags (StartTagType) módszerrel.
  • Added minden Segment.getFirst * módszereket.
  • Added Renderer.renderHyperlinkURL (StartTag) módszerrel.
  • Added HTMLSanitiser mintaprogram.
  • Frissített slf4j-api-1.5.6

követelmények :

  • Java 2 Standard Edition Runtime Environment

Hasonló program

xml2rfc
xml2rfc

20 Feb 15

WP2LaTeX
WP2LaTeX

20 Feb 15

RXP
RXP

3 Jun 15

Más szoftver fejlesztő Martin Jericho

Hozzászólások a Jericho HTML Parser

Hozzászólás nem található
Megjegyzés hozzáadása
Kapcsolja be a képeket!