Szoftver adatai:
Változat: 3.4
Feltöltés dátuma: 10 Dec 15
Engedély: Ingyenes
Népszerűség: 105
szerkesztheti szerver oldali és kliens oldali címkék, megismételve szó szerint el nem számolt, vagy érvénytelen HTML.
Azt is előírja, magas szintű HTML űrlap képességeivel.
Tulajdonságok :
- A jelenléte helytelenül formázott HTML nem zavarja az elemzés a többi a dokumentum, ami a könyvtár számára ideális & quot; valós & quot; HTML fojtó más értelmezők.
- ASP, JSP, PSP, PHP és Mason szerver címkék kifejezetten az értelmező által ismert. Ez azt jelenti, hogy a normál HTML továbbra is elemzett megfelelően még ha vannak szerver címkék bennük, ami közös például amikor dinamikus beállításához elem attribútumait.
- Egy új folyam alapú elemzés opciót a StreamedSource osztály, amely lehetővé teszi a memória hatékony feldolgozása nagy fájlokat egy esemény bejáró. Ez lényegében egy Stax alternatív azzal a képességgel, hogy feldolgozza a HTML és nem érvényesítő XML, valamint számos más funkciók nem érhetők el más streaming értelmezők.
- a formanyomtatvány ez sem nem egy esemény, sem fa alapú elemző, hanem kombinációját alkalmazza egyszerű szöveges keresés, hatékony kulcsszó elismerést és a címkét helyzetben cache. A szöveg a teljes forrást dokumentum első betöltődik a memóriába, és akkor is csak az érintett szegmensek kereste a megfelelő karaktereket az egyes keresési műveletet.
- képest egy fa alapú elemző, mint a DOM, a memória és erőforrás követelmények is sokkal jobb, ha csak kis része a dokumentumnak kell értelmezett vagy módosítani. Hibás vagy rosszul formázott HTML könnyen lehet figyelmen kívül hagyni, ellentétben fa alapú elemzők találhatóak, amelyek azonosítania kell minden csomópont a dokumentumban fentről lefelé.
- Összehasonlítva egy esemény alapú elemző, például a SAX, a felület egy sokkal magasabb szintű és intuitívabb, és egy fa ábrázolása dokumentum elem hierarchia könnyen létre, ha szükséges.
- A kezdetét és végét pozíciókat a forrás dokumentum összes elemzett szegmensek számára hozzáférhetők, így módosítását csak a kijelölt szegmensek a dokumentum anélkül, hogy helyreállítsa a teljes dokumentum egy fáról.
- A sorok és oszlopok száma minden helyzetben a forrás dokumentum könnyen megközelíthető.
- egy egyszerű, de átfogó felületet biztosít az elemzés és manipuláció HTML formában ellenőrzések, beleértve a kitermelés és a lakosság a kezdeti érték, és a konverziós a csak olvasható vagy az adatok megjelenítési módok. Elemzése formájában ellenőrzések is lehetővé teszi kapott adatok formájában kell tárolni és bemutatni a megfelelő módon.
- beépített funkciókat kivonat minden szöveget HTML jelölőnyelv, amely alkalmas a lépéseket, amelyek szöveges kereső, mint az Apache Lucene.
- beépített funkciók a HTML jelölőnyelv egyszerű szöveg formázását.
- beépített funkciókat formázni HTML forráskód, hogy beljebb elemeket aszerint, hogy azok mélységgel a dokumentum elem hierarchiában. (Kattintson ide, hogy egy online bemutató)
- beépített funkciókat kompakt HTML forráskód eltávolítva minden felesleges szóköz.
- Egyéni tag típusok könnyen meghatározott és regisztrált elismerés az elemző által.
Mi az új ebben a kiadásban:
- Added Forrás (File) kivitelező.
- Added OutputDocument.getSegment () metódust.
- Added OutputDocument.remove (int kezdődik, int végén) módszerrel.
- Added Renderer.setHRLineLength () metódust.
- Added RenderToText.jsp webapp mintát.
- Added Segment.getRowColumnVector () metódust.
- A kódolás felderítése most figyelmen kívül hagyja a közös kódolásban meghatározott meta tagek, hogy van egy kódot egység mérete összeegyeztethetetlen az előzetes kódolás.
Mi az új 3.1 verzió:
- hibajavítások:
- Végtelen hurok Segment.getAllStartTags ()
- Végtelen hurok Segment.getAllElements ()
- Segment.getFirst * módszereket visszatért szegmensek kívül a határoló szegmens.
- Segment.getAllElements módszerek nem tért vissza minden zárt elemeket bizonyos körülmények között.
- Fix dokumentációt hibákat Segment.getAllElements módszereket.
- Added StreamedSource osztály.
- módosításokat, amelyek befolyásolják a viselkedést, a meglévő programok:
- Megváltozott ParseText osztályról interfész.
- Segment.getNodeIterator () most visszatér referenciákkal külön csomópont.
- Added tag keresési módszerek alapján attribútum értéke reguláris kifejezések.
- Added tag keresési módszereken alapuló HTML class attribútum.
- Added statikus Source.LegacyNodeIteratorCompatabilityMode ingatlan ideiglenesen helyreállítani Segment.getNodeIterator (Funkció), hogy a korábbi verziók.
- Az eltávolított char [] alapú keresési módszerek ParseText.
- Added CharacterReference.appendCharTo (Appendable) módszerrel.
- Added OutputDocument (szegmens) kivitelező.
- Added StreamedSourceCopy mintaprogram.
Hozzászólás nem található