lxml

Szoftver screenshot:
lxml
Szoftver adatai:
Változat: 3.4.4 Frissítve
Feltöltés dátuma: 12 May 15
Fejlesztő: infrae.com
Engedély: Ingyenes
Népszerűség: 245

Rating: 5.0/5 (Total Votes: 1)

lxml egyesíti a sebességet, hogy a könyvtárat az egyszerűség a Python nyelvet.
Kompatibilis az összes cpython verzió 2,4-3,2.

Mi az új ebben a kiadásban:

  • lxml.html.iterlinks most vissza linkjeiből meta refresh tag.
  • New XMLParser lehetőség collect_ids = False tiltani ID hash tábla létrehozása. Ez jelentősen felgyorsítja elemzés dokumentumok számos különböző azonosítók, amelyeket nem használnak.
  • Az értelmező használja per-dokumentum hash táblákat XML azonosítók. Ez csökkenti a terhelést a globális értelmező dict és felgyorsítja elemzés dokumentumok számos különböző azonosítókat.
  • ElementTree.getelementpath (elem) visszatér a strukturális ElementPath kifejezése az adott elem, amelyet fel lehet használni a keresést később.
  • XMLFile () elfogad egy új érvet close = True zárja fájl (-szerű) tárgyak megírása után nekik. Korábban XMLFile () csak lezárta az ügyet, ha meg is nyitotta meg belülről.
  • engedélyezése & quot; ByteArray & quot; típusú ASCII szöveges beviteli.

Mi az új verzióban 3.4.2:

  • lxml.html.iterlinks most visszatér található hivatkozásokat, meta refresh címkék.
  • New XMLParser lehetőség collect_ids = False tiltani ID hash tábla létrehozása. Ez jelentősen felgyorsítja elemzés dokumentumok számos különböző azonosítók, amelyeket nem használnak.
  • Az értelmező használja per-dokumentum hash táblákat XML azonosítók. Ez csökkenti a terhelést a globális értelmező dict és felgyorsítja elemzés dokumentumok számos különböző azonosítókat.
  • ElementTree.getelementpath (elem) visszatér a strukturális ElementPath kifejezése az adott elem, amelyet fel lehet használni a keresést később.
  • XMLFile () elfogad egy új érvet close = True zárja fájl (-szerű) tárgyak megírása után nekik. Korábban XMLFile () csak lezárta az ügyet, ha meg is nyitotta meg belülről.
  • engedélyezése & quot; ByteArray & quot; típusú ASCII szöveges beviteli.

Mi az új verzióban 3.3.2:

  • A tulajdonságokat rezolverek és verzióját, valamint a módszerek set_element_class_lookup () és makeelement (), elvesztek re iterparse tárgyak.
  • példányainak XMLSCHEMA, Schematron és RelaxNG nem világos, hogy a helyi error_log futtatása előtt hitelesíteni kell.
  • lxml.doctestcompare összekeverednek & quot; várható & quot; és a & quot; tényleges & quot; attribútum értékeket.

Mi az új verzióban 3.3.1:

  • hiba javítva:
  • HTML dokumentumokat elemezni a parser.feed () nem sikerült megtalálni elemek alatt tag ismétlés.
  • Ingatlan itt PyPy miatt nem sikerült a hiányzó támogatást PyUnicode_Compare () és PyByteArray _ * () in PyPy a C-API.
  • Összeállítás a MSVC nem sikerült, mert hiányzik az & quot; stdint.h & quot; szabvány header fájlt.
  • iterparse () nem sikerült elemezni a BOM előtaggal fájlokat.

Mi az új verzióban 3.3.0:

  • hiba javítva:
  • A heurisztikus, amely megkülönbözteti a fájl elérési utak az URL-ben szigorították, hogy kevesebb hamis negatív.

Mi az új verzióban 3.2.3:

  • Fix támogatást Python 2.4, ami elveszett a 3.2 0,2.

Mi az új a 3.2.1-es változata:

  • A módszerek apply_templates () és process_children () a XSLT kiterjesztés elemek szerzett két új logikai lehetőség elements_only és remove_blank_text, hogy dobja el vagy minden húrok, vagy szóközzel csak string a találati listát.

Mi az új verzióban 3.2.0:

  • Vezető szóközöket lehet változtatni a viselkedését a húr elemzés funkciók lxml.html.
  • A szöveg elemzésekor funkciók lxml.html robusztusabb az arcát a ritka HTML tartalom, mint framesets vagy hiányzó test címkéket.
  • I / O hibát próbál meg hozzáférni fájlokat utak, amelyek nem ASCII karaktereket növelheti UnicodeDecodeError helyett megfelelő bejelentésére IOError.
  • kódértelmező in-memory húrok fogyatékkal hálózati hozzáférés az alapértelmezett elemző és ezt követően további kísérletek feldolgozni egy URL nem.

Mi az új verzióban 3.1.2:

  • Átadás tulajdonítja a névtér-tisztában API a szaxofon híd (azaz a handler.startElement () metódus) volt sikertelen a Típushiba.
  • Fix serialization hiba XSLT kimeneti alakításakor az eredmény fát a Unicode karakterlánc.

Mi az új verzióban 3.0.2:

  • Fixed crash során tolmács leállást a váltás Cython 0.17 0,3 építkezéshez.

Mi az új 3.0 verzió:

  • C14N lehetővé teszi meghatározva a befogadó eleji, hogy támogatni kell fentről szinten alatt exkluzív serialization.
  • A kezdeti támogatást épület PyPy (a cpyext).
  • DTD tárgyak szerzett egy API, amely lehetővé teszi, hogy olvasási hozzáférést nyilatkozataikban.
  • xpathgrep.py nyert támogatást elemzés line-by-line (pl grep kimenet), és a környező a teljesítmény egy új gyökér tag.
  • E-gyár lxml.builder elfogadja altípusa ismert adattípusok (például sztring altípus), amikor építőelemek körülöttük.
  • Fa ciklusok és iterparse () egy szelektív tag érv támogatja halad egy tag-készlet. Facsomópontok fogják vissza a bejárók ha illik bármelyik tag.

Mi az új verzióban 2.3.5:

  • Crash egyesítésekor szöveges csomópontok element.remove ( ).
  • Összeomlás szaxofon / target értelmező bejelentésekor üres doctype.

Mi az új verzióban 2.3.4:

  • A program összeomlik az épület egy nsmap (Element tulajdon) a üres névtér URI.
  • Crash fajon állapot, amikor hiba (vagy a felhasználói üzeneteket) során előforduló menetes XSLT feldolgozó.
  • XSLT összeállítása is figyelmen kívül hagyja, hogy fordítási hibákat.

Mi az új verzióban 2.3.3:

  • Tulajdonságok hozzá:
  • lxml.html.tostring () szerzett új serialization lehetőségek with_tail és doctype.
  • hiba javítva:
  • Javítva az összeomlás használatakor iterparse () a HTML elemzés és a megkereső Start események.
  • Fix elemzés több kijelölõket cssselect. Whitespace előtt ál-elemek és pszeudo-osztályok jelentős, mivel a leszármazottja kombinátor. & Quot; E: pseudo & quot; kell elemezni ugyanaz, mint & quot; E *: pseudo & quot ;, nem & quot; E: pseudo & quot;.
  • lxml.html.diff többé nem vet kivételt, ha üti "img" tag nélkül "src" attribútum.

Mi az új verzióban 2.3.2:

  • Tulajdonságok hozzá:
  • lxml.objectify.deannotate () egy új logikai lehetőség cleanup_namespaces, hogy távolítsa el a tárgyiasítani névtérdeklarációkat (és általában tisztítsák meg a névtérdeklarációkat) eltávolítása után a típusú megjegyzéseket.
  • lxml.objectify szerzett saját részelemre () függvény, mint egy példányát etree.SubElement, hogy elkerüljék az egyébként felesleges import lxml.etree a felhasználói oldalon.
  • hiba javítva:
  • Javítva a & quot; leszármazottja & quot; bug in cssselect másodszor (miután az első fix lxml 2.3.1). Az előző változást eredményezett komoly teljesítmény regresszió XPath alapú értékelését a lefordított kifejezés. Megjegyzendő, hogy ez megtöri a használat Egyes létrehozott XPath kifejezéseket XSLT elérési útvonalak, amely korábban működött a 2.3.1.
  • Fix elemzés néhány kijelölõket cssselect. Utáni szóközöket combinators & quot; & # x3e; & quot ;, & quot; + & quot; és a & quot; ~ & quot; most helyesen figyelmen kívül hagyja. Korábban is volt elemzett leszármazottjaként kombinátor. Például, & quot; div & # x3e; .foo & quot; ben elemzett azonos a & quot; div & # x3e; * .foo & quot; ahelyett, & quot; div & # x3e; .foo & quot;.

Mi az új a 2.3.1-es verzió:

  • Tulajdonságok hozzá:
  • Új lehetőséget kill_tags a lxml.html.clean eltávolíthatja a megadott tag-ek és azok tartalmát (azaz a teljes részfa).
  • pi.get () és pi.attrib a feldolgozási utasítások elemezni ál-attribútumokat a szöveg tartalma feldolgozási utasításokat.
  • lxml.get_include () visszaadja közé utak, amelyek felhasználhatók összeállításához külső C kód ellen lxml.etree. Ez kifejezetten szükséges statikusan linkelt lxml épít, amikor kódot kell lefordítania elleni pontosan ugyanazt a header fájlt változatok lxml magát.
  • Resolver.resolve_file () veszi kiegészítő lehetőséget close_file hogy konfigurálja ha a fájl (-szerű) objektum zárva lesz elolvasása után, vagy sem. Alapértelmezésben a fájl zárva lesz, amíg a felhasználó nem várható, hogy az arra való utalás.
  • hiba javítva:
  • HTML tisztító nem szüntette meg adatait: "linkeket.
  • A html5lib értelmező integrációs most használja a "hivatalos" végrehajtás html5lib magát, ami miatt dolgoznak újabb kiadások a könyvtár.
  • A lxml.sax, endElementNS () is helytelenül elutasítja egy sima tag nevét, ha a megfelelő indítási esemény következtetni azonos sima tag nevét, hogy az alapértelmezett névtér.
  • Ha egy megnyitott fájl-szerű objektum adódik át parse () vagy iterparse (), az értelmező már nem zárja azt használat után. Ez visszaállítja a változás lxml 2.3, ahol az összes fájl is kell zárni. Ez a felhasználó felelőssége, hogy megfelelően zárja be a fájlt (-szerű) objektumot, szintén előfordult hibák.
  • Assertion hiba lxml.html.cleaner ha eldobja a felső szintű elemeket.
  • A lxml.cssselect, használja a xpath "A // B" (röviden "A / leszármazott-or-self :: node () / B") helyett "A / leszármazottja :: B" a css leszármazottja választó ("A B"). Ez teszi néhány szélén esetben összhangban kell lennie a választó viselkedés WebKit és a Firefox, és így több css kifejezést érvényes elérési útvonalak (használatra xsl: template match).
  • A lxml.html, nem választott & # X3c; opció & # x3e; címkék nem jelennek meg az összegyűjtött formában értékeket.
  • hozzáadása / eltávolítása & # X3c; opció & # x3e; értékek felé / felől több válasszuk űrlapmezőre megfelelően választja ki őket, és unselects őket.
  • Egyéb változások:
  • Static épít meghatározhatja a letöltési könyvtárat a --download-dir opciót.

Mi az új a 2.3 verzió:

  • Tulajdonságok hozzá:
  • Ha megvizsgáljuk a gyermekek számára, lxml.objectify vesz '{} tag "jelentése nem üres névtérben, szemben a szülő névtérben.
  • hiba javítva:
  • elolvasása után egy fájlból alakú tárgy, az értelmező azonnal felhívja a .close () metódust.
  • Ha elkészült elemzés, iterparse () azonnal bezárja a bemeneti fájlt.
  • Munka-körül libxml2 bug, hogy el tudja hagyni a HTML értelmező egy nem működő állam, miután elemzésekor Súlyosan törött dokumentum (rögzített libxml2 2.7.8).
  • Marque tag HTML kódot razzia nevét helyesen sátorban.
  • Egyéb változások:
  • Néhány állami funkciókat a Cython szintű C-API több explicit visszatérési típus.

Mi az új verzióban 2.3beta1:

  • hiba javítva:
  • Crash az újabb libxml2 verziókat, ha az elemek mozgatása közötti dokumentumokat kellett attribútumokat cserélni XInclude csomópontok.
  • XMLID () függvény hiányzik az opcionális értelmező és BASE_URL paramétereket.
  • keresése helyettesítő címkék iterparse () volt törve Py3.
  • lxml.html.open_in_browser () nem működik a Python 3 használata miatt a os.tempnam. Ez most úgy egy opcionális "kódolás" paramétert.

Hasonló program

configs
configs

1 Mar 15

CppHeaderParser
CppHeaderParser

20 Jul 15

mwlib.epub
mwlib.epub

1 Mar 15

docx2html
docx2html

6 Jun 15

Hozzászólások a lxml

Hozzászólás nem található
Megjegyzés hozzáadása
Kapcsolja be a képeket!