lxml

צילום מסך תוכנה:
lxml
פרטי תוכנה:
גרסה: 3.4.4 מעודכן
טען תאריך: 12 May 15
מפתחים: infrae.com
רשיון: ללא תשלום
פופולריות: 245

Rating: 5.0/5 (Total Votes: 1)

lxml משלב את המהירות של אלה ספריות עם הפשטות של שפת Python.
תואם את כל גרסאות CPython 2.4-3.2

מה חדש בהודעה זו:.

    • lxml.html.iterlinks עכשיו מחזיר קישורים בתוך תגי רענון מטה.
    • collect_ids האפשרות החדשה XMLParser = False להשבית יצירת שולחן חשיש מזהה. זה יכול באופן משמעותי להאיץ את ניתוח של מסמכים עם מזהים שונים שאינם בשימוש.
    • המנתח משתמש בלוחות חשיש לכל מסמך למזהי XML. פעולה זו מפחיתה את העומס של Dict המנתח הגלובלי ומאיצה את הניתוח למסמכים עם מזהים שונים.
    • ElementTree.getelementpath (אלמנט) חוזר ביטוי ElementPath מבני לאלמנט המסוים, שיכול לשמש לחיפושים מאוחר יותר.
    • xmlfile () מקבלת טיעון חדש קרוב = True כדי לסגור קובץ (דמוי) אובייקטים לאחר כתיבתם. לפני, xmlfile () סגרה רק את הקובץ אם הוא פתח אותו באופן פנימי.
    • אפשר & quot; bytearray & quot; סוג קלט טקסט ASCII.

    מה חדש בגרסת 3.4.2:

    • lxml.html.iterlinks עכשיו מחזיר קישורים בתוך מטה לרענן תגיות.
    • collect_ids האפשרות החדשה XMLParser = False להשבית יצירת שולחן חשיש מזהה. זה יכול באופן משמעותי להאיץ את ניתוח של מסמכים עם מזהים שונים שאינם בשימוש.
    • המנתח משתמש בלוחות חשיש לכל מסמך למזהי XML. פעולה זו מפחיתה את העומס של Dict המנתח הגלובלי ומאיצה את הניתוח למסמכים עם מזהים שונים.
    • ElementTree.getelementpath (אלמנט) חוזר ביטוי ElementPath מבני לאלמנט המסוים, שיכול לשמש לחיפושים מאוחר יותר.
    • xmlfile () מקבלת טיעון חדש קרוב = True כדי לסגור קובץ (דמוי) אובייקטים לאחר כתיבתם. לפני, xmlfile () סגרה רק את הקובץ אם הוא פתח אותו באופן פנימי.
    • אפשר & quot; bytearray & quot; סוג קלט טקסט ASCII.

    מה חדש בגרסת 3.3.2:

    • מאפייני resolvers והגרסה, כמו גם set_element_class_lookup שיטות () וmakeelement (), אבדו מאובייקטים iterparse.
    • מופעים של XMLSchema, Schematron וRelaxNG לא לנקות error_log המקומי שלהם לפני הפעלת אימות.
    • lxml.doctestcompare מעורב & quot; צפוי & quot; ו& quot; בפועל & quot; בערכי תכונות.

    מה חדש בגרסת 3.3.1:

    • באגס קבוע:
    • מסמכי HTML מנותחים עם parser.feed () לא הצליחו למצוא אלמנטים באיטרציה תג.
    • בנייה בPyPy נכשלה עקב חסר תמיכה לPyUnicode_Compare () וPyByteArray _ * () בC-API של PyPy.
    • Compilation בMSVC נכשל עקב חסר & quot; stdint.h & quot; קובץ כותרת סטנדרטי.
    • iterparse () לא הצליח לנתח BOM התחילית קבצים.

    מה חדש בגרסת 3.3.0:

    • באגס קבוע:
    • היוריסטי המבדיל את נתיבי קבצים מכתובות אתרים הודק לייצר שליליים פחות שווא.

    מה חדש בגרסת 3.2.3:

    • תמיכה קבועה לפייתון 2.4 שאבדה 3.2 .2.

    מה חדש בגרסה 3.2.1:

    • שיטות apply_templates () וprocess_children () של אלמנטי סיומת XSLT צברו שתי אפשרויות בוליאני חדשות elements_only וremove_blank_text שזורקים או כל המחרוזות או רווחים בלבד מחרוזות מרשימת התוצאות.

    מה חדש בגרסת 3.2.0:

    • מוביל רווחים יכולים לשנות את ההתנהגות של ניתוח המחרוזת פונקציות בlxml.html.
    • מחרוזת ניתוח פונקציות בlxml.html יותר חזקה בפרצוף של תוכן HTML נדיר כמו מסגרות או חסר תגי גוף.
    • שגיאות קלט / פלט בזמן שאתה מנסה לגשת לקבצים עם שבילים המכילים תווים שאינם ASCII יכול להעלות UnicodeDecodeError במקום כראוי דיווח IOError.
    • ניתוח ממחרוזות בזיכרון גישה לרשת נכים במנתח ברירת המחדל ולאחר מכן עשה ניסיונות לנתח מURL להיכשל.

    מה חדש בגרסת 3.1.2:

    • פטירה מייחסת באמצעות API המרחב-מודע גשר סקסופון (כלומר handler.startElement () שיטה) נכשל עם TypeError.
    • שגיאה בהמשכים קבועה בתפוקת XSLT בעת המרת עץ התוצאה למחרוזת Unicode.

    מה חדש בגרסת 3.0.2:

    • התרסקות קבועה במהלך כיבוי מתורגמן על ידי מעבר לCython 0.17 .3 לבניין.

    מה חדש בגרסת 3.0:

    • C14N מאפשר מפרט את הקידומות כוללים לקידום לTop- רמה בהמשכים בלעדיים.
    • תמיכה ראשונית לבנייה בPyPy (באמצעות cpyext).
    • חפצי DTD צברו API המאפשר גישת קריאה להצהרותיהם.
    • xpathgrep.py זכה לתמיכה לניתוח קו אחר קו (למשל מתפוקת grep) ולמקיף את התפוקה עם תג שורש חדש.
    • E-מפעל בlxml.builder מקבל תת סוגים ידועים נתונים (כגון תת מחרוזת) בעת בניית אלמנטים סביבם.
    • איטרציה העץ וiterparse () עם טיעון תג סלקטיבית תומכים עוברים ערכת תגים. בלוטות עץ תוחזר על ידי & הלבן אם הם תואמים כל התגים.

    מה חדש בגרסת 2.3.5:

    • התרסקות כאשר מיזוג צמתים טקסט בelement.remove ( ).
    • קראש במנתח סקסופון / יעד כאשר דיווח DOCTYPE הריק.

    מה חדש בגרסת 2.3.4:

    • התרסקות בעת בניית nsmap (רכוש אלמנט) עם URIs מרחב ריק.

    • התרסקות בשל מצב גזע כאשר טעויות (או הודעות משתמש) מתרחשות במהלך עיבוד XSLT הליכי.
    • אוסף סגנונות XSLT יכל להתעלם שגיאות הידור.

    מה חדש בגרסת 2.3.3:

    • תכונות נוספות:
    • lxml.html.tostring () זכה בהמשכים אפשרויות חדשות with_tail וDOCTYPE.
    • באגס קבוע:
    • קבוע התרסקות בעת שימוש iterparse () עבור ניתוח HTML ומבקש אירועי התחלה.
    • ניתוח קבוע של יותר בוררים בcssselect. רווחים לפני פסאודו אלמנטים ופסאודו-שיעורים הוא משמעותיים כפי שהוא צאצא Combinator. & Quot; E: פסאודו & quot; צריך לנתח אותו כ& quot; E *: פסאודו & quot ;, לא & quot; E:. פסאודו & quot;
    • lxml.html.diff כבר לא מעלה חריג כאשר להכות תגי 'img' ללא תכונה 'src'.

    מה חדש בגרסת 2.3.2:

    • תכונות נוספות:
    • lxml.objectify.deannotate () יש cleanup_namespaces אפשרות בוליאני חדש כדי להסיר את הצהרות מרחב לאובייקט (ובדרך כלל לנקות את הצהרות מרחב) לאחר הסרת ההסברים הסוג.
    • lxml.objectify צבר תפקודו של SubElement () כעותק של etree.SubElement להימנע יבוא אחר מיותר של lxml.etree בצד המשתמש.
    • באגס קבוע:
    • קבוע & quot; צאצא & quot; באג בcssselect פעם שנייה (לאחר תיקון ראשון בlxml 2.3.1). השינוי הקודם הביא לרגרסיה ביצועים רצינית להערכת הביטוי המתורגם בהתבסס XPath. שים לב שזה שובר את השימוש של חלק מביטויי XPath שנוצרו כנתיבי מיקום XSLT שעבדו בעבר ב2.3.1.
    • ניתוח קבוע של כמה בוררים בcssselect. רווחים לאחר combinators & quot; & # x3e; & quot ;, & quot; + & quot; ו& quot; ~ & quot; עכשיו הוא התעלם בצורה נכונה. בעבר הוא היה מנותח כCombinator צאצא. לדוגמא, & quot; div & # x3e; .foo & quot; היה מנותח זהה & quot; div & # x3e; * .foo & quot; במקום & quot של; div & # x3e; .foo & quot;.

    מה חדש בגרסת 2.3.1:

    • תכונות נוספות:
    • אפשרות חדשה kill_tags בlxml.html.clean להסיר תגים ספציפיים והתוכן שלהם (כלומר כל עץ המשנה שלהם).
    • pi.get () וpi.attrib על הוראות עיבוד לנתח פסאודו-תכונות מתוכן הטקסט של הוראות עיבוד.
    • lxml.get_include () מחזיר רשימה של נתיבים כוללים שיכול לשמש ללקמפל קוד C חיצוני נגד lxml.etree. זה נדרש במיוחד עבור lxml קשור באופן סטטי בונה כאשר קוד צריך לקמפל נגד גרסאות קובץ הכותרת אותו דבר כמו lxml עצמו.
    • Resolver.resolve_file () לוקח close_file אפשרות נוספת שמגדיר אם קובץ האובייקט (הדמוי) יהיה סגור אחרי שקרא או לא. כברירת מחדל, הקובץ יהיה סגור, כמשתמש לא צפוי לשמור על התייחסות אליו.
    • באגס קבוע:
    • ניקוי HTML לא להסיר את 'נתונים: ". קישורים
    • שילוב מנתח html5lib משתמש כעת את היישום "הרשמי" בhtml5lib עצמו, שהופך אותו לעבוד עם גרסאות חדשות יותר של הספרייה.
    • בlxml.sax, endElementNS () יכול בצורה לא נכונה לדחות תג שם רגיל כאשר אירוע תחילת המקביל להסיק אותו שם תג רגיל להיות במרחב ברירת המחדל.
    • כאשר אובייקט כמו קובץ פתוח מועבר ללנתח () או iterparse (), המנתח לא יהיה עוד הקרוב לאחר שימוש. זה חוזר שינוי בlxml 2.3 שבו כל הקבצים יהיו סגורים. זוהי האחריות המשתמשים כדי לסגור כראוי את קובץ האובייקט (הדמוי), גם במקרי שגיאה.
    • שגיאת טענה בlxml.html.cleaner כאשר השלכת אלמנטים ברמה העליונה.
    • בlxml.cssselect, להשתמש XPath 'ב' // '(קיצור של' צומת / צאצא-או-עצמית :: () / ב ') במקום' / צאצא :: ב 'לCSS בורר צאצא ('ב'). זה עושה כמה מקרי קצה שיהיה עקבי עם בורר ההתנהגות בWebKit ופיירפוקס, והופך את שבילי מיקום חוקיים ביטויי CSS יותר (לשימוש בXSL: התאמת תבנית).
    • בlxml.html, שאינו נבחר & # x3c; אפשרות & # x3e; תגים כבר לא יופיעו בערכי טופס שנאספו.
    • הוספה / סרה & # x3c; x3e אפשרות & #; ערכים מ / אל שדה טופס בחר מרובה בוחר אותם כראוי וunselects.
    • שינויים אחרים:
    • סטטי בונה ניתן לציין את הספרייה להורדה עם אפשרות --download-דיר.

    מה חדש בגרסה 2.3:

    • תכונות נוספות:
    • כאשר מחפש ילדים, lxml.objectify לוקח '{} תג' ככלומר מרחב ריק, בניגוד למרחב ההורה.
    • באגס קבוע:
    • כשסיים לקרוא מאובייקט כמו קבצים, המנתח קורא מייד .close השיטה שלה ().
    • בסיום ניתוח, iterparse () סוגר מייד את קובץ הקלט.
    • עבודה מסביב לבאג libxml2 שיכול להשאיר את מנתח HTML במדינה שאינה פונקציונלית לאחר ניתוח מסמך severly שבור (הקבוע בlibxml2 2.7.8).

    • תג
    • Marque בקוד HTML ניקוי נקרא כראוי אוהל.
    • שינויים אחרים:
    • יש כמה תפקידים ציבוריים בC-API הרמה-Cython סוגים מפורשים יותר תמורה.

    מה חדש ב2.3beta1 גרסה:

    • באגס קבוע:
    • קראש בגרסאות חדשות יותר libxml2 בעת מעבר בין אלמנטי מסמכים שיש להם תכונות על צמתים XInclude הוחלפו.
    • פונקצית XMLID () הייתה חסר הפרמטרים מנתח וכתובת BASE_URL אופציונליים.
    • חיפוש תגים כלליים בiterparse () נשבר בPy3.
    • lxml.html.open_in_browser () לא עבד בפייתון 3 עקב השימוש של os.tempnam. עכשיו זה לוקח פרמטר 'קידוד' אופציונאלי.

  • תוכנה דומה

    mwlib
    mwlib

    13 May 15

    mwlib.epub
    mwlib.epub

    1 Mar 15

    pyformat
    pyformat

    14 Apr 15

    pycountry
    pycountry

    20 Jul 15

    תגובות ל lxml

    תגובות לא נמצא
    להוסיף הערה
    הפעל את התמונות!