פרויקט מרק יפה הוא מנתח Python HTML / XML המיועד לפרויקטי אספקה מהירים כמו מסך-גירוד. שלוש תכונות לעשות את זה חזק:
מרק יפה לא להיחנק אם אתה נותן לו סימון רע. זה מניב עץ לנתח שעושה כ הרבה היגיון כמו המסמך המקורי שלך. זה בדרך כלל מספיק טוב כדי לאסוף את הנתונים דרושים לך ותברחו.
מרק יפה מספק כמה שיטות פשוטות וניבים של נחש ארסי לניווט, חיפוש ושינוי עץ לנתח: ערכת כלים ללנתח מסמך והחילוץ מה שאתה צריך. אתה לא צריך ליצור מנתח מותאם אישית עבור כל יישום.
מרק יפה ממיר באופן אוטומטי מסמכים נכנסים ל- Unicode ומסמכים יוצאים לUTF-8. אתה לא צריך לחשוב על קידודים, אלא אם המסמך אינו מציין קידוד ומרק יפים לא יכול זיהוי אוטומטי אחד. אז אתה רק צריך לציין את הקידוד המקורי.
מרק יפה מנתח כל דבר שאתה נותן לו, ועושה את הדברים חציית העץ בשבילך. אתה יכול להגיד את זה "מצא את כל הקישורים", או "מצא את כל הקישורים של externalLink הכיתה", או "מצא את כל קישורי כתובות שיתאימו" foo.com ", או" מצא את השולחן לכיוון שטקסט מודגש יש לי, ואז לתת לי שלי טקסט ש. "
נתונים יקרי ערך שהיה נעול עד פעם אחת באתרים גרועים שתוכננו הוא עכשיו בהישג ידך. . פרויקטים שהיו לוקחים שעות לקחת דקות בלבד עם מרק יפה
דרישות :
- Python
תגובות לא נמצא