WebGraph היא מסגרת ללמוד גרף האינטרנט. WebGraph מספק דרכים פשוטות לניהול גרפים גדולים מאוד, ניצול טכניקות דחיסה מודרניות. לייתר דיוק, הוא כרגע עשוי:
1. סט של קודים שטוחים, הנקראים קודים, אשר מתאימים במיוחד לאחסון גרפים אינטרנט (או, באופן כללי, מספרים שלמים עם חלוקת כוח-חוק במגוון מעריך מסוים). העובדה שהקודים הללו עובדים טוב ניתן לבדוק בקלות באופן אמפירי, אבל אנחנו גם מנסים לספק ניתוח מתמטי מפורט.
2. אלגוריתמים לדחיסת גרפים אינטרנט המנצלים דחיסת פער וreferentiation (la LINK), intervalisation וקודים לספק יחס דחיסה גבוה: למשל, גרף WebBase (2001 זחילה) נדחס ב3.08 סיביות לקישור, ותמונת מצב של כ 18500000 דפי תחום .uk שנאסף על ידי UbiCrawler דחוס ב2.22 סיביות לקישור (הנתונים המקביל לגרפים משורבב הם 2.89 סיביות לקישור ו1.98 סיביות לקישור). האלגוריתמים נשלטים על ידי מספר פרמטרים, המספקים פשרות שונות בין מהירות גישה ויחס דחיסה.
3. אלגוריתמים לגישה גרף דחוס מבלי לבטל את דחיסתו, תוך שימוש בטכניקות עצלנית שתעכבנה את שחרור לחץ עד שיש צורך למעשה.
4. יישום מלא, מתועד של האלגוריתמים מעל ב- Java, כלול בחבילה it.unimi.dsi.webgraph. מלבד API מוגדר, החבילה מכילה מספר כיתות המאפשרות לשנות (למשל, לשרבב) או דחס גרף, כך להתנסות עם הגדרות שונות. החבילה מסתמכת על fastutil למסגרת אוספי סוג ספציפי, בעל ביצועים גבוהים, על MG4J לי רמה-bit / O, על חלוקת COLT לאלגוריתמים מוכנים לשימוש, יעילים ועל getopt GNU עבור ניתוח קו-פקודה.
5. ערכות נתונים עבור גרף גדול מאוד (למשל, מיליארדים קישורים). אלה נאספים גם ממקורות ציבוריים (כגון WebBase), או המיוצרים על ידי UbiCrawler.
בסופו של עם WebGraph אתה יכול לגשת ולנתח גרף אינטרנט גדול מאוד, אפילו במחשב עם קטן כמו 256 Mbytes של זיכרון RAM. באמצעות WebGraph הוא קל כמו התקנה כמה קבצי צנצנת והורדת ערכת נתונים. זה עושה את חקר תופעות כגון PageRank, חלוקת נכסי גרף של גרף האינטרנט, וכו 'קל מאוד
מה חדש במהדורה זו:.
- גרסה זו מוסיפה כמה שיפורים לHyperANF, וכמה תיקוני באגים.
- ניתן למצוא WebGraph עכשיו על Maven המרכזי.
מה חדש בגרסת 2.4.5:
- גרסה זו כוללת יישום של HyperANF, חדש אלגוריתם ניתן להרחבה לחישוב פונקצית השכונה של גרף, ושיטות שלחשב את המסלול הקצר ביותר ונתונים אחרים הנגזרים מפונקצית השכונה.
מה חדש בגרסת 2.4.4
:- כמה אפשרויות ישנות הוסרו . >
- תיקי הרכוש כעת מכילים שפע של נתונים סטטיסטיים שימושיים.
- מהירות גישה אקראית שופרה.
מה חדש בגרסת 2.4.3:
- ArrayListMutableGraph.addNodes הקבוע () (תודה לאריק Lumer לאיתור ותיקון הבאג הזה).
- אפשרויות חדשות כדי להעביר את הפלט של גרפים ASCII.
- RemappedImmutableGraph.successorArray (x) היה לספק את אותו מערך על כל שיחה, ובכך הופך את היורשים בירושה (x) שיטה לא שמיש לסריקה ברשימות שונות במקביל. קבוע (עכשיו הוא חוזר עותק של המערך, במקום).
- שינוי אקראי חדש שpermutes אקראי גרף.
מה חדש בגרסת 2.4.2:
- חדש & quot; quot להלחין ו; לבנות מאפשר לחבר (שכותרתו קשת) גרפים.
תגובות לא נמצא