DataFu פותח ב- LinkedIn והוא כתוב כולו ב- Java.
DataFu כולל פונקציות / ספריות לעבודה עם:
- סטטיסטיקה
- הערכה
- דגימה
- הפעלות
- ניתוח קישור
- פעולות Set
- תיקים
DataFu מושלם עבור כריית נתונים ויישומים סטטיסטיים עבודה על גבי מסדי נתונים Hadoop או חזיר.
פונקציות אלו מאפשרות למפתחים ליהנות מכל יתרונות של כל הנתונים המאוחסנים בתוך Hadoop או חזיר מסד נתונים מבלי להתמודד עם דרישות מערכת מסיביות על מנת לעשות זאת.
מה חדש במהדורה זו:.
- זוג UDFs עבור דגימה אקראית פשוטה עם תחליף
- תלות יותר עכשיו ארוזים DataFu כך פחות תלות JAR נדרש.
- UDF SetDifference לחישוב ההבדל להגדיר (למשל A-B או A-B-C).
מה חדש בגירסה 1.2.0:
- זוג UDFs עבור דגימה אקראית פשוטה עם תחליף.
- תלות יותר עכשיו ארוזים DataFu כך פחות תלות JAR נדרש.
- UDF SetDifference לחישוב ההבדל להגדיר (למשל A-B או A-B-C).
מה חדש בגירסה 1.1.0:.
- UDF חשיש נוסף SHA
- InUDF ו AssertUDF מוסף חזיר 0.12 תאימות. אלה זהים ב ולקבוע.
- SimpleRandomSample, אשר מיישם אלגוריתם דגימה אקראית להרחבה פשוטה.
תגובות לא נמצא