DSTK - Data Science Toolkit 3 הוא אוסף של נתונים וכריית טקסט תוכנה, בעקבות מודל CRISP DM. DSTK מציעה הבנה נתונים באמצעות ניתוח סטטיסטי וטקסט, הכנת נתונים באמצעות נורמליזציה ועיבוד טקסט, מודלים והערכה עבור למידה מכונה ואלגוריתמים למידה סטטיסטית.
DSTK 3 יציע תכונות אטרקטיביות כמו רשת עצבית עמוק (למידה עמוקה), קישור קישור ניתוח עם Visualizations, KMeans Clustering. חלק מהתכונות הללו עשויות להופיע בגרסה ישנה יותר, אך מכיוון שהאלגוריתמים נכתבים מחדש כדי לצמצם את השימוש בספריות חיצוניות כמו Weka כדי לצמצם את גודל הקובץ, אנו זקוקים לזמן נוסף כדי לפתח אותם. מנוע DSTK עדיין בשלב הבטא, ומכאן, ייתכן שיש כמה באגים ואי דיוק.
DSTK 3 מורכב מנוע DSTK, DSTK ScriptWriter, DSTK סטודיו ו DSTK טקסט Explorer. מנוע DSTK הוא R פשוט, תוך התמקדות נתונים כרייה. DSTK ScriptWriter מציעה GUI לכתוב תסריט עבור מנוע DSTK. DSTK סטודיו מציעה SPSS סטטיסטיקה כמו GUI עבור כריית נתונים, ו DSTK טקסט Explorer מציע GUI עבור כריית טקסט.
דרישות :
Java Runtime Environment, Microsoft. Net Framework
מגבלות :
שימוש בניסוי
תגובות לא נמצא