שוגון הוא פרויקט פתוח תוכנת המקור תוכנן מהקיזוז לספק ארגז כלים למידת מכונה ממוקד בשיטות ליבה בקנה מידה גדולות, ושתוכנן במיוחד עבור מכונות תמיכת וקטור (SVM). התוכנה יכולה לשמש בקלות מתוך שפות תכנות שונות, כולל C, C ++, Python, Octave, Matlab, Java, C #, Ruby, Lua, UNIX Shell, ור '
היישום מציע אובייקט SVM (תמיכת וקטור מכונות) סטנדרטי שיכול ממשק עם יישומי SVM שונים. זה כולל גם שיטות רבות ליניארי, כגון תכנות לינארי מכונת (LPM), ליניארי Discriminant ניתוח (LDA), Perceptrons (Kernel), כמו גם כמה אלגוריתמים שיכולים לשמש כדי להכשיר נסתר מרקוב models.Features בתכונות glanceKey כוללים אחד סיווג כיתה, עיבוד מראש multiclass סיווג, רגרסיה, למידת פלט מובנה,, אסטרטגיות מובנים במודל בחירה, במסגרת בדיקה, תמיכה בלמידה בקנה מידה גדולה, ריבוי משימות למידה, הסתגלות תחום, בהמשכים, קוד parallelized, מדדי ביצוע, רגרסיה רכס ליבה, וקטור תמיכת רגרסיה ותהליכי גאוס.
בנוסף, הוא תומך בלמידת ליבה מרובה, כולל MKL q-הנורמה וMKL multiclass, תומך-NN k ומסווג סיווג תהליך גאוס, תומך במכונת תכנות לינארי, רשתות LDA, מרקוב, המודלים נאיבי Bayes, הלוגיסטי רגרסיה, LASSO, נסתרים מרקוב, PCA, ליבת PCA, Isomap, קנה מידה רב ממדית, הטבעה ליניארי באופן מקומי, מפת דיפוזיה, יישור שטח משיק מקומי, כמו גם eigenmaps Laplacian.
יתר על כן, הוא כולל תמיכה t-SNE Barnes-האט, מנרמל ליבה, ליבת סיגמואיד, גרעיני מחרוזת, פולינום, ליניארי וגרעינים גאוס, קיבוץ היררכי, k-אמצעי, BFGS אופטימיזציה, ירידה הדרגתית, כריכות לCPLEX, כריכות למוסקות, תווית למידת רצף, למידת גרף גורם, SO-SGD, סמוי SO-SVM ונתונים דלילים representation.Under את מכסה המנוע וavailabilitySHOGUN נכתבו בגאווה בפייתון ו- C ++ שפות תכנות, מה שאומר שזה & rsquo; זה תואם עם כל מערכת הפעלה גנו / לינוקס שם Python וGCC קיימים. זה זמין להורדה כארכיון מקור אוניברסלי, כך שאתה יכול להתקין אותו על כל מערכת הפעלה מבוססת לינוקס
מה חדש במהדורה זו:.
- מאפיינים:
- תמיכה מלאה python3 עכשיו
- הוסף k-אמצעי מיני-אצווה [Parijat Mazumdar]
- הוסף k-אמצעי ++ [Parijat Mazumdar]
- ליבת מחרוזת תת-רצף להוסיף
- תיקוני באגים:
- תיקונים לקמפל לswig3.0 הקרוב
- Speedup לתהליך גאוס 'יחול ()
- לשפר את מערך בדיקות יחידה / בדיקת אינטגרציה
- זיכרון לא מאותחל libbmrm קורא
- libocas זיכרון לא מאותחל קורא
- Octave 3.8 לקמפל תיקונים [אוריון Poplawski]
- שגיאת הידור מודולרי java תקן [ביורן אסר]
[Lambday]
מה חדש בגרסת 3.1.1:
- תקן לקמפל שגיאה המתרחשת עם CXX0X
מה חדש בגרסת 3.1.0:
- גרסה זו מכילה בעיקר תיקוני באגים, אבל גם תכונת שיפורים .
מה חדש בגרסת 2.0.0 :
- זה כולל את כל מה שכבר בוצע בעבר ו במהלך הקיץ של גוגל קוד 2012.
- תלמידים יישמו תכונות חדשות שונות, כגון לימוד מובנה פלט, תהליכי גאוס, SVM משתנה סמוי (ולמידת פלט מובנה), מבחנים סטטיסטיים בחללי גרעין משחזרים, אלגוריתמי למידת ריבוי משימות שונים, ושיפורי שימושיות שונים, עד כמה שם.
מה חדש בגרסת 1.1.0:
- גרסה זו הציגה את הרעיון של 'ממירים ", המאפשר לך לבנות embeddings תכונות שרירותיות.
- זה כולל גם כמה טכניקות חדשות הפחתת ממד ושיפורי ביצועים משמעותיים בערכת הכלים ההפחתה ממדית.
- שיפורים נוספים כוללים האצת אוסף משמעותית, תיקוני באגים שונים לממשקים ואלגוריתמים מודולריים, ושיפרו את Cygwin, Mac OS X, וצלצול תאימות ++.
- GitHub הסוגיות משמשות כיום למעקב באגים ובעיות.
מה חדש בגרסת 1.0.0:
- גרסה זו כוללת ממשקים לשפות חדשות כולל Java, C #, Ruby, וLua, מסגרת בחירת מודל, טכניקות הפחתת ממד רבות, הערכת דגם תערובת גאוס, ומסגרת למידה מקוונת במלוא מובן המילה.
מה חדש בגרסה 0.10.0:
-
מאפיינים:
- בהמשכים של אובייקטים הנובעים מCSGObject, כלומר כל אובייקטי השוגון (SVM, ליבה, תכונות, Preprocessors, ...) כASCII, JSON, XML וHDF5
- צור SVMLightOneClass
- הוסף CustomDistance באנלוגיה לליבה מותאמת אישית
- הוסף HistogramIntersectionKernel (תודה Koen van de Sande לתיקון)
- תמיכת 2010a Matlab
- תמיכה מודולרית SpectrumMismatchRBFKernel (תודה רוב Patro לתיקון)
- הוסף ZeroMeanCenterKernelNormalizer (תודה Gorden Jemwa לתיקון)
- סוויג
- תיקוני באגים:
- מותאמים אישית גרעינים יכולים עכשיו להיות & gt; 4G (תודה Koen van de Sande לתיקון)
- אזור הגדר C בהפעלה בinit_shogun למנוע incompatiblies עם צף ascii וfprintf
- לקמפל תיקון כאשר ספירת הפניות מושבתת
- set_position_weights תקן לליבת WD (שדווחה על ידי דייב duVerle)
- set_wd_weights תקן לליבת WD.
- קרוא תקן בSVMOcas (שדווח על ידי ירוסלב)
- ניקוי וAPI:
- שמם SVM_light / SVR_light לSVMLight וכו '.
- הסרת קידומת C מול כיתת שמות שאינם serializable
- Drop CSimpleKernel ולהציג CDotKernel כמחלקת הבסיס שלה. יש צורך בדרך זו ניתן ליישם את כל הגרעינים מבוססים dot-המוצר על גבי DotFeatures ויישום אחד בלבד לגרעינים כאלה.
תמיכת 2.0
שינויים
מה חדש בגרסת 0.9.3:
-
מאפיינים:
- LP-נורמה ניסויית MCMKL
- חדשים גרעינים: SpectrumRBFKernelRBF, SpectrumMismatchRBFKernel, WeightedDegreeRBFKernel
- ליבת WDK תומכת חומצות אמינו
- String תומכות כעת לצרף פעולות (ויצירת
- תמיכת פיתון-DBG
- אפשר צף כקלט לליבה מותאמת אישית (ומטריצות & gt; 4GB בגודל)
- תיקוני באגים:
- . תיקון קישור סטטי
- תקן add_to_normal של הקרנל ליניארי הדליל
- ניקוי וAPI:
- הסרת init () function במדדי ביצוע
- התאם .so סיומת לפיתון ולהשתמש distutils פיתון להבין להתקין נתיבים
תכונות
שינויים
מה חדש בגרסה 0.9.2:
-
מאפיינים:
- קריאה וכתיבה של קבצים מבוססים ASCII / קבצים בינאריים / HDF5 ישירה.
- normalizer ליבת משימה רב יושם.
- יישום ליבת SNP.
- יישום מגבלת זמן לlibsvm / libsvr.
- שלב Elastic Net MKL (תודה Ryoata Tomioka לתיקון).
- ליישם תכונות hashed WD.
- ליישם תכונות הדלילים פוליפוני מרוסקים.
- שלב liblinear 1.51
- LibSVM יכול כעת להיות מאומן עם הטיה נכים.
- הוסף פונקציות כדי להגדיר / לקבל io / מקביל הגלובלית ומקומי / ... אובייקטים.
- תיקוני באגים:
- set_w תקן () למסווגים ליניארי.
- Static Octave, ממשקי Python, cmdline ומודולרי Python לקמפל נקי תחת Windows / Cygwin שוב.
- בממשקי סטטי בדיקה יכולה להיכשל כאשר לא נעשה מייד לאחר אימון.
תגובות לא נמצא