Apache Solr הוא שרת קוד פתוח, ללא תשלום, בעל ביצועים עצמאיים ובעל ביצועים גבוהים, המבוסס על פרוייקט Apache Lucene, באמצעות XML / HTTP ו- API של JSON. הפרויקט נמצא כעת תחת הדגירה של קרן אפאצ 'י תוכנה.
תכונות במבט אחד
התכונות העיקריות כוללות הדגשת התאמות, חיפוש פנים, אחסון במטמון, שכפול, ממשק ניהול מבוסס אינטרנט, יכולות חיפוש טקסט מלא מתקדם, הוא מותאם במיוחד עבור תעבורת אינטרנט בנפח גבוה, כמו גם ממשקים פתוחים סטנדרטיים, כגון HTTP , XML ו- JSON.
בנוסף, הוא מגיע עם ממשקי ניהול HTML מקיפים, סטטיסטיקת שרת, שכפול אינדקס אוטומטי, שחזור אוטומטי וכשל, ליד אינדקס בזמן אמת, גמיש וגמיש עם תצורת XML וארכיטקטורת תוסף ניתנת להרחבה.
הפרויקט הוא סכימה, המאפשר למשתמש להתחיל במהירות עם Apache Solr. גם סכימה וגם סכימות מצבי נתמכים בשלב זה, אבל האחרון יוביל סביבת ייצור חזקה.
סוגים שונים נתמכים על ידי Solr, כולל סוגי שדות, אשר יסייעו לך לערבב ולהתאים מנתחי Lucene מבלי לכתוב כל קוד. בנוסף, הפרויקט תומך שדות דינמיים שניתן להפעיל ב- the-fly.
בין תכונות מעניינות אחרות, אנו יכולים להזכיר את הפונקציונליות של שדה ההעתקה המאפשרת למשתמשים לנתח בקלות את אותו תוכן בשיטות שונות, תמיכה בסוגים מפורשים כדי למנוע את הצורך בניחוש סוגי שדות, תצורות מותאמות אישית המבוססות על קבצים חיצוניים, כמו כמו גם רכיבים רבים נוספים ניתוח טקסט.
מתחת למכסה המנוע וזמינות
אם ניקח מבט מתחת למכסה המנוע של Apache Solr, נוכל להבחין שהיישום נכתב כולו בשפת התכנות של Java ותומך בהפצות של 32 סיביות ו- 64 סיביות של Linux, כמו גם את Microsoft Windows ו- Mac OS X מערכות הפעלה.
לנוחותך, הוא מופץ כארכיונים בינאריים ומקוריים, כך שתוכל להתחיל בקלות עם Apache Solr בזמן מינימלי ככל האפשר וללא טרחה רבה מדי.
מהו חדש במהדורה זו:
- המשגיח לעולם לא יוכל לעבד כמה הודעות אחרונות.
- שינוי שם הליבה במצב סולרי עצמאי אינו מתמשך.
- פרמטר הפרמטר rq של QueryComponent אינו מתייחס עוד לפרמטר defType.
- תקן NPE ב- SolrQueryParser כאשר מונחי השאילתה בתוך פסקת מסנן יורדים לשום דבר.
מה חדש בגרסה:
- בנוסף לשיפורים רבים אחרים במסגרת האבטחה, Solr כוללת כעת AuthenticationPlugin המפעילה HTTP Basic Auth שמחזיקה אישורים בבטחה ב- ZooKeeper. זוהי דרך פשוטה לדרוש שם משתמש וסיסמה עבור כל מי שמגיע למסך הניהול של ה- Solr או לממשקי ה- API שלו.
- ב- AuthorizationPlugin שנבנה מספק בקרה מדויקת על יישום רשימות בקרת גישה עבור משאבים שונים עם כללי הרשאה המאוחסנים ב- ZooKeeper.
- ממשק ה- API של JSON Facet יכול כעת לשנות את התחום עבור פקודות פנים, ובעיקר לעשות בלוק להצטרף ולהעביר מהורים לילדים, או ילדים להורים לפני חישוב נתוני ההיבט.
- שיפורים משמעותיים בביצוע מודול Facet Module / JSON Facet API.
- שאילתה ופסי טווח בטווח תחת קורות ציר. בדיוק כמו ממשק ה- API של JSON Facet, היבטי הציר יכולים לקנן את סוגי היבט אחרים, כגון טווח ו היבטים של שאילתות.
- יותר כמו אפשרויות Parser של שאילתה זו. ה- MoreLikeThis QParser תומך כעת בכל האפשרויות המסופקות על ידי ה- MLT Handler. מנתח השאילתה הוא הרבה יותר תכליתי מאשר המטפל כפי שהוא עובד במצב ענן כמו גם בכל מקום שאילתה רגילה ניתן לציין.
- הוספת תמיכה ב- API של Schema ב- SolrJ
- הוספת מצב ניקוד להצטרפות הצטרפות וחסימת זמן.
- הוספת תגובת תגובה של חיוך
מה חדש בגרסה 4.10.3:
- Solr 4.10.2 כולל 10 תיקוני באגים, כמו גם את Lucene 4.10.2 ואת שני תיקוני הבאגים שלה.
מה חדש בגרסה 4.6.1:
- Apache Tika 1.4
- Carrot2 3.8.0
- מהירות 1.7 ו מהירות כלי 2.0
- Apache UIMA 2.3.1
- Apache ZooKeeper 3.4.5
- תיקוני באגים:
- SOLR-5408: התוצאות של CollapsingQParserPlugin אינן נכונות בעת שימוש בקריטריונים מרובים למיון
- (ברנדון צ'פמן, ג'ואל ברנשטיין)
- SOLR-5416: התמוטטותקצףפרטי מעמיקתג / אל תכלול תצוגה
- (David Boychuck, Joel Bernstein)
- SOLR-5442: לקוח Python אינו יכול לנתח תגובה פרוקסיבית כאשר הוא פועל על-ידי Tomcat.
- (פטריק האנט, גרגורי חנן, Vamsee Yarlagadda, רומן Rigaux, מארק מילר)
- SOLR-5445: תגובות פרוקסידיות צריכות להפיץ את כל הכותרות ולא את הראשונה בכל מפתח.
- (פטריק האנט, מארק מילר)
- SOLR-5479: SolrCmdDistributor מנסה לבצע לוגיקה חוזרת, אם לא ניתן למצוא מנהיג עבור הבקשה בעוד שנייה.
- (מארק מילר)
- SOLR-5532: אימות תוכן מסוג SolrJ הוא קפדני מדי עבור כמה webcontainers / proxies.
- (יעקב פורר, האוסמן, שון הייסי, אווה שינדלר, מארק מילר)
- SOLR-5547: יצירת כינוי אוסף באמצעות SolRJ של CollectionAdminRequest קובע את שם הכינוי ואת האוספים לכינוי לאותו ערך.
- (אהרון שרם, מארק מילר)
- SOLR-5577: תפוצת ZooKeeper עשויה לא להאט את העדכון כמות מסוימת, אך במקום זאת לנתק עדכונים לאחר זמן נתון.
- (מארק מילר, כריסטין פורשקה, ראמקומאר איינגר)
- SOLR-5580: NPE בעת יצירת ליבה עם מפריד מפורש ועם coreNodeName.
- (יופנג יאנג, מארק מילר)
- SOLR-5552: תהליך ההחלמה של המנהיג יכול לבחור את המנהיג הלא נכון אם כל העותקים המסונכרנים עבור שרד יורדים ומנסים להתאושש וכן לאבד עדכונים שהיו אמורים להתאושש.
- (טימותי פוטר, מארק מילר)
- SOLR-5569 העתק מסונכרן לא אמור לנסות להתאושש ממנהיג עד שהוא מפרסם שהוא פעיל.
- (מארק מילר)
- SOLR-5568 SolrCore לא יכול להחליט להיות המנהיג רק בגלל שמצב האשכול אומר שאף סולרקור אחר לא פעיל.
- (מארק מילר)
- SOLR-5496: אנחנו צריכים לשתף מנהל חיבור HTTP ב- HttpClients שאינם מחפשים ולהבטיח שכל מנהלי החיבור של http יכבו.
- (מארק מילר)
- SOLR-5583: ConcurrentUpdateSolrServer # blockUntilFinished יכול להמתין לעד אם שירות ההפעלה ייסגר.
- (מארק מילר)
- SOLR-5586: יש לאתחל את כל ZkCmdExecut's עם פסק זמן הלקוח zk.
- (מארק מילר)
- SOLR-5587: יישומי ElectionContext צריכים להשתמש ב- ZkCmdExecut #aperExists כדי להבטיח כי נתיבי הבחירות שלהם נוצרו כראוי.
- (מארק מילר)
- SOLR-5540: HdfsLockFactory צריך ליצור במפורש את ספריית האב של הנעילה במידת הצורך.
- (מארק מילר)
- SOLR-4709: הליבה נטענת מחדש לאחר שכפול אם קובצי התצורה השתנו עלולים להיכשל עקב מצב מרוץ. (מארק מילר, חוסמן))
- SOLR-5503: נסה שוב את 'בקשות' למנהיג 'באופן פחות אגרסיבי - במקום ב- IOException ובסטטוס 500, ConnectException.
- (מארק מילר)
- SOLR-5588: PeerSync אינו סופר את כל כשלי ההתחברות כהצלחה.
- (מארק מילר)
- SOLR-5564: hl.maxAlternateFieldLength אמור לחול על השדה המקורי כאשר נסיגה חוזרת
- (janhoy)
- SOLR-5608: אל תאפשר ל- SolrCore סגור לפרסם מצב ל- ZooKeeper.
- (מארק מילר, שון הייסי)
- SOLR-5615: קיפאון בעת ניסיון להתאושש לאחר פג תוקף של ZK.
- (רמקומאר איינגר, מארק מילר)
- SOLR-5543: החלפות ליבה גרמו לערכי ליבה כפולים ב- solr.xml בעת שימוש בהתמדה solr.xml.
- (ביל בל, אלן וודוורד)
- SOLR-5618: תיקון התאמות מטמון שווא ב- queryResultCache כאשר hashCodes שוות ושאילתות סינון כפולות קיימות באחת הבקשות
- (hossman)
- SOLR-4260: ConcurrentUpdateSolrServer # blockUntilFinished יכול לחזור לפני סיום כל העדכונים הקודמים. הדבר עלול לגרום לעדכונים מבוזרים המיועדים לאיבוד עותקים משוכפלים.
- (Markus Jelsma, Timothy Potter, Joel Bernstein, Mark Miller)
- SOLR-5645: טעינה מחדש של SolrCore דרך ה- CoreContainer תנסה להירשם ב- zk שוב עם ה- SolrCore החדש.
- (מארק מילר)
- SOLR-5636: SolrRequestParsers עושה כמה בדיקות xpath על כל בקשה, מה שעלול לגרום לבעיות מקביליות.
- (מארק מילר)
- SOLR-5658: להתחייב ולהחליף אינם מתפלגים לעותקים כעת ש- SolrCloud משתמש ב- javabin כדי להפיץ עדכונים.
- (מארק מילר, Varun Thacker, Elodie Sannier, shalin)
- אופטימיזציות:
- SOLR-5576: שפר את מקביליות בעת ההרשמה והמתינה שכל ה- SolrCore יירשם למצב DOWN.
- (כריסטין פורשקה באמצעות מארק מילר)
מה חדש בגירסה 4.6.0:
- שיפורים ושיפורים רבים עבור אפשרויות פיצול Shard
- אנליזה חדשה של AnalyseInfixLookupFactory כדי למנף את AnalyzingInfixSuggester
- New CollapsingQParserPlugin עבור שדה בעל ביצועים גבוהים מתמוטט על שדות קרדינליות גבוהים
- ממשקי API חדשים של SolrJ לניהול אוסף
- New DocBasedVersionConstraintsProfactorFactory המספק תמיכה לכללים המוגדרים על ידי המשתמש,
- תבנית חדשה של אינדקס ברירת מחדל: Lucene46Codec
- סוג EnumField חדש
מה חדש בגרסה 4.5.1:
- Solr 4.5.1 מכיל קומץ תיקוני באגים, כולל 2 שנחשבים לחמורים למדי.
מה חדש בגירסה 4.5.0:
- תמיכה מותאמת אישית של sharding, ניתוב משופר ורב-ריבוי הליכי משנה.
מה חדש בגירסה 4.2.0:
- ממשק API של REST לצד הסכימה. תמיד רציתי להתבונן בסכימה מעל http? עכשיו אתה יכול. נראה כמו הצד לכתוב יהיה הבא.
- DocValues שולבו Solr. DocValues ניתן לטעון הרבה יותר מהר מאשר מטמון השדה והוא יכול גם להשתמש באלגוריתמים דחיסה שונים כמו גם ב- RAM או על ייצוגים דיסק. מיפוי, מיון, שאילתות פונקציה כל להגיע ליהנות. מה דעתך על הטיפול במערכת ההפעלה וממיינת מטמון מחוץ לערימה? לא עוד כוונון 60 ג 'יגה? מה דעתך על קטע חדש חדש לכל DocValues שיטת פרצופים? שיפור הפנים המספרי? מתוק.
- אליסינג אוסף. יש לך נתונים מבוססי זמן? רוצה ליצור אינדקס מחדש באוסף זמני ולאחר מכן להחליף אותו בהפקה? בוצע. הישאר מכוון עבור Shard Aliasing.
- תשובות API של אוסף. ממשק ה- API של האוספים היה עדיין חדש מאוד ב -4.0, ובעוד שהוא השתפר מעט ב -4.1, התגובות היו בהחלט נחוצות, אך החטיאו את הניתוק. בתחילה, עשינו את ההחלטה להפוך את ה- API API סופר סובלני, מה שעשה תגובות קשוחות לעשות. אף אחד לא רוצה לצוד דרך קבצי יומנים כדי לראות איך הדברים התגלגלו. בוצע ב 4.2.
- אינטראקציה עם כל אוסף על כל צומת. עד 4.2, אתה יכול רק אינטראקציה עם הצומת באשכול שלך אם זה אירח לפחות עותק אחד של האוסף שרצית שאילתה / עדכון. לא עוד שאילתה כל הצומת, אם יש לו אוסף של האוסף המיועד שלך או לא ולקבל תגובה proxy.
- אפשר שמות של שמות מותאמים אישית כך שכתובות מארח חדשות יכולות להשתלט על שברים בדימוס. עבודה על אמזון בלי ips אלסטי? זה בשבילך.
- אופטימיזציות של Lucene 4.2, כגון וקטורים מונחים דחוסים.
מה חדש בגירסה 3.3.0:
- קיבוץ / התמוטטות שדות
- יישום השלמה / השלמה אוטומטית המבוססת על אוטומציה, המציע סדר גודל קטן יותר בצריכת RAM.
- KStemFilterFactory, יישום מיטבי של גבעול פחות אגרסיבי לאנגלית.
- ברירות מחדל של Solr למדיניות מיזוג חדשה ויעילה יותר (TieredMergePolicy). ראה http://s.apache.org/merging לקבלת מידע נוסף.
- תיקוני באגים חשובים, כולל שימוש ב- RAM גבוה במיוחד בבדיקת איות.
- תיקוני באגים ושיפורים מ- Apache Lucene 3.3
מה חדש בגירסה 3.2.0:
- היכולת לציין את המחרוזות ולבצע אותן כפרמטרי בקשה בעת שימוש בתבנית העדכון של JSON
- TermQParserPlugin, שימושי בעת יצירת שאילתות מסננים ממונחים שמוצגים משלב השדה או מרכיב התנאים.
- DebugComponent תומך כעת בשימוש ב- NamedList כדי להציג אובייקטי הסבר בתגובותיה במקום ב- Explanation.toString
- שיפורים באינטגרציות של UIMA ו- Crot2
- תיקוני באגים ושיפורים מ- Apache Lucene 3.2
מה חדש בגירסה 3.2.0:
- בוצעו שיפורים בעדכון JSON.
- קיבוץ באשכולות של תוצאות חיפוש ושילוב UIMA השתפרו.
- באגים תוקנו.
תגובות לא נמצא