ASPseek

צילום מסך תוכנה:
ASPseek
פרטי תוכנה:
גרסה: 1.2.10
טען תאריך: 3 Jun 15
מפתחים: SWsoft
רשיון: ללא תשלום
פופולריות: 4

Rating: nan/5 (Total Votes: 0)

ASPseek היא תוכנת מנוע חיפוש באינטרנט שפותח על ידי SWsoft ורישיון כתוכנה חופשית תחת GNU GPL.
ASPseek מורכב של רובוט אינדקס, דמון חיפוש, וממשק חיפוש CGI. זה יכול מדד רב כמו כמה מיליוני כתובות אינטרנט ולחפש מילות וביטויים, בתווים כלליים שימוש, ולעשות חיפוש בוליאני. יכולות להיות מוגבלות תוצאות חיפוש לתקופת זמן נתונה, אתר או מרחב אינטרנט (סט של אתרים) ומסודר לפי רלוונטי (משמש PageRank) או תאריך.
ASPseek מותאם במיוחד עבור אתרים מרובים (מדד הליכי, חיפושי DNS סינכרוני, קיבוץ תוצאות על ידי אתר, מרחבי אינטרנט), אך ניתן להשתמש בם לחיפוש באתר אחד, כמו גם. ASPseek יכול לעבוד עם שפות / קידודים מרובים בבת אחת (כולל קידודי multibyte כגון סיני) בשל מצב אחסון Unicode. תכונות אחרות כוללות מילים מעצורות ותמיכת ispell, מנחש קידוד ושפה, תבניות HTML לתוצאות חיפוש, קטעים, ומילות שאילתא הדגשה.
ASPseek כתוב ב- C ++ באמצעות ספריית STL, ומשתמש בשילוב של קבצים בינאריים לאחסון נתונים ו- SQL.
הנה כמה תכונות עיקריות של "ASPseek":
יכולת מדד והחיפוש דרך מספר מיליוני מסמכים
 
· שימוש בASPseek, אתה יכול לבנות מסד נתונים ולחפש דרך אתרים רבים, ותוצאות לכל שאילתא תוחזר מהר גם אם יש לך כמה מיליוני מסמכים באינדקס. כמובן, זה תלוי בחומרה, אז אל תצפה מכונה 486 נ "ישנה וטובה" לטיפול בכל אתר בתחום של .com. הכל תלוי במעבד (ים), זיכרון, מהירות דיסק וכו 'אז אל בדיקות לפני שאתה עצמך לקנות חומרה ייעודית.
 
· העובדה שASPseek מותאם לכמויות גדולות לא צריכה למנוע ממך להשתמש בו כדי לחפש באתר שלך שמכיל כמה מאה מסמכים - זה עובד גם שם.
 
רלוונטי מאוד טוב של תוצאות
 
· המטרה של מנוע חיפוש היא למצוא מה משתמש רוצה. לא יכול להיות אלפי כתובות אינטרנט מצאו כתוצאה משאילתא החיפוש, אבל זה יכול להיות כל רלוונטי, כך שהמשתמש יהיה מרוצה.
 
· תוצאות פלט בASPseek מסודרים לפי רלוונטיות (או דירוג), אבל חישוב דרגה הוא לא משימה קלה. מפתחים ניסו כמיטב יכולתם כדי לשלב טכניקות הגדולות ביותר והאחרונות במנוע ASPseek תוך שמירה על מהירות חיפוש טובה.
 
תמיכת Ispell
 
· כאשר ASPseek משמש עם תמיכת ispell, searchd (1) יכול לחלופין למצוא את כל הטפסים לכל המילים שצוינו (לדוגמה: ליצור -> יצירה או יצר או יוצר). אז, זה מאפשר לך למצוא את המילה בכל צורות שונות.
 
מצב אחסון Unicode
 
· ASPseek יכול לאחסן מידע על מסמכים ב- Unicode, ובכך מאפשר ליישום מנוע חיפוש ריבוי שפות. אז, אתה יכול מדד ולחפש המסמכים באנגלית, רוסית ואפילו כל סיני, באתר אחד.
 
HTTP, HTTPS, HTTP פרוקסי, FTP (באמצעות פרוקסי) פרוטוקולים
 
· כASPseek הוא מנוע חיפוש באינטרנט, הוא משתמש בפרוטוקול HTTP לאתרי אינדקס. ASPseek תומך גם https המאובטח: // פרוטוקול. פרוטוקול FTP אינו נתמך באופן ישיר, אבל אתה יכול להשתמש בפרוקסי (כמו דיונון) ואתרי FTP המדד באמצעות פרוקסי.
 
· ASPseek תומך בתכונה "אישור בסיסי" של HTTP כך שאתה יכול אזורים המוגנים בסיסמא מדד (למשל מידע פרטי באינטרא-נט שלך).
 
טקסט / טקסט / תמיכת סוגי מסמכים רגיל HTML ו
 
· ASPseek יכול להבין מסמכים שנכתבו ב- HTML, ומסמכי טקסט רגילים. אלו הם הפורמטים הפופולריים ביותר באינטרנט.
 
· פורמטים אחרים, כגון PDF, RTF, וכו ', יכולים להיות נתמך בעזרת כל תכנית / סקריפט חיצוני אשר מסוגל להמיר פורמטים של- HTML או טקסט רגיל.
 
עיצוב מרובה הליכי, מפענח ה- DNS סינכרוני וכו '
 
· ASPseek משתמש אשכולות POSIX, שאומר שיש לי תהליך אחד נושאים רבים פועלים במקביל. אז הורדות מדד מסמכים מאתרים רבים, ותהליכי דמון חיפוש שאילתות חיפוש רבים בו זמנית. זה לא רק עוזר ASPseek בקנה מידה גם על SMP מערכות (מרובות), אלא גם משפר את מהירות אינדקס, כי במקרה של חוט אחד רוב הזמן יוקדש בהמתנה לנתונים מרשת.
 
· דבר אחד שתהליך יצירת אינדקס להאט הרבה היא בדיקת DNS (תהליך קביעת כתובת ה- IP תוך שימוש בשם שרת). כדי להימנע מעיכובים, חיפושי אסינכרוני (בדיקה נעשה על ידי תהליכים ייעודיים נפרדים) ומטמון כתובת ה- IP מיושמים.
 
מילים מעצורות
 
· מילים מעצורים הן מילות שאין להם משמעות בפני עצמו. דוגמאות: הוא, הם, ב, זה. מחפשים בהוא חסר תועלת, ולכן מילות כגון מנועים משאילתא חיפוש. מילים מעצורות גם אינן נכללות במאגר בעת יצירת אינדקס, כך מסד הנתונים הופך להיות קטנים יותר ומהיר יותר.
 
· אין מילים מעצורות "מובנים" בASPseek, הם נטענים בסטארט-אפ מהקבצים. קבצי מילת מעצור רבים לשפות שונות מגיעים עם ASPseek.
 
Charset guesse
 
· כמה שרתים שבורים או שגוי לא אומרים ללקוחות של תווים שבהם מספקים תוכן. אם אתה אינדקס שרתים כאלה, או באמצעות ASPseek לשרתי FTP המדד (פרוטוקול FTP יודע דבר על תוים), מנחש תווים ניתן להשתמש כדי להתמודד עם זה. מנחש Charset משתמש שולחנות מילת תדר (langmaps נקרא) כדי לקבוע קידוד נכון.
 
סטנדרטי הדרת רובוט תמיכה (robots.txt)
 
· ASPseek תומך בתקן זה באופן מלא. הוא מיועד לכל חברי אתר לאומר הרובוט (לדוגמא, המדד של ASPseek (1)) לדלג אינדקס כמה ספריות של האתרים שלהם.
 
· למידע נוסף ראה http://www.robotstxt.org/wc/robots.html
 
הגדרות לשלוט עומס שימוש ברוחב פס ברשת ושרתי האינטרנט
 
· אתה יכול לשלוט בדיוק רוחב פס של רשת שהמדד (1) משתמש. בדיוק, אתה יכול להגביל את רוחב הפס (בא לידי ביטוי בבתים לשנייה) המשמש מדד (1) לניתן זמן של יום. לדוגמא, אתה יכול להגביל את רוחב הפס בשעתי עבודה כדי שאנשים במשרד שלך לא יחוו אינטרנט איטי.
 
· אתה יכול גם לקבוע את הזמן המינימאלי בין שתי שאילתות לאותו שרת האינטרנט, כך שזה לא יהיה עמוס מדי וירד על ברכיו בזמן ריצת מדד (1).
 
אינדקס אסינכרוני בזמן אמת
 
· חלק ממנועי החיפוש דורשים שחיפוש צריך להיות עצר לזמן של עדכון מסד הנתונים. ASPseek לא צריך את זה, כך שאתה יכול לחפש ללא הפסקה.
 
· יותר לומר, יש מצב מיוחד של אינדקס נקרא אינדקס "בזמן אמת". אתה יכול להשתמש בו למספר קטן של מסמכים, וככל מסמך כזה הוא הוריד ומעובד, שינויים גלויים באופן מיידי בממשק חיפוש. תכונה זו היא לעזר רב אם אתה בונה את מנוע חיפוש לדפים עם תוכן במהירות משתנה כגון חדשות מקוונות וכו '
 
· שים לב שהמספר של מסמכים ב" בזמן אמת "מסד נתונים מוגבלים. זה בערך 1000 על החומרה שלנו (המילים שלך עשויות להשתנות), ויש לך באתר "בזמן אמת" מסמכים נוספים, איטיים יותר יהיו מהירות של אינדקס של( ושרק) מסד הנתונים. זה לא ישפיע על מהירות חיפוש אף.
 
· מסמכים ממאגר הנתונים של "בזמן אמת" הם עברו לבסיס נתונים רגילים לאחר ריצת מדד (1) באופן נורמלי.
 
מיון תוצאות לפי רלוונטי או לפי תאריך
 
· מנועי חיפוש בדרך כלל מחזיר תוצאות הרלוונטיות ביותר ראשון. אבל אם אתם מחפשים דפים האחרונים, אתה יכול להגיד לי ASPseek כדי למיין את התוצאות לפי תאריך השינוי האחרון, כך ששונה לאחרונה (או יצרת) דפים יוצגו ראשון.
 
קטעים, מילות שאילתא הדגשה
· קטע הוא חתיכת המסמך שנמצא במילות חיפשה מודגש, רק כדי לתת מושג על מה הוא המסמך על. ניתן להתאים אישית את מספר הקטעים בו מוצגות ואורכם. אם ישבית קטעים, תחילת המסמך יוצג.
 
· כל מסמך מצא מלווה בקישור "מטמון". ASPseek שומר עותק מקומי של דחוס כל מסמך מעובד, כך שמשתמש יכול לראות את כל המסמכים ב( אופציונאלי) הדגיש מילות שחפשו, גם אם זה הוסר מאתר מקורי (זה קורה לפעמים).
 
תוצאות קיבוץ על ידי אתר
 
· תוצאות מאתר אחד יכולה להיות מקובצים יחד. אם קיבוץ על ידי אתרים הוא ב, רק שתי תוצאות מוצגות מאותו האתר כברירת מחדל, ומשתמש יכול לראות דפים אחרים מאותו האתר על ידי ביצוע "עוד תוצאות מ ..." קישור.
 
שיבוטים
 
· משובט הם מסמכים זהים במקומות שונים. הם זוהו ומקובצים יחד, כך שמשתמש לא יוצג בדף מלא של כתובות אתרים למסמכים הזהים.
 
· איתור Clone הוא מוגבל בדרך כלל על ידי אתר אחד (כך מסמכים זהים מאתרים שונים לא נספרים כשיבוטים), אבל אתה יכול לשנות את זה על ידי recompiling ASPseek עם אפשרות --disable-שיבוטים-ידי האתר.
 
החדרים ותת
 
· שטח הוא הקבוצה של אתרים. לכן, אם אתה רוצה לספק את החיפוש הצטמצם לכמה שטח, אתה יכול ליצור מרחב ולחפש בתוך החלל ש. רק כל האתרים (למשל http://www.mysite.com/) מותר ייכללו בשטח.
 
· תת יכול לשמש גם כדי להגביל את החיפוש. אתה יכול ליצור קבוצת משנה ולשים מסכת כתובת אתר (כמו http://www.mysite.com/mydir/%) של, ולאחר מכן להגביל את היקף חיפוש למשנה רק נתן.
 
· ניתן להגביל את טווח חיפוש ללא רק אחד אלא כמה תת או רווחים.
 
תבניות HTML לתוצאות חיפוש קלה להתאמה אישית
 
· אתה יכול להתאים אישית את דפי החיפוש שלך, כך שהם ייראו ולהיות משולבים בצורה חלקה עם שאר האתר שלך. הדבר נעשה על ידי עריכה פשוטה של ​​קובץ תבנית החיפוש.
התקנה
gzip aspseek-1.2.10.tar.gz -dc | XF זפת -
aspseek-1.2.10 CD. / להגדיר
לעשות
su
make install

תוכנות אחרות של יזם SWsoft

OpenVZ kernel
OpenVZ kernel

2 Jun 15

Plesk for Windows
Plesk for Windows

22 Sep 15

OpenVZ Live CD
OpenVZ Live CD

2 Jun 15

תגובות ל ASPseek

תגובות לא נמצא
להוסיף הערה
הפעל את התמונות!