יישומים רבים העוסקים בנתונים לא מובנים דורשים גישה לתוכן הטקסט של מסמכים מעוצבים או מסומנים. ארגונים שארכיון מסמכים לעתים קרובות דורשים גישה לתוכן טקסטואלי כדי להפוך את המסמכים לחיפוש ולאפשר צבירת תוכן, דיווח וכרייה של ארכיוני המסמך. חיפוש ויישום אחזור גם צריך לחלץ וtokenize טקסט מפורמטים של קבצים שונים.
מנגנון סטנדרטי אחד לגשת ולחלץ טקסט ממסמכים מסופק על ידי ממשק התוספת IFilter שימוש במנועי החיפוש של מיקרוסופט. ישנם כמה יישומים IFilter פותחו על ידי מיקרוסופט וספקים אחרים שמכסים מגוון רחב של פורמטים של קבצים. האיכות סטנדרטית או מיצוי אמינות וטקסט משתנה על פני מפתחי IFilter מרובים.
מסנני טקסט Opait הוא תכנית שירות קטנה עם ממשק פשוט לIFilters שכבר מותקנים במחשב המארח, כמו גם כמה מסנני חילוץ טקסט מותאם אישית שעובדים ישירות עם פורמטים של קבצים ולשפר את יישומי IFilter ברירת המחדל.
. הממשק כדי לחלץ טקסט מסופק על ידי Opait.Filters נקרא מעמד ספרייה קטן אשר נכללה וניתן להשתמש בם כדי לשלב מסנני טקסט לתוך היישומים NET
דרישות :
.NET Framework 4.5
תגובות לא נמצא