כיוון העמוד של מסמך מוגדר ככיוון ההדפסה של שורות טקסט. לכן כיוון הדף יכול להיות בכל מצב אופקי הדפסה (מצב דיוקן) או במצב אנכי הדפסה (מצב נוף). תיקון כיוון העמוד הוא חיוני לכל מערכת כניסה אוטומטית למסמכים מודפסים. PageHelper מזהה את דפים בצד למטה (הסתובבו...

מסמכים שנשלחו בפקס לעתים קרובות מכילים קווים אופקיים מעצבנים בשל רעש תקשורת על קו הטלפון. סרק מסמך ובמקרים מסוימים, גם יש לי קווים אופקיים או אנכיים בשל פסים או מתקפלים ניירות. על ידי ניצול LinesHelper באופן אוטומטי ניתן להסיר את השורות האלה. LinesHelper...

צורות לעתים קרובות מכילות אלמנטים מודפסים מראש כשדה מגרפות (או מסרקים) או אופי מגרפות (או מסרקים). סרק מסמך ובמקרים מסוימים, גם יש לי קווים אופקיים או אנכיים בשל פסים או מתקפלים ניירות. התמודדות עם ממצאים אלה היא משימה מאתגרת עבור מערכת שמנסה לזהות מגרפות...

הסרת גבול שחורה היא תכונה של תוכנה לניהול מסמכים באופן אוטומטי מסירה את הקצוות השחורים של מסמך שנסרק באופן דיגיטלי. קצות גבול שחורים יכולים לגרום לבעיות עם זיהוי תווים אופטי (OCR). BordersHelper עושה שימוש באלגוריתם המבוסס על מבול מילוי, רכיב תוויות,...

צורות לעתים קרובות מכילות אלמנטים מודפסים מראש כגון תיבות שדה או תיבות אופי. מסמכים סרוקים בחלק מהמקרים יש גם קווים אופקיים או אנכיים בשל פסים או מתקפלים ניירות. התמודדות עם ממצאים אלה היא משימה מאתגרת עבור מערכת שמנסה לזהות תיבות במסמכים עסקיים עיבוד....

פחת מוקדי רעש הוא התהליך של הסרת כתמים מתמונות (במיוחד מפות סיביות שנוצרו באמצעות סורק). כתמים הם חפצים אשר פיקסלים נוספים (או אוספים של פיקסלים נוספים) שיכולים להתרחש בתמונות סרוקות בגלל פגמים בחומרת הסורק, או בגלל אבק או לכלוך להיות נוכח במצלמה, משטח...

תוכנת OCR טיפוסית יכולה להתמודד עם תמונות בינארי רק עם פיקסלים שחורים המייצגים את הטקסט ופיקסלים לבנים מייצגים רקע. זה לא יוצא דופן במסמכים מודרניים יש אזורים הפוכים טקסט ואזורי טקסט רגילים באותו המסמך. ZoneHelper מזהה וממיר באופן אוטומטי אזורי טקסט...

ScanHelper קורא ברקודים של קבצי תמונה או זיכרון. התוכנה לזיהוי הברקוד שלנו קוראת ברקודים ליניארי והוא זמין עבור Windows ו- Mac. כולל מערכת הפעלה אחר. מערכת משובצת זמינה על פי בקשה. דוגמאות לC, C #, Java, ו- VB. ספריית ההכרה ברקוד שלנו תומכת במספר סוגי...

DeskewHelper מאפשר זיהוי אוטומטי ולסלף תיקון. איתור ותיקון הטיה הוא בעיה מאוד חשובה כאשר אלגוריתם OCR מנסה לזהות ולפרש את תווים ממסמך המקור. פתרונות רבים ושונים פותחו. השלב שבו זיהוי הסטייה מתקיים גם משתנה מהראשון לאחרון לפני שלב OCR. ניתוח מבנה המסמך...

הצופה תמונה היא תכנית מחשב המציגה תמונה גרפית מאוחסנת; זה יכול לעתים קרובות להתמודד עם פורמטים של קבצי גרפיקה שונים. תוכנה כזו בדרך כלל הופכת את התמונה על פי מאפיינים של התצוגה כגון עומק צבע ורזולוציית תצוגה. בנוסף לPhotoHelper המספק רכישת תמונה מהסורק...