Apache Tika 1.4

Apache Tika הוא ערכת כלים קוד פתוחה נועדו לזהות ולחלץ metadata, כמו גם תוכן טקסט מובנה ממספר מסמכים, באמצעות לא אבל קיימים ספריות מנתח.Apache Tika תומך בפורמטי המסמך הבאים: HyperText Markup Language (HTTP), תבניות XML ו נגזר, תבניות מסמכים Microsoft...