פרטי תוכנה:
גרסה: 1.4
טען תאריך: 20 Feb 15
רשיון: ללא תשלום
פופולריות: 6
Apache Tika הוא ערכת כלים קוד פתוחה נועדו לזהות ולחלץ metadata, כמו גם תוכן טקסט מובנה ממספר מסמכים, באמצעות לא אבל קיימים ספריות מנתח.
Apache Tika תומך בפורמטי המסמך הבאים: HyperText Markup Language (HTTP), תבניות XML ו נגזר, תבניות מסמכים Microsoft Office, פורמט OpenDocument (ODF), פורמט Portable Document (PDF), פורמט פרסום אלקטרוני (EPF), Rich Text Format (RTF ), פורמטי דחיסה ואריזה, תבניות טקסט / אודיו / תמונה / וידאו, בפורמט mbox, וקבצי ג'אווה ברמה ובארכיונים.
בעבר, Apache Tika היה תת-פרויקט של ספריית תוכנת Apache Lucene. עכשיו זה מופץ כחבילה עצמאית על ידי המוסד לתוכנת האפצ'י
מה חדש במהדורה זו:.
- הוסר קובץ הבדיקה HTML עם טקסט GPL נבחר גרוע בזה (TIKA-1129).
קבצי .class Java
דרישות :
- Java 2 Standard Edition Runtime Environment
תגובות לא נמצא