פרטי תוכנה:
גרסה: 1.4
טען תאריך: 20 Feb 15
רשיון: ללא תשלום
פופולריות: 102
Apache Tika הוא ערכת כלים קוד פתוחה נועדו לזהות ולחלץ metadata, כמו גם תוכן טקסט מובנה ממספר מסמכים, באמצעות לא אבל קיימים ספריות מנתח.
Apache Tika תומך בפורמטי המסמך הבאים: HyperText Markup Language (HTTP), תבניות XML ו נגזר, תבניות מסמכים Microsoft Office, פורמט OpenDocument (ODF), פורמט Portable Document (PDF), פורמט פרסום אלקטרוני (EPF), Rich Text Format (RTF ), פורמטי דחיסה ואריזה, תבניות טקסט / אודיו / תמונה / וידאו, בפורמט mbox, וקבצי ג'אווה ברמה ובארכיונים.
בעבר, Apache Tika היה תת-פרויקט של ספריית תוכנת Apache Lucene. עכשיו זה מופץ כחבילה עצמאית על ידי המוסד לתוכנת האפצ'י
מה חדש במהדורה זו:.
- הוסר קובץ הבדיקה HTML עם טקסט GPL נבחר גרוע בזה (TIKA-1129).
קבצי .class Java
דרישות :
- Java 2 Standard Edition Runtime Environment
תגובות לא נמצא