פרטי תוכנה:
גרסה: 2.6.0
טען תאריך: 20 Feb 15
רשיון: Shareware
מחיר: 1900.00 $
פופולריות: 63
פרויקט PDFTextStream היא ספריית חילוץ טקסט PDF ומטה זמינה עבור Java, Python, ו- NET.
הוא תומך בכל הגרסאות של מפרט מסמך PDF, (כולל v1.6, בשימוש על ידי Acrobat 7), מיצוי של הטקסט המוצפן באמצעות ערכות תווים כפולים בתים (כולל סינית, יפני, קוריאנית ו), פענוח של 40 סיביות ו128 מסמכים קצת מוצפן, והפקה של כל metadata המסמך הניתן על ידי מסמכי PDF (כולל נתוני טופס, סימניות, והסברים).
אינטגרציה קלה עם ג'קרטה Lucene כלולה
מה חדש במהדורה זו:.
- גרסה זו כוללת מגוון רחב של תיקונים שנעשה כדי להבטיח PDFTextStream מסוגל חילוץ טקסט ממסמכי PDF שאינם תואמים למפרט PDF.
מה חדש בגרסה 2.3.0:
-
הוספת שיטת .isStruckThrough () כדי com. snowtide.pdf.TextUnit, המציינת אם דמות יש קו חוצה נמשך דרך אותו.
- משופר התמיכה של PDFTextStream למיפוי אופי מוטבע.
- חישוב הרווחים בין המילים תוקן לחשבון כראוי לרווחים שמקודדים באופן מפורש במסמכי PDF המקור.
- משופר הטיפול של PDFTextStream קידודי תוכן מורכבים, אשר בעבר היה יכול להיכשל וכתוצאה מכך חלק מהטווחים של תוכן PDF ש'התעלם 'במהלך חילוץ.
- תוקן באג בVisualOutputTarget בי טקסט משורת אחת יהיה לפצל על קווים מרובים
- יישור אנכי משופר של טקסט חילוץ באמצעות VisualOutputTarget
- משופר בייצור תמציות VisualOutputTarget לחסל רווחים נוספים מזויפים בין מילות מקרוב סמוכות
מה חדש בגרסת 2.2.5:
- גרסה זו מוסיפה תמיכה לחילוץ נתונים צורות XFA כ XML.
דרישות :
- Apache Lucene
תגובות לא נמצא