LanguageTool

צילום מסך תוכנה:
LanguageTool
פרטי תוכנה:
גרסה: 2.9 מעודכן
טען תאריך: 14 Apr 15
מפתחים: Daniel Naber
רשיון: ללא תשלום
פופולריות: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool היא תכנית הגהה קוד פתוחה שנועדה למצוא טעויות שכלים בודק איות רגילים לא יכולים לזהות. זה סגנון ובודק דקדוק שימצא טעויות שכלל מוגדרת בקבצי תצורת XML, כגון ערבוב & ldquo שלטון המבוססים על; & rdquo; עם וldquo;. שם & rdquo;


מזהה בעיות דקדוק שונות

התכנית יכולה גם לזהות בעיות דקדוק שונות ומגיעה עם תמיכה בלמעלה מ -20 שפות, כולל אנגלית, גרמנית, פולנית, צרפתית, ספרדית, שוודית, יוונית, סינית, דנית, יפנית, איסלנדית, פורטוגזית ופורטוגזית ברזילאית.
בנוסף, הוא מתגאה ממשק משתמש גרפי קל לשימוש, פשוט וברור שמאפשר לכל אחד להדביק טקסט שצריך לאיית בדק. הוא יכול לבדוק את הטקסט בלוח, טקסט תג, להדביק טקסט לחתוך / העתק /, ומתגורר באזור מגש המערכת.


מזהה מגוון רחב של בעיות

מהדו-שיח אפשרויות, אתה יכול להפעיל איזה סוג של בעיות היישום יכול לזהות, כוללים בסגנון רע, שגיאות דקדוק, סלנג, שגיאות פיסוק, שגיאות הקלדה אפשריות, ביטויים מיותרים, בדרך כלל מילות מבולבלות, צירופים, היוון, סמנטיקה, כמו גם כביטויים שאינם סטנדרטיים.


LanguageTool לLibreOffice וOpenOffice

מלבד היותו יישום עצמאי, LanguageTool זמין גם כהרחבה לשתי הסוויטות הפופולריות והחזקות ביותר בקוד פתוח המשרד, LibreOffice והאפאצ'י OpenOffice.org, המאפשר למשתמשים להגיה טקסטים שלהם על ידי לחיצה ימנית על ביטויים שנבחרו או סעיפים.


LanguageTool עבור Mozilla Firefox

בנוסף, היישום זמין גם להורדה כתוספת עבור העולם & rsquo; של דפדפן אינטרנט הפופולרי ביותר בקוד פתוח בעולם, Mozilla Firefox. זה לא דורש הפעלה מחדש ומציב כפתור קטן בסרגל הכלים הראשיים, ומאפשר לך להגיה את טקסט מודגש מאתרים או צורות.


מתחת למכסה המנוע והזמינות

היישום כתוב כולו בשפת תכנות ג'אווה, מה שאומר שזה & rsquo; sa תוכנה בפלטפורמות, שנועד לעבוד עם כל הפצת גנו / לינוקס, כמו גם BSD, Solaris, הפעלה X Microsoft Windows ו- Mac OS מערכות, שבו Java Runtime Environment מותקן.

מה חדש בהודעה זו:

  • קטלאנית:
  • מילון תג קופה מעודכנת
  • הוסיף חוקים חדשים
  • אזעקות שווא קבועות
  • אנגלית:
  • הוסיף כמה כללים וקבועים כמה אזעקות שווא
  • כללים נוסף רבים בסגנון חדש שנתרמו על ידי הייקי Lehvaslaiho. כמו אלה עלולים לגרום לאזעקות שווא, הם לא מופעלים כברירת מחדל. אתה יכול להפעיל אותם על ידי הפעלה כל הכללים בקטגוריה החדשה 'רגיל אנגלית'.
  • אספרנטו:
  • הוסיף כמה כללים חדשים
  • צרפתית
  • מילון קופה מעודכנת תג ומילון Hunspell לDicollecte-5.3
  • גרמני:
  • הוסיף כמה כללים חדשים ואזעקות שווא קבועות
  • נוסף כלל חדש שבודק את הסכם פועל הנושא. לעת עתה, רק במקרים עם "ist ',' sind ',' מלחמה ', ו' Waren 'נתמכים. דוגמא לשגיאות שאותרו: ". דר הונט sind schA וסעיף; n ',' Die מכוניות שנל ist." כדי להפוך את העבודה כלל זה, ביטויים כעת מאוחדים בdisambiguation.xml: למשל, "מאן" בביטוי "עין מאן" רק לשמור על קריאתה nominative (SUB: NOM: SIN: MAS), בעוד שהיה לי גם קריאות הפעול ואפעילה (SUB: AKK: SIN: MAS, SUB: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • איטלקי:
  • שיפר כמה כללים
  • פולני:

  • כמה כללים חדשים
  • הוסיף
  • פורטוגזית:
  • / כמה כללים משופרים הוסיפו
  • 3695 צירופי מילים (לפני רפורמה) - מסד הנתונים חופשיים הגדולים ביותר
  • רוסי:
  • הוסיף וכללים משופרים
  • אוקראיני:
  • עדכון מילון גדול
  • כללי דקדוק חדשים
  • פשוט חדש להחליף שלטון להצעות רכות
  • שיפורי disambiguator
  • שיפורי תיוג מתחם וכתיב

  • שיפורי תיוג
  • תיבות

  • שיפורי Tokenizing
  • משפט ומילה
  • טיפול משופר של סמל Stres ומקף רך
  • כללי Bitext:
  • הוסיף כלל פשוט לבדיקה אם בסופו של תרגומים עם אותו סימן הפיסוק כמו המקורי (זה כולל רק.?! תווים).
  • אפשר עכשיו להוסיף קבצי שלטון bitext חיצוניים בשורת הפקודה, באמצעות
  • אפשרות -bitextrule. נתיב הקובץ צריך להיות מוחלט. הערה:. זה מאפשר שימוש בכללים bitext גם לשפות שאין להם כללי bitext הכלולים כברירת מחדל
  • תיקון:
  • הקבצים החדשים ב/hunspell/spelling.txt ניתן להשתמש כדי להוסיף מילות מקובלות לבודקת האיות שנחשבים גם בעת יצירת הצעות למילים באיות שגוי. זה דומה לקבצי /hunspell/ignore.txt, שהרשימה קיבלה את הדברים שהם * לא * השתמשו בעת יצירת הצעות למילים באיות שגוי.
  • API:
  • JLanguageTool.activateDefaultPatternRules () וJLanguageTool.activateDefaultFalseFriendRules () הוסר - כל כללי הדפוס וכללי חבר השווא (אם שפה שנייה מצוינת) עכשיו מופעלים באופן אוטומטי כאשר הבנאי של JLanguageTool נקרא. האם אתה זקוק לבודק בלי כללי דפוס המבוסס על XML, להאריך מעמד השפה שלך (למשל 'אנגלית') עם אחד שמחליף את getPatternRules () שיטה ומחזיר רשימה ריקה שם.
  • ManualTagger.lookup () הוחלף על ידי ManualTagger.tag () לאחר שלא מומלץ לשימוש מאז השחרור האחרון
  • כל השיטות ושדות מכיתה 'שפה' סטטי כבר עברו לכיתה החדשה "שפות". לעת עתה, השיטות / שדות בשפת כיתה עדיין קיימות אבל כבר מיושנות.
  • LanguageIdentifierTools הוסר. השימוש LanguageIdentifier במקום.
  • הוסר (ברירת מחדל) ResourceDataBroker.setResourceDir () וsetRulesDir () כמו אלה יכולים להיות מוגדרים עם הבנאי
  • משתתף בכיתה ניקה את, למשל, הסרת getRemark ()
  • Category.setDefaultOff () הוסר, זה יכול להיות מוגדר באמצעות בנאי עכשיו
  • כיתות שמם: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • מבצעי ניקיון API קטנים אחרים שלא אמור להשפיע על מקרי שימוש הנפוצים, למשל IncorrectExample.getCorrections () חוזר ורשימת unmodifiable עכשיו, הסרת שיטות מיושנות.
  • שרת משובץ:
  • מנוס XML תוקן, זה עלול לגרום למסמכי XML לא חוקיים ליוחזר
  • אפשרות קובץ הגדרות חדשה "maxWorkQueueSize 'המאפשר לך להגדיר את הגודל המרבי של תור הבקשה - אם הוא מקבל יותר גדול מזה, בקשות תידחה (שירות 503 זמינים)
  • השרת עכשיו מגיב בקודי מצב HTTP ספציפיים יותר למצבי השגיאה הבאים: 413 ישות בקשה גדולה מדי - אם טקסט עולה על שירות גודל טקסט מרבי 503 לא זמין - אם בדיקה עולה זמן בדיקה מקסימאלי
  • GUI:
  • GUI העצמאי עכשיו יכול לקחת קובץ טקסט רגיל כטיעון, בקובץ זה לאחר מכן ניתן יהיה לטעון בהפעלה (נושא # Github 232).
  • שורת הפקודה:
  • עכשיו זה אפשרי להוסיף קובץ שלטון חיצוני כאשר קורא LanguageTool משורת הפקודה. השתמש --rulefile להוסיף קובץ. אם שם הקובץ יש תבנית שמכילה את שם שפה, הוא ישמש לצד כללים אחרים; אחרת, הוא יחליף את הכללים. גם אתה יכול לטעון קובץ חיצוני עם חברי שווא על ידי שימוש באפשרות --falsefriends. שם הקובץ צריך להיות נתיב קובץ מוחלט, וקבצי ידיד כוזבים תמיד מתווספים לאלה הנטענים לשפה. (Github נושא # 192)
  • תחביר כלל:
  • שלטון יכול עכשיו יש לי דוגמא משפט אחד, כל עוד יש לו תכונה 'תיקון' - זה יכול לחסוך קצת יתירות אם המשפט הנכון היחיד הוא אותו הדבר כמו המשפט השגוי עם התיקון מיושם. לפני, שלטון צריך לפחות שני משפטים לדוגמה.
  • 'דוגמא' אלמנט: הסוג = "לא נכון" הוא עכשיו אופציונאלי אם יש תכונה 'תיקון'. התכונה 'התיקון' מרמזת כי המשפט הוא שגוי.
  • 'דוגמא' אלמנט: הסוג "נכון" = הוא החברה שמירת. אין תכונת 'סוג' ואין תכונת 'תיקון' מרמז כי המשפט הוא נכון.
  • פנימי:
  • יש לנו עברנו מהאפצ'י Tika לשפה-גלאי (https://github.com/optimaize/language-detector) לזיהוי אוטומטי של שפת הטקסט. זה צריך להיות מהיר יותר ותוצאות צריכה להיות אמינות יותר. איתור של אסטורית וגליציה היה צריך להיות מנוטרל בגלל איכות זיהוי הייתה נמוכה מדי והשפיע גם על זיהוי של ספרדית.
  • קבוע רגרסיה שלא אפשרתי לטעון קבצי שלטון חיצוניים בGUI.

מה חדש בגרסה 2.8:

  • אסטורית:
  • תלות הוסרה על Hunspell, משתמשת כעת Morfologik לבדיקת איות
  • ברטון:
  • הוסיף ושיפר כמה כללים
  • קטלאנית:
  • מילון מעודכן
  • הוסיף וכללים משופרים
  • אזעקות שווא קבועות
  • הולנדי:

  • כללים רבים
  • הוסיף והשתפר
  • אנגלית:
  • כמה כללים חדשים (תודה לניק האף)
  • מתעדכן מילוני טאגר וסינתיסייזר, תיקון בעית מספר 202
  • מסנן חדש שישמש לpartofspeech של חלקי מילות, למשל התאמה:. * בזה רק ימשיך התאמות למילים שמתחילות ב'ב 'ושבו החלק אחרי' ב 'הוא שם תואר (תג קופה "ג'יי ג'יי"). 'לא: 1' הוא מיקום האסימון, כלומר כאן ראשון (ויחידה) התאמה נקראת
  • .
  • צרפתית:
  • הוסיף ושיפר כמה כללים
  • גרמני:
  • הוסיף ושיפר כמה כללים
  • פולני:
  • הוסיף וכמה כללים משופרים
  • הוסיף והשתפר חברי שווא עם אנגלית
  • פורטוגזית:
  • / כמה כללים משופרים הוסיפו
  • ספרדית:
  • תלות הוסרה על Hunspell, משתמשת כעת Morfologik לבדיקת איות
  • קובץ כללים מחדש
  • יותר כללים נוסף
  • טגלוג:
  • תלות הוסרה על Hunspell, משתמשת כעת Morfologik לבדיקת איות
  • אופי המקף ("") הוא מפריד עכשיו כשTokenizing הטקסט
  • רוסי:
  • הוסיף וכללים משופרים
  • הוסיף כמה כללי חבר השווא (רוסי / אנגלית)
  • אוקראיני:
  • רבים כללים חדשים (כולל הסכם עם שמות עצם, ביטויי זמן וכו ')
  • שיפור כיסוי הכלל
  • עדכון מילון (שיפורים גדולים לשמות עצם נכונים ומקרה הווקאטיב)
  • תג חדש ולשלוט להתריע על איות חלופיות
  • מידע מילת תדר נוסף כדי לשפר את הצעות איות
  • כמה כללי disambiguator חדשים
  • כלל תחביר:
  • ... כעת ניתן להוסיף לrulegroup להשפיע על כל כללי שהקבוצה
  • אם לפתח הכללים שאינם חלק מLT עכשיו אתה יכול להוסיף חיצוני = "כן" לקטגוריות שלך כדי למנוע את הקישור לשלטון community.languagetool.org מלהופיע בGUI העצמאי שלנו שלך (הקישור לא עובד לכללים שאינם חלק מההפצה העיקרית של LT). (Github נושא # 223)
  • אם קבוצה כלל מציינת ברירת מחדל
  • = "את", את הכללים בתוך הקבוצה כלל לא לציין גם ברירת מחדל = "על" / "את".
  • API:
  • שיעורים הוסרו ושיטות שלא מומלץ לשימוש מאז 2.7 או יותר
  • שרת משובץ:
  • 'requestLimit' אפשרויות קובץ config ו'requestLimitPeriodInSeconds 'יכול כעת לשמש גם לשרת HTTP (ולא רק לשרת HTTPS)
  • 'trustXForwardForHeader' אפשרות קובץ הגדרות חדשה: להגדיר את זה ל'אמיתי 'אם אתה מפעיל את השרת מאחורי פרוקסי הפוך ורוצה להגביל את הבקשה לעבוד על כתובות ה- IP המקוריות המסופקות על ידי כותרת HTTP' Xforwardedfor ', בדרך כלל שנקבע על ידי פרוקסי. אם אתה מפעיל מאחורי פרוקסי אבל לא תגדיר נכס זה לאמיתי, משתמש אחד יכול להשתמש בכל הבקשות, כך שמשתמש אחרים גם מקבל הודעת שגיאה בגלל מגבלת הבקשה.
  • תגובת תקן של אחרי מצב המועד האחרון: ... הייתה לפעמים ריקה, מבלבלת את סימון טקסט ובורדפרס
  • כללי Bitext לא מבוטל כראוי, גם אם הם היו מצוינים עם פרמטר נכון לשרת; עכשיו זה קבוע
  • בעיה קבועה עם עמדות בלתי ראויות לכמה כללי bitext (נושא # 218)
  • GUI:
  • ההגדרה 'errorColors' חדשה נוספה לקובץ תצורת languagetool.cfg. ניתן להשתמש בו כדי להגדיר את צבע הרקע של טעויות. לדוגמא, errorColors = דפוס: # b8b8ff, סגנון: # ffb8b8 יציג שגיאות 'כתיב' עם רקע כחול ושגיאות 'סגנון' עם רקע אדום בחלק העליון של חלון LT. "דפוס" ו- "סגנון" הם הסוגים שנקבעו בgrammar.xml כמו "סוג = ...". אין ממשק משתמש עדיין להגדיר את הצבעים האלה. שים לב שאתה צריך לערוך את קובץ languagetool.cfg כאשר LT אינו פועל רק.
  • פנימי:
  • תיקון באג: כללים בתוך קבוצה כלל לא הופעלו אם שלטון קודם מאותו rulegroup משמש ברירת מחדל = "את"

  • מילים
  • אינן מתעלמות יותר על ידי בודק האיות רק בגלל שהם מתרחשים בהצעה של שלטון. אם אתה רוצה בודק האיות להתעלם מילות גלובליות, להוסיף אותם לhunspell / ignore.txt. להתעלם מהם תלוי בהקשר, להוסיף כלל 'ignore_spelling' לdisambiguation.xml.
  • קובץ 'hunspell / prohibit.txt' כעת ניתן להשתמש כדי לסמן מילות כמו שגיאות כתיב, גם אם בודק האיות בדרך כלל מקבל אותם. זה שימושי כדי לשפר את בודק איות LanguageTool מבלי להמתין לבודק במעלה הזרם כדי להיות מעודכנים. קובץ 'prohibit.txt' הוא ההפך מ'ignore.txt ', מה שגורם בודק האיות להתעלם מילות.
  • טאגר partofspeech עבור רוב השפות יכול עכשיו להיות מורחב על ידי הוספת ערכים לorg הקובץ / languagetool / משאבים / XX / added.txt (XX להיות קוד השפה). הפורמט הוא "postag baseform fullform", שלוש עמודות מופרדות בכרטיסיות. זה עושה את זה קל יותר עבור משתמשים (ומפתחים) להאריך את טאגר קופה, כפי שהם לא צריכים לייצא, לשנות, ולשחזר את המילון בינארי לכל שינוי.

מה חדש בגרסה 2.7:

  • ברטון:
  • הוסיף וכללים משופרים
  • שלטון חדש שבודק אם בימי חול מועד מתאימים, למשל מזהה "Gwener 28 Eost דהינו 2014", כמועד שאינו יום שישי.
  • קטלאנית:
  • הוסיף וכללים משופרים
  • אזעקות שווא קבועות
  • הולנדי:

  • כללים רבים
  • הוסיף והשתפר
  • עבר לבודקת איות מבוססת Morfologik
  • -אנגלית:
  • האם אתה רוצה להיות חלק מהצוות שמפתח את כלי ההגהה של העולם החזק ביותר קוד פתוח? אנחנו מחפשים מתחזק לכללי אנגלית בLanguageTool. ראה http://wiki.languagetool.org/tasks-for-language-maintainers לפרטים.
  • כל מילוני אנגלית הורחבו כדי להכיל כיתות תדירות מילה כדי לשפר את ההצעות בודק איות (הנתונים נלקח מתדר https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / רכיבי IME / לטיניים / מילונים, כלשפות אחרות שכבר להשתמש בתכונה זו).
  • הצעות טובות יותר ללומדי אנגלית: פעלים חריגים, שמות עצם, שמות תואר ועכשיו יש בדרך כלל הצעה טובה יותר. לדוגמא, "thinked 'מציע' חשב ',' womans 'מציע' נשים '.
  • עוד שגיאות כתיב לספק הצעות עכשיו, למשל "Garentee '(ערבות)," אסיר תודה "(תודה). זה עלול לגרום לירידת ביצועים של ~ 10% (יותר לטקסטים עם הרבה מילות לא ידועות).
  • שלטון חדש שבודק אם בימי חול מועד מתאימים, למשל מזהה "יום שני, אוקטובר 7, 2014", כמועד שאינו יום שני. כלל זה יפעל רק אם הוא מזהה את פורמט התאריך בשימוש. עד כה, פורמטים אלה נתמכים: * "יום שני, אוקטובר 7, 2014" * "יום שני, אוקטובר 7, 2014" * "יום שני, אוקטובר 7, 2014" * "יום שני, אוקטובר 7, 2014" * (זה גם עובד עם שבוע מקוצר ימים כמו מו או יום ב 'ליום השני)
  • אספרנטו:
  • שלטון חדש שבודק אם בימי חול מועד מתאימים, למשל מזהה "Vendredon לה 28-AAgusto דה 2014", כמועד שאינו יום שישי.
  • צרפתית:
  • מילון קופה מעודכנת תג ומילון Hunspell לDicollecte-5.2
  • הוסיף סינתיסייזר - כלל ההסכם יכול עכשיו להציע הצעות לכמה שגיאות
  • / כמה כללים משופרים הוסיפו
  • שלטון חדש שבודק אם בימי חול מועד מתאימים, למשל מזהה "יום שישי 28/08/2014", כמועד שאינו יום שישי.
  • גרמני:
  • NullPointerException קבוע נדיר וArrayIndexOutOfBoundsException
  • כמה אזעקות שווא קבועים
  • נוסף וכללים משופרים
  • שלטון חדש שבודק למשפטים ללא פועל (כבוי כברירת מחדל בשל הסיכון של אזעקות שווא)
  • שלטון חדש שבודק אם בימי חול מועד מתאימים, למשל מזהה "Dienstag, 2014/09/29", כמועד שאינו יום שלישי.
  • שיפורי ביצועים עבור בדיקת איות הצעות
  • פרסית:
  • הוסיף תמיכה ראשונית פרסית (פרסית)
  • פולני:
  • הוסיף ושיפר כמה כללים
  • כלל חדש שבודק אם בימי חול מועד מתאימים
  • פורטוגזית:
  • / כמה כללים משופרים הוסיפו
  • הוסיף עשרות רבים של צירופי מילים
  • רוסי:
  • הוסיף חוקים חדשים
  • לתקן בקשת תכונה # SourceForge 38 (לבדוק מרכאות שונות)
  • הוסיף כמה כללי חבר השווא (רוסי / אנגלית)
  • כלל חדש שבודק אם בימי חול מועד מתאימים, למשל מזהה "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N ?? & ETH; ומייקרו; ומכון טכנולוגי של; וfrac12; N & sbquo; N ?? & ETH; וplusmn; N & אירו; N ?? 2,014 & ETH; וsup3 ;. ", כמועד שאינו יום שני
  • .
  • שלטון מתחם רוסי מורחב עם מילות חדשות ממילון postag
  • ספרדית:
  • נוסף Z הקטגוריה קופה החדש (למספרי כוסמין, 'אונו' למשל, "דוס", ...)

  • כעת ניתן זוהו
  • מספרי כוסמין והצליחו גם בפירושונים וכללים.
  • תוקן כמה lemmas שגוי במילון קופה.
  • .
  • chunker-disambiguator ההיברידי נוסף
  • טמילית:
  • הוספת תמיכה ראשונית לטמילית. אם הגופן לטמילית לא מוצג כראוי במחשב שלך ואתה משתמש ב- Windows, ייתכן שתצטרך ליישם את העבודה סביב מתוארת כאן: https://bugs.openjdk.java.net/browse/JDK-8008572
  • אוקראיני:
  • עדכון גדול למילון POS (תיקונים ומילות חדשות)
  • כמה תג קופה שם לעקביות; תגים חדשים לקיצורים ומילות נדירות
  • כללים רבים חדשים ותיקונים לכללים קיימים
  • כלל חדש שבודק אם בימי חול מועד מתאימים, למשל מזהה "ומכון טכנולוגי של; ומכון טכנולוגי של; וfrac34; ומכון טכנולוגי של; וfrac12; ומכון טכנולוגי של; ומייקרו; ומכון טכנולוגי של;" N- & ETH; "ומכון טכנולוגי של; וfrac34; ומכון הטכנולוגי של; וordm ;, 7 & ETH; וסעיף; ומכון טכנולוגי של; וfrac34; ומכון טכנולוגי של; וsup2; 2014 ", כמועד שאינו יום שני
  • שיפור ביצועי נורמליזציה אסימון
  • האינטגרציה LibreOffice:
  • אל תתבלבל על ידי הערות שוליים בLibreOffice 4.3 ואילך (זה עכשיו מספק לנו את עמדות הערת השוליים כmeta נתונים, כך שאנו יכולים להתעלם מהם).
  • API:
  • שיפורי סרן ביצועים למקרה שימוש חוט רב, שבו מקבל JLanguageTool נוצר לחוט, אבל אובייקט השפה (לדוגמא "גרמני") מקבל נוצר רק פעם אחת. ממעל ליצירת JLanguageTool צריך עכשיו להיות הרבה יותר נמוך.
  • כמה כיתות הוסרו ושיטות שלא מומלצת לשימוש מאז גרסה 2.6
  • DutchSpellerRule הוסר - להשתמש MorfologikDutchSpellerRule במקום
  • החתימה של Language.getRelevantRules () השתנתה
  • הבנאים JLanguageTool וMultiThreadedJLanguageTool לא מצהירים לזרוק IOException יותר
  • WhitespaceRule השתנה לMultipleWhitespaceRule (WhitespaceRule עדיין קיים אבל כבר מיושן)
  • מגונה כמה שיטות נראות שתהיינה ירידה (למשל מהציבור המוגן)
  • MorfologikSpellerRule.getRuleMatch (מחרוזת, int) השתנה לMorfologikSpellerRule.getRuleMatches (מחרוזת, int)
  • בנאי RuleMatch עכשיו זורק חריג אם toPosition אינו גדול מfromPosition
  • הציג TextLevelRule מעמד מופשט חדש המשתרע כלל ושיכולים לשמש לכללים שמכסים יותר מ משפטים בודדים.
  • שורת הפקודה:
  • הפעלה והשבתת כללים ספציפיים באותו הזמן הוא עכשיו מותר. על מנת לבחון רק כמה כללים (השבתה כל השאר), אשר בעבר נעשה עם "LIST_OF_RULES --enable", כעת להשתמש "LIST_OF_RULES --enabledonly --enable" (או "-eo -e LIST_OF_RULES").
  • שרת משובץ:
  • ניתן להגדיר שתי אפשרויות חדשות במאפייני קובץ כדי להפוך LanguageTool לחזור אותו פורמט XML כלאחר המועד האחרון (ATD). בדרך זו ניתן להשתמש בו כטיפה-בתחליף לATD: * מצב - 'LanguageTool' או 'AfterTheDeadline' * afterTheDeadlineLanguage - קוד של שפת ברירת מחדל אם מצב מוגדר הערה 'AfterTheDeadline': המצב 'AfterTheDeadline' צריך להיחשב ניסיוני לעת עתה.
  • 'maxCheckThreads' האפשרות החדשה מאפשר הגדרת המספר המרבי של אשכולות עובדים על בקשות במקביל. ברירת המחדל הוא 10, כפי שהיה אמור להיות.
  • Internals:
  • AbstractDateCheckFilter הכלל המופשט חדש שמאפשר לבדוק אם משחק יום בשבוע ותאריך. לדוגמא "יום שלישי, ספטמבר 29, 2014" ניתן היה לזהות, כמו 29 ספטמבר 2014 הוא לא ממש ביום שלישי. זה משתמש בממשק החדש RuleFilter הניסיוני שיכול להיקרא מXML עם אלמנט 'המסנן' החדש. 'מסנן' לוקח תכונות הבאות: 'מעמד': שם מלא המוסמך של כיתת ג 'אווה שמיישמת RuleFilter, למשל "Args '" org.languagetool.rules.de.DateCheckFilter ": מחרוזת כמו" שנה: 1 חודש: 2 יום: 3 באמצע שבוע: 4 ", כלומר רשימה מופרדת שטח של זוגות מפתח / ערך, כאשר x מקבל נפתרה ל הערך הסמלי של התבנית (כמו באלמנט 'ההודעה')
  • שלטון מתחם החברה מתעלם אסימונים שחוסנו בdisambiguation.xml
  • הפעולה "המסנן" בdisambiguator כעת חלה רק על תגי קופה התואמים את תג קופה נתון. אם הם אינם תואמים, השלטון אינו מיושם.
  • אם אתה מאריך את כללי XML כמתואר בhttp://wiki.languagetool.org/tips-and-tricks#toc2, כעת ניתן ארח את קבצי שלטון ופירושונים החיצוניים בשרת המוגן בסיסמא על ידי ציון כתובת אתר כזה: http: // משתמש: password@example.org/path/user-rules.xml
  • מקפם ("ואירו;" ") הוא החברה אופי Tokenizing בכל השפות
  • תכונה חדשה:
  • שימוש במודלי שפה
  • LanguageTool יכול כעת לעשות שימוש בנתוני ngram. נתונים ngram מידע על כמה פעמים ביטויים להתרחש בשפה. נכון לעכשיו, זה משתמש בביטויים של אורך 3.
  • נתונים משמשים שלטון אנגלית כדי למצוא שגיאות הוֹמוֹפוֹן, כמו ערבוב גס / קורס או כשרון / התלקחות. היה לי LanguageTool כמה כללים לפני סוג זה, אך השלטון החדש תומך כעת על 900 זוגות / סטי מילה כזאת.
  • הנתונים דרושים לכך הוא ענק (7GB לאנגלית) ובכך לא חלק או LanguageTool.
  • נתונים (באנגלית בלבד לעת עתה) ועוד תיעוד זמין בhttp://wiki.languagetool.org/finding-errors-using-big-data
  • שימוש ngrams עושה LanguageTool מעט איטי כאשר הנתונים מאוחסנים על כונן SSD.
  • אם לא מאוחסן בכונן SSD, הביצועים עשויים באופן דרסטי להקטין.
  • השתמש באפשרות --languagemodel החדשה עם לקוח שורת הפקודה כדי להפעיל את הכלל המשתמש בנתונים. האפשרות שאינה זמינה עדיין לGUI העצמאי.

מה חדש בגרסת 2.4.1:

  • ספריות Morfologik עדכון ל1.8.3 לתקן הצעות איטיות בבודקת האיות, שהשפיע לפחות en-ארה"ב

מה חדש בגרסה 2.4:

  • ברטון:
  • SRX tokenization משפט
  • הוסיף / שיפר כמה כללים
  • כמה אזעקות שווא קבוע
  • קבוע הודות הצעות שגויות לבדיקות נוספות על תיקונים
  • קטלאנית:
  • / כמה כללים משופרים הוסיפו
  • אזעקות שווא קבועות
  • תוספות שבוצעו ותיקונים למילון טאגר
  • להסיר כמה מילות ממילון סינתזה (ראה filterarchaic.txt)
  • הוסיף נתונים תדירות למילון טאגר; wordlist התדירות מגיע מפרויקט גאיה, עם רישיון Apache, גרסה 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • אנגלית:
  • הוסיף / שיפר כמה כללים
  • כמה אזעקות שווא קבוע
  • צרפתית:
  • / כמה כללים משופרים הוסיפו
  • כמה אזעקות שווא קבוע
  • גרמני:
  • / כמה כללים משופרים הוסיפו
  • הוסיף סינתיסייזר שלטון הסכם עכשיו יכול להציע הצעות לכמה טעויות (לא כל ההצעות הן נכונות, אם כי)
  • פולני:
  • הוסיף / כמה כללים משופרים, במיוחד עבור מקף ושימוש מקף
  • הוסיף מידע תדירות למילון בדיקת איות; wordlist התדירות מגיע מפרויקט גאיה, עם רישיון Apache, גרסה 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • כמה אזעקות שווא קבוע
  • פורטוגזית:
  • הוסיף / כמה כללים משופרים (זה כולל כעת כללי מגדר "" / "o")
  • עכשיו יש לו 3400+ צירופי מילים
  • קובץ JAR השתנה לlanguagetool.jar, מlanguagetoolstandalone.jar לשעבר כדי למנוע בלבול על מה 'עצמאי' הפירוש בהקשר זה (נושא # GitHub 29)
  • לשפות עם כללים רבים (כמו צרפתית או גרמנים) ביצועים בטקסטים ארוכים כבר עלה ב% על 2,030
  • תיקון לthreadsafety (יכול לגרום לתלות בMultiWordChunker)
  • קבוע באג שבי ההסברים נתח לא נבדקו בקבוצות
  • תיקון: 1 ושלא הוערך ב...
  • קבוע באג במנגנון האיחוד שהושלך חלק מהפרשנויות ההתאמה בטרם עת
  • הוסיף תמיכה להסברי נתח בdisambiguator, וקבוע באג אחד באסימוני סינון עם ביאורי נתח
  • ספריות מעודכנות Morfologik ל1.8.2 (תיקוני באגים, שפיות מחמירה קלט בדיקה, להוסיף נתונים תדירות למילונים)
  • הוסיף את האפשרות של כולל נתונים תדירות למילונים taggging או איות. הפורמט הצפוי של wordlists התדירות הוא אחת בפרויקט גאיה, עם רישיון Apache, גרסה 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • כלי שורת הפקודה חדש ליצוא וליצור מילונים בינארי:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • אינטגרציה LibreOffice / OpenOffice:
  • הוסיף לעקיפת הבעיה לגילוי שגוי משפט למקרה שהערת שוליים הופיעו לאחר עצירה מלאה משפט (באג # Sourceforge 191)
  • GUI העצמאי:
  • הדו-שיח שנפתח על ידי הפריט "עוד ..." בתפריט ההקשר של שגיאה יהיה עכשיו גם להציג משפטים לדוגמה נכונים ולא נכונים
  • API:
  • SentenceTokenizer הוא כעת ממשק, היישום הועבר לRegexSentenceTokenizer, אבל זה לא מומלץ לשימוש ויש להשתמש בי SRXSentenceTokenizer במקום
  • כמה שיטות מorg.languagetool.tools.StringTools הועברו לכיתת org.languagetool.gui.Tools בפרויקט languagetoolguicommons
  • LanguageToolListener.languageToolEventOccured () השתנה לLanguageToolListener.languageToolEventOccurred ()
  • org.languagetool.tools.SymbolLocator אינו ציבורי יותר (לא צריך להשפיע על אף אחד)
  • להסיר DanishSentenceTokenizer שהיה מיושן במשך שלוש שנים
  • Rule.getCorrectExamples () וRule.getIncorrectExamples () לא יחזיר null יותר אבל רשימה ריקה אם אין דוגמאות. כתוצאה מכך, setCorrectExamples () וsetIncorrectExamples () לא מקבלים null יותר.
  • Rule.getId () עשוי להחזיר כל מחרוזת עכשיו, לא רק ASCIIonly מיתרים (למעשה זה היה המקרה לפני, כמו הגבלת ASCIIonly מעולם לא נאכפה ומוזכרת רק בjavadoc)
  • languagetoolwikipedia: אפשרויות שורת הפקודה לבדיקת מזבלה ויקיפדיה כבר מפושטות. הפקודה עכשיו יכולה להיקרא כך: צנצנת Java languagetoolwikipedia.jar checkdata l en F enwiki20130621pagesarticles.xml התקשר רק "checkdata languagetoolwikipedia.jar צנצנת Java" כדי לקבל הודעת שימוש. ניתן לציין יותר מקובץ אחד עם אפשרות F. בנוסף למזבלות XML ויקיפדיה, קבצי CSV מטטואבה (http://tatoeba.org) עכשיו נתמכים גם, הם צריכים להיות מסוננים ראשון להכיל את השפה הרלוונטית בלבד.

מה חדש בגרסה 2.3:

  • ברטון:
  • הוסיף / שיפר כמה כללים
  • אזעקות שווא קבועות
  • מילון קופה מתעדכן מApertium (SVN r47282)
  • קטלאנית:
  • הוסיף תמיכה לקוד השפה CA-ES-ולנסיה (קטלאנית ולנסיה), לשימוש בLibreOffice 4.2.0
  • הוסיף שלטון להחליף פשוט עם מאות הצעות החלפה
  • / כמה כללים משופרים הוסיפו
  • אזעקות שווא קבועות
  • סיני:
  • הוסיף לעקיפת בעיה עבור StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • אנגלית:
  • הוסיף דפוסי תחליף לבודק האיות להציע הצעות טובות יותר (כיום מציע 'לימד' עבור 'למד')
  • הוסיף / שיפר כמה כללים
  • צרפתית:
  • הוסיף / שיפר כמה כללים
  • אזעקות שווא קבועות
  • מילון קופה מעודכנת תג ומילון Hunspell לDicollecte-4.12
  • גרמני:
  • / כמה כללים משופרים הוסיפו
  • פורטוגזית:
  • הוסיף / שיפר כמה כללים
  • עכשיו יש לו 3300+ צירופי מילים
  • אוקראיני:
  • / כמה כללים משופרים הוסיפו
  • קוד המקור הועבר לGitHub: https://github.com/languagetool-org/languagetool
  • LanguageTool דורש 7 Java עכשיו
  • LanguageTool עושה שימוש במספר רב של נושאים החברה לטקסט בדיקה על חומרה מודרנית, שיפור ביצועים (זה משפיע על הגרסה העצמאית, גרסת שורת הפקודה והארכת LibreOffice / OpenOffice)
  • תחביר כלל:
  • תמיכה ראשונית לתכונות מינימום / מקסימום חדשים המאפשרות להתאים אלמנט שמופיע מספר הנתון של פעמים. לדוגמא: foo יתאים או לא כלום "foo", כלומר "foo" הוא foo האופציונלי יתאים "foo" או foo "foo foo" יתאים שום דבר, "foo", או "foo foo" מקסימום שימוש = "- 1" כדי לאפשר התרחשויות בלתי מוגבלות. דקות, רק 0 או 1 נתמך (1 הוא ברירת המחדל).
  • תמיכה או הצהרות. לדוגמא: פנימית ובזמן ריצה, שלטון מכיל או הצהרות מומר למספר כללים ללא או הצהרות
  • .
  • אנגלית עכשיו יש chunker לזהות, בין נתחי עצם יחידים ורבים, אחרים. זה מתועד בhttp://wiki.languagetool.org/using-chunks
  • גרסה עצמאית:
  • הגרסה העצמאית עכשיו מדגישה שגיאות עם אדום (שגיאות כתיב) או כחולה (טעויות אחרות) קו (Panagiotis מינוס)
  • זכור את בחירת השפה לתחילת הבאה
  • חלון משופר ומיקום הדו-שיח בהגדרת ריבוי צגים
  • שרת מוטבע: משתמש ביציאת ברירת מחדל (8081) שוב אם התחיל בלי ויכוחים
  • מתעדכן ספרייה לגרסה 1.7.1 כדי לאפשר הצעות טובות יותר, כולל טיפול נכון של סימני ניקוד ודפוסי החלפה נובעת-morfologik (שווה של תכונות מפה וREP במילוני hunspell)
  • אינטגרציה / LibreOffice OpenOffice:
  • תיקון: "אודות" הדו-שיח לא עבד בApache OpenOffice 4.0
  • תיקון: כללים ספציפיים למדינה (כמו לאנגלית הבריטית) לא עבדה
  • API:
  • בשפת כיתה, getCountryVariants () השתנה לgetCountries (), וgetVariant שיטה חדשה נוספה.
  • כמה שיטות כבר מיושנות
  • כמה שיטות כבר עברו מכיתת כלים (languagetool-ליבה) לכיתת CommandLineTools החדשה (languagetool-פקוד)










מה חדש בגרסה 2.2:



מה חדש בגרסה 2.1:





מה חדש בגרסה 2.0:







דרישות :

  • Java 2 Standard Edition Runtime Environment

תוכנות אחרות של יזם Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

תגובות ל LanguageTool

תגובות לא נמצא
להוסיף הערה
הפעל את התמונות!