reciprocal_smallest_distance

צילום מסך תוכנה:
reciprocal_smallest_distance
פרטי תוכנה:
גרסה: 1.1.5
טען תאריך: 20 Feb 15
רשיון: ללא תשלום
פופולריות: 10

Rating: nan/5 (Total Votes: 0)

reciprocal_smallest_distance הוא אלגוריתם orthology pairwise המשתמש ביישור רצף גלובלי ומרחק האבולוציוני סבירות המרבית בין רצפים במדויק למזהה orthologs בין הגנום.
התקנה מtarball
הורד וuntar את הגרסה האחרונה מGitHub:
cd ~
ס תלתל https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Xvz זפת
התקן reciprocal_smallest_distance, והקפד להשתמש Python 2.7:
cd reciprocal_smallest_distance-VERSION
פיתון setup.py להתקין
השימוש בRSD למצא Othologs
פקודות הדוגמא הבאות מדגימות את הדרכים העיקריות להפעלת rsd_search. כל קריאה של rsd_search דורשת המפרטת את המיקום של קובץ רצף בתבנית FASTA לשני גנומים, נקרא השאילתה וגנומים נושא. הסדר שלהם הוא שרירותי, אבל אם אתה משתמש באפשרות --ids, מזהי חייבים לבוא מהגנום השאילתה. גם עליך לציין קובץ לכתוב את התוצאות של orthologs נמצא על ידי אלגוריתם RSD. הפורמט של קובץ הפלט מכיל ortholog אחת בכל שורה. כל שורה מכילה id שאילתא הרצף, רצף id נושא, ומרחק (מחושב על ידי codeml) בין הרצפים. לחלופין אתה יכול לציין קובץ המכיל את תעודות הזהות באמצעות אפשרות --ids. אז RSD רק לחפש orthologs למזהים אלה. באמצעות --divergence ו--evalue, יש לך את האפשרות של שימוש ספים שונים מברירת המחדל.
קבל עזרה על איך לנהל rsd_search, rsd_blast, או rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
מצא orthologs בין כל הרצפים בגנומים השאילתה והנושא, משתמש בספי סטיית ברירת המחדל וevalue
דוגמאות -q rsd_search / הגנום / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-הגנום = דוגמאות / הגנום / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt -o
מצא orthologs באמצעות מספר ספי סטייה וevalue שאינה ברירת מחדל
דוגמאות -q rsd_search / הגנום / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-הגנום = דוגמאות / הגנום / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
0.2 --de 1e-20 --de .5 0.00001 --de 0.8 0.1
אין צורך לפרמט קובץ FASTA לפיצוץ או לחשב פיצוץ פוגע בגלל rsd_search עושה את זה בשבילך.
עם זאת, אם אתה מתכנן לרוץ מספר פעמים rsd_search עבור אותו הגנום, במיוחד עבור הגנום גדול, אתה יכול לחסוך זמן על ידי השימוש בrsd_format לpreformatting קבצי FASTA וrsd_blast לprecomputing הפיצוץ פוגע. בעת הפעלת rsd_blast, הקפד להשתמש ב--evalue גדול כמו סף evalue הגדול ביותר שאתה מתכוון לתת לrsd_search.
הנה איך לעצב זוג קבצי FASTA במקום:
דוגמאות / הגנום / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -g rsd_format
דוגמאות / הגנום / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -g rsd_format
וכאן הוא כיצד לעצב את קבצי FASTA, לשים את התוצאות בספרייה אחרת (הספרייה הנוכחית במקרה זה)
דוגמאות / הגנום / Mycoplasma_genitalium.aa / -d Mycoplasma_genitalium.aa -g rsd_format.
דוגמאות / הגנום / Mycobacterium_leprae.aa / -d Mycobacterium_leprae.aa -g rsd_format.
הנה איך לחשב קדימה לאחור להיטי פיצוץ (באמצעות evalue ברירת המחדל):
rsd_blast -v -q דוגמאות / הגנום / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-הגנום = דוגמאות / הגנום / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
s_q.hits --reverse-להיטי q_s.hits --forward-להיטים
הנה איך לחשב קדימה ופיצוץ הפוך פוגע לrsd_search, באמצעות הגנום שכבר מעוצב לפיצוץ וevalue שאינה ברירת מחדל
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject-הגנום = Mycobacterium_leprae.aa
s_q.hits --reverse-להיטי q_s.hits --forward-להיטי
--no פורמט --evalue 0.1
מצא orthologs בין כל הרצפים בשאילתא וגנומים נושא באמצעות הגנום שכבר מעוצבים לפיצוץ
rsd_search -q Mycoplasma_genitalium.aa
--subject-הגנום = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no פורמט
מצא orthologs בין כל הרצפים בשאילתא וגנומים נושא באמצעות להיטים שכבר מחושבים. שים לב ש--no פורמט כלול, כי מאז פיצוץ הלהיטים כבר מחושבים הגנום לא צריך להיות מעוצב לפיצוץ.
rsd_search -v --query-הגנום Mycoplasma_genitalium.aa
--subject-הגנום = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
s_q.hits --reverse-להיטי q_s.hits --forward-להיטי --no הפורמט
מצא orthologs לרצפים ספציפיים בגנום השאילתה. למציאת orthologs רק כמה רצפים, באמצעות --no-פיצוץ-מטמון יכול להאיץ את חישוב. YMMV.
דוגמאות -q rsd_search / הגנום / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-הגנום = דוגמאות / הגנום / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
דוגמאות / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt -o
--ids דוגמאות / Mycoplasma_genitalium.aa.ids.txt --no-פיצוץ-מטמון
פורמטים פלט
ניתן לשמור Orthologs במספר פורמטים שונים באמצעות אפשרות --outfmt של rsd_search. תבנית ברירת המחדל, --outfmt -1, מתייחסת ל--outfmt 3. בהשראת Uniprot dat קבצים, סט של orthologs מתחיל עם קו פרמטרים, אז יש 0 או יותר קווי ortholog, אז יש קו סיום. Parametes הוא שם שאילתא הגנום, שם הגנום נושא, סף סטייה, וסף evalue. כל ortholog הוא בשורה אחת המפרטת את id שאילתא הרצף, רצף id נושא, ואומדן מרחק סבירות המרבי. תבנית זו יכולה לייצג orthologs לקבוצות מרובות של פרמטרים בקובץ יחיד, כמו גם קבוצות של פרמטרים ללא orthologs. לכן הוא מתאים לשימוש עם rsd_search כאשר ציון סף סטייה וevalue מרובה.
הנה דוגמא המכילה 2 שילובי פרמטר, שאחד מהם אין orthologs:
הרשות הפלסטינית tLACJO tYEAS7 t0.2 t1e-15
או tQ74IU0 tA6ZM40 t1.7016
או tQ74K17 tA6ZKK5 t0.8215
//
הרשות הפלסטינית tMYCGE tMYCHP t0.2 t1e-15
//
הפורמט המקורי של RSD, --outfmt 1, מסופק לתאימות לאחור. כל שורה מכילה ortholog, מיוצג כid רצף נושא, id רצף שאילתא, ואומדן מרחק סבירות מרבי. זה יכול לייצג רק בקבוצה אחת של orthologs בקובץ.
לדוגמא:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
גם סיפק לתאימות לאחור הוא פורמט המשמש באופן פנימי על ידי Roundup (http://roundup.hms.harvard.edu/) שזה כמו בפורמט המקורי RSD, למעט עמודת id רצף שאילתה לפני id רצף הנושא.
לדוגמא:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

דרישות :

  • Python
  • תפציץ צמח השדה 2.2.24
  • PAML 4.4
  • Kalign 2.04

תוכנה דומה

STEPS
STEPS

15 Apr 15

VULCAN
VULCAN

20 Feb 15

תגובות ל reciprocal_smallest_distance

תגובות לא נמצא
להוסיף הערה
הפעל את התמונות!