reciprocal_smallest_distance egy páros ortológia algoritmust használ a globális szekvenciaillesztési és maximális valószínűsége evolúciós közötti távolság szekvenciák pontosan érzékeli orthológja között genomok.
Telepítés egy tar
Töltse le és bontsuk a legújabb verziót a GitHub:
cd ~
curl-L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Tar xvz
Telepítse reciprocal_smallest_distance, ügyelve arra, hogy a Python 2.7:
cd reciprocal_smallest_distance-VERZIÓ
python setup.py telepíteni
A RSD keressünk Othologs
A következő példa parancsok bizonyítani fő módon futtatható rsd_search. Minden hívása rsd_search feltétlenül igényli a helyét a FASTA formátumú sorozatot fájl két genom, az úgynevezett lekérdezés és a tárgyat genomok. A sorrend nem önkényes, de ha használja a --ids opciót, az IDS kell származnia, a lekérdezés genomban. Meg kell adni még egy fájlba írja az eredményeket a orthológja által talált RSD algoritmus. A formátum a kimeneti fájl tartalmaz egy orthológját soronként. Minden sor tartalmazza a keresett szekvencia id, adott szekvencia id, és a távolság (számítják codeml) szekvenciák közötti. Megadható egy fájl, amely azonosítók használatával --ids opciót. Ezután RSD csak keresni orthológja azoknak azonosítók. Segítségével --divergence és --evalue, akkor lehetősége van a különböző küszöbértékeket az alapértelmezett.
Kérjen segítséget, hogyan lehet futtatni rsd_search, rsd_blast, vagy rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Keresse meg orthológja között a szekvenciák a lekérdezés és a tárgyat genomok, az alapértelmezett divergencia és evalue küszöbértékek
rsd_search -q példák / genomok / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = példák / genomok / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Keresse meg orthológja néhány nem alapértelmezett divergencia és evalue küszöbértékek
rsd_search -q példák / genomok / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = példák / genomok / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1E-20 --de 0,5 0,00001 --de 0,8 0,1
Nem szükséges formázni a FASTA fájl BLAST vagy kiszámítania BLAST üt, mert rsd_search nem az Ön számára.
Azonban, ha azt tervezi, a futás rsd_search több alkalommal ugyanazon genomok, különösen nagy genomok, akkor időt takaríthat meg használatával rsd_format hogy preformatting a FASTA fájlokat és rsd_blast hogy precomputing a BLAST üt. Amikor fut rsd_blast, győződjön meg arról, hogy használjon --evalue akkora, mint a legnagyobb evalue küszöbértéket szándékozik adni a rsd_search.
Itt van, hogyan kell formázni egy pár FASTA fájlok helye:
rsd_format -g példák / genomok / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g példák / genomok / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
És itt van, hogy formázni a FASTA fájlokat, amivel az eredményt a másik könyvtárban (az aktuális könyvtár ebben az esetben)
rsd_format -g példák / genomok / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g példák / genomok / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Itt van, hogyan kell kiszámítani előre és hátra robbanás találatot (az alapértelmezett evalue):
rsd_blast -v -q példák / genomok / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = példák / genomok / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-képtárban q_s.hits --reverse-képtárban s_q.hits
Itt van, hogyan kell kiszámítani előre és hátra robbanás látogatók rsd_search, a genomok már formázva robbanás, és nem alapértelmezett evalue
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
--forward-képtárban q_s.hits --reverse-képtárban s_q.hits
-no-formátumban --evalue 0.1
Keresse meg orthológja között a szekvenciák a lekérdezés és figyelemmel genomok segítségével genomok már formázva robbanás
rsd_search -q Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
-no-formátumban
Keresse meg orthológja között a szekvenciák a lekérdezés és figyelemmel genomok felhasználásával találatot már kiszámolható. Figyeljük meg, hogy a -no-formátumban is, mert hiszen a robbanás találatot már kiszámította a genom nem kell megformázni a robbanás.
rsd_search -v --query-genom Mycoplasma_genitalium.aa
--subject-genom = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-képtárban q_s.hits --reverse-képtárban s_q.hits --no- formátumban
Find ortológjait számára specifikus szekvenciák a lekérdezés genomban. Megtalálása orthológja csak néhány szekvenciák, a -no-robbanás-cache felgyorsítható számítás. YMMV.
rsd_search -q példák / genomok / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-genom = példák / genomok / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o példák / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids példák / Mycoplasma_genitalium.aa.ids.txt --no- robbanás-cache
Kimeneti formátumok
Orthológja menthető különböző formátumokban segítségével --outfmt lehetőséget rsd_search. Az alapértelmezett formátuma, --outfmt -1, utal --outfmt 3. ihlette Uniprot dat fájlokat, egy sor orthológja kezdődik a paraméterek sorban, majd a 0 vagy több orthológját sorok, aztán egy végén sor. A paraméterekben a query genom név, tárgy genom nevet és divergencia küszöböt, és evalue küszöböt. Minden orthológját van egy sorban felsorolja a keresett szekvencia id, az adott szekvencia id, és a maximális valószínűsége távolság becslést. Ez a formátum képviseli orthológja több paraméterkészleteket egy-egy kép, valamint paraméterkészleteket nélkül orthológja. Ezért alkalmas a rsd_search megadásakor több divergencia és evalue küszöbértékeket.
Itt egy példa, amely 2 paraméter-kombinációk, amelyek közül az egyik nem rendelkezik ortológjait:
PA tLACJO tYEAS7 t0.2 t1e-15
VAGY tQ74IU0 tA6ZM40 t1.7016
VAGY tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
Az eredeti formája RSD, --outfmt 1, a kompatibilitási okok. Minden sor tartalmaz egy orthológját, képviseletében a téma sorrendben id, keresett szekvencia id, és maximális valószínűsége távolság becslést. Ez csak akkor képez egy sor orthológja egy fájlban.
Például:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Szintén kompatibilitási okok egy olyan formátum használják belsőleg Roundup (http://roundup.hms.harvard.edu/), amely olyan, mint az eredeti RSD formátumban, kivéve a keresett szekvencia id oszlop előtt az adott szekvencia id.
Például:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215
követelmények :
- Python
- NCBI BLAST 2.2.24
- PAML 4.4
- Kalign 2,04
Hozzászólás nem található