Informácie

1.7: Príkazový riadok BLAST - Biológia

1.7: Príkazový riadok BLAST - Biológia


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Aj keď sa predchádzajúce kapitoly zaoberali inštaláciou a používaním niekoľkých nástrojov bioinformatiky ako príkladov tohto procesu, existuje jeden takmer všadeprítomný nástroj: BLAST alebo nástroj na vyhľadávanie základných miestnych zarovnaní.[1]

Daný jeden alebo viac dopyt sekvencie (zvyčajne vo formáte FASTA), BLAST hľadá zodpovedajúce sekvenčné oblasti medzi nimi a a predmet nastaviť.

Dostatočne tesná zhoda medzi podsekvenciami (na obrázku vyššie označená šípkami, hoci zhody sú zvyčajne dlhšie, ako je tu znázornené) sa nazýva pár s vysokým skóre (HSP), zatiaľ čo vyhľadávacia sekvencia sa nazýva zasiahnuť cieľovú sekvenciu, ak zdieľajú jeden alebo viac HSP. Niekedy sa však výraz „hit“ používa voľne, bez rozdielu medzi nimi. Každý HSP je spojený s „bitovým skóre“, ktoré je založené na podobnosti podsekvencií, ako je určené konkrétnym súborom pravidiel. Pretože vo väčších súboroch predmetov sa pravdepodobne dajú nájsť nejaké dobré zhody, každý HSP je tiež spojený s „E hodnota “, čo predstavuje očakávaný počet zápasov, ktoré by ste mohli náhodou nájsť v skupine predmetov tejto veľkosti s týmto skóre alebo lepším. Napríklad E hodnota 0,05 znamená, že môžeme očakávať náhodný zápas v 1 z 20 podobných vyhľadávaní, zatiaľ čo an E hodnota 2,0 znamená, že pri každom podobnom vyhľadávaní môžeme náhodne očakávať 2 zhody.

BLAST nie je jediný nástroj, ale skôr súprava nástrojov (a táto súprava sa v priebehu rokov rozrastá, pretože pribúdajú ďalšie funkcie a súvisiace nástroje). Najmodernejšiu verziu softvéru s názvom BLAST+spravuje Národné centrum pre biotechnologické informácie (NCBI) a je možné ju stiahnuť v binárnej a zdrojovej forme na adrese ftp://ftp.ncbi.nlm.nih.gov/blast/exe ... výbuch+/POSLEDNÝ/.

Táto kapitola len stručne popisuje jednoduché spustenie programu BLAST na príkazovom riadku. Čítanie informácií pomocníka (naprblastn -pomoc) a používateľský manuál aplikácií príkazového riadka NCBI BLAST na adrese www.ncbi.nlm.nih.gov/books/NBK1763/ sa dôrazne odporúča. Príručka NCBI obsahuje niekoľko výkonných a praktických funkcií BLAST na príkazovom riadku, ktoré táto kniha neobsahuje.

BLAST typy

Programy v balíku BLAST+ môžu vyhľadávať a proti sekvenciám v proteínovom formáte (ako sme to urobili v prípade HMMER príkladu) a vo formáte nukleotidov (A, C, T a G). V závislosti od typu súborov dotazov a predmetov sa používajú rôzne programy BLAST.

Aj keď dve nukleotidové sekvencie (porovnania N na obrázku vyššie) je možné priamo porovnávať (rovnako ako dve proteínové sekvencie, reprezentované P), keď chceme porovnať nukleotidovú sekvenciu s proteínovou sekvenciou, musíme zvážiť, ktorý čítací rámec nukleotidová sekvencia zodpovedá proteínu. Theblastxatblastnprogramy to robia tak, že sa nukleotidové sekvencie prevádzajú na proteínové sekvencie vo všetkých šiestich čítacích rámcoch (tri v prednom reťazci DNA a tri v opačnom) a porovnávajú sa so všetkými z nich. Vo všeobecnosti majú tieto programy za následok šesťnásobok práce, ktorú je potrebné vykonať. Thetblastxprogram porovnáva nukleotidové dotazy proti nukleotidovým subjektom, ale robí to v proteínovom priestore so všetkými šiestimi konverziami v porovnaní so všetkými šiestimi na oboch stranách.

Medzi ďalšie exotickejšie nástroje BLAST patrípsiblast, ktorá vytvorí počiatočné vyhľadávanie a upraví pravidlá bodovania na základe výsledkov; tieto vylepšené pravidlá bodovania sa používajú pri druhom vyhľadávaní, vo všeobecnosti sa nájde ešte viac zhôd. Tento proces sa opakuje toľkokrát, koľkokrát si užívateľ želá, pričom v neskorších iteráciách sa odhalia ďalšie odlišné zápasy. Thedeltablastprogram zvažuje predpočítanú databázu pravidiel bodovania pre rôzne typy bežne sa vyskytujúcich (konzervovaných) sekvencií. Nakoniec,rpsblasthľadá sekvenčné zhody proti množinám profilov, z ktorých každý predstavuje zbierku sekvencií (ako v HMMER, aj keď nie je založený na skrytých Markovových modeloch).

Všetky tieto reči o pravidlách hodnotenia naznačujú, že špecifické pravidlá hodnotenia sú dôležité, najmä pri porovnávaní dvoch proteínových sekvencií. Pri porovnávaní proteínových sekvencií z dvoch podobných druhov, napríklad, by sme mohli chcieť dať slabé skóre relatívne nepravdepodobnej zhode nepolárneho valínu (V) s polárnym tyrozínom (Y). Ale pre rozdielne druhy oddelené veľkým vývojovým časom nemusí byť taký nesúlad v porovnaní s inými možnosťami taký zlý. Hodnotiace matice reprezentujúce tieto sady pravidiel s názvami ako BLOSUM a PAM boli vyvinuté pomocou rôznych metód na zachytenie týchto úvah. Diskusiu o týchto detailoch možno nájsť v iných publikáciách.

Každý z rôznych programov v balíku BLAST prijíma veľké množstvo možností; skús behaťblastn -pomocvidieť ich preblastnprogram. Tu je súhrn niekoľkých parametrov, na ktoré sa najčastejšie používablastna kol .:

  • -dotaz
    • Názov (alebo cesta) súboru vo formáte FASTA, ktorý sa má hľadať ako sekvencie dotazov.
  • -predmet
    • Názov (alebo cesta) súboru vo formáte FASTA, v ktorom sa má hľadať ako predmetová sekvencia.
  • -evalue
    • Iba HSP s E mali by sa uvádzať nižšie hodnoty. Napríklad:-hodnota 0,001alebo-hodnota 1e-6.
  • -outfmt
    • Ako formátovať výstup. Predvolené,0, poskytuje ľudsky čitateľný (ale nie programovo analyzovateľný) textový súbor. Hodnoty6a7vytvárať riadky a stĺpce oddelené tabulátormi v textovom súbore s príponou7poskytovanie vysvetľujúcich riadkov komentárov. Podobne hodnota10vytvára výstup oddelený čiarkami;11vytvára formát, ktorý je neskôr možné rýchlo zmeniť na akýkoľvek iný pomocou iného programublast_formatter. možnosti6,7a10môžu byť vysoko konfigurované z hľadiska toho, aké stĺpce sú zobrazené.
  • -max_target_seqs
    • Keď je výstupný formát6,7, alebo10pre každú sekvenciu dotazov vykazujte najlepšie iba HSP<integer>rôzne sekvencie predmetov.
  • -max_hsps
    • Pre každý pár dopyt/cieľ uveďte len to najlepšie<integer>HSP.
  • -out
    • Napíšte výstup do<output file>na rozdiel od predvoleného štandardného výstupu.

BLAST databázy

Čitatelia oboznámení s BLAST boli nepochybne zvedaví: nie sú tam databáz nejakého druhu zapojeného do vyhľadávania BLAST? Nie nevyhnutne. Ako sme videli, jednoduché súbory FASTA postačia na súbor dotazov aj predmetov. Ukazuje sa však, že z výpočtového hľadiska sa jednoduché súbory FASTA len ťažko vyhľadávajú. BLAST+ teda poskytuje nástroj tzvmakeblastdbktorý prevádza predmetný súbor FASTA na indexovanú a rýchlo vyhľadávateľnú (ale nie čitateľnú) verziu rovnakých informácií uloženú v súbore podobne pomenovaných súborov (často najmenej tri s koncovkou.pin,.psqa.phrpre proteínové sekvencie a.nin,.nsqa.nhrpre nukleotidové sekvencie). Táto skupina súborov predstavuje „databázu“ a názov databázy je predponou názvu zdieľaného súboru týchto súborov.

Behmakeblastdbv súbore FASTA je pomerne jednoduchý:makeblastdb -in -out -dbtype -title -parse_seqids</code>, kde<code><type></code>je jeden z<code>prot</code>alebo<code>jadro</code>a<code><title></code>je názov čitateľný pre ľudí (v prípade potreby uzavretý v úvodzovkách). The<code>-parse_seqids</code>príznak naznačuje, že ID sekvencií zo súboru FASTA by mali byť zahrnuté v databáze, aby ich bolo možné použiť vo výstupoch aj v iných nástrojoch, ako napr.<code>blastdbcmd</code>(diskutované nižšie).</p><p>Keď je databáza BLAST vytvorená, je možné s ňou používať ďalšie možnosti<code>blastn</code>a kol .:</p><ul><li><code>-db <názov databázy></code><ul><li>Názov databázy, proti ktorej sa má hľadať (na rozdiel od použitia<code>-predmet</code>).</li></ul></li><li><code>-num_threads <celé číslo></code><ul><li>Použite<code><integer></code>Jadrá CPU vo viacjadrovom systéme, ak sú k dispozícii.</li></ul></li></ul><p>Pri použití<code>-db</code>Nástroje BLAST vyhľadajú databázové súbory na troch miestach: (1) aktuálny pracovný adresár, (2) váš domovský adresár a (3) cesty uvedené v<code>$ BLASTDB</code>premenná prostredia.</p><p>Nástroj<code>blastdbcmd</code>možno použiť na získanie informácií o databázach BLAST - napríklad pomocou<code>blastdbcmd -db <názov databázy> -info</code>—A môže zobrazovať databázy na danej ceste pomocou<code>blastdbcmd -list <cesta></code>(takže,<code>blastdbcmd -list $ BLASTDB</code>zobrazí databázy nájdené v predvolených cestách vyhľadávania). Tento nástroj možno použiť aj na extrahovanie sekvencií alebo informácií o nich z databáz na základe informácií, ako sú ID uvedené vo výstupných súboroch. Ako vždy sa dôrazne odporúča prečítať si pomoc a dokumentáciu pre softvér ako BLAST.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h2>Prevádzka vlastného BLASTU</h2><p>Ak chcete použiť tieto rôzne nástroje a možnosti, zvážme ich použitie<code>blastp</code>hľadať proteíny, ktoré sú sekvenčne podobné iným proteínom v kvasinkovom exome. Najprv musíme použiť<code>wget</code>stiahnuť súbor údajov o proteínoch (po jeho umiestnení na http://yeastgenome.org) a potom<code>gzip -d</code>dekomprimovať ho, zavolať ho <strong><code>orf_trans.fasta</code></strong>.</p><p><img src=""></p><p>Aby sme našli sekvencie, ktoré sú podobné iným, budeme chcieť<code>blastp</code>proti tomuto súboru <em>sám</em>. Začneme teda vytvorením databázy týchto sekvencií.</p><p><img src=""></p><p>Teraz musíme určiť, aké možnosti použijeme na<code>blastp</code>. Chceme najmä obmedziť počet HSP a cieľových sekvencií hlásených pre každý dotaz? Pretože nás väčšinou zaujíma určiť, ktoré proteíny sa zhodujú s ostatnými, pravdepodobne potrebujeme iba jeden zásah. Ale najlepší hit každého proteínu bude pravdepodobne sám o sebe! Radšej by sme teda nechali prvých dvoch<code>-max_target_seqs 2</code>a iba najlepší HSP na zásah<code>-max_hsps 1</code>. Použijeme tiež<code>-hodnota 1e-6</code>, bežne používaná hranica.<sup>[2]</sup></p><p>Pre výstup vytvoríme výstup oddelený tabulátormi s riadkami komentárov (<code>- outfmt 7</code>), vytváranie stĺpcov pre ID sekvencie dotazu, ID sekvencie subjektu, dĺžku zarovnania HSP, percentuálnu identitu zarovnania, dĺžku sekvencie subjektu, dĺžku sekvencie dotazu, začiatočné a koncové polohy v dotaze a subjekte a <em>E </em>hodnotu. (Kódované mená -<code>qseqid</code>,<code>seqid</code>,<code>dĺžka</code>, atď.—dá sa nájsť spustením<code>blastp -pomoc</code>.) Nakoniec zavoláme výstupný súbor <strong><code>kvasinkovy_plaz_kvasok_top2.txt</code></strong> a použiť štyri procesory na zrýchlenie výpočtu (čo skutočne pomôže len vtedy, ak ich má stroj, na ktorom sme prihlásení, aspoň toľko).</p><p><img src=""></p><p>Je to dlhý príkaz, to je isté! Dokončenie tejto operácie trvá niekoľko minút, aj keď<code>-num_threads 4</code>špecifikované. Keď to skončí, môžeme vidieť s<code>menej</code>že výstupný súbor obsahuje stĺpce, ktoré sme uviedli, preložené riadkami komentárov, ktoré poskytuje<code>-výstup 7</code>.</p><p><img src=""></p><p>Vo výstupnom úryvku vyššie má YAL0005C HSP sám o sebe (prirodzene), ale aj jeden s YLL024C. Základné analýzy obsahujúce tento druh údajov – riadky a stĺpce uložené v textových súboroch, poprekladané cudzími riadkami – zvážime v neskorších kapitolách.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h2>Cvičenia</h2><ol><li>Ak ešte nemáte nainštalované nástroje NCBI Blast+, nainštalujte si ich. Hneď ako to urobíte, skontrolujte obsah súboru<code>$ BLASTDB</code>premenná prostredia. Ak nie je prázdny, použite<code>blastdbcmd</code>zistiť, či máte k dispozícii databázu „nr“ a akékoľvek informácie, ktoré o nej môžete určiť (kedy bola stiahnutá, koľko má sekvencií atď.)</li><li>Vytvorte nový priečinok vo svojom priečinku<code>projektov</code>priečinok s názvom<code>výbuch</code>. V tomto adresári si stiahnite súbor <strong><code>p450s.fasta</code></strong> pilník a kvasnicový exome <strong><code>orf_trans.fasta</code></strong> z webovej stránky knihy. Vytvorte databázu tzv<code>orf_trans</code>použitím<code>makeblastdb</code>a používať<code>blastp</code>hľadať<code>p450s.fasta</code>podať proti tomu žalobu. Pri vyhľadávaní použite an <em>E</em>-hranica hodnoty<code>1e-6</code>, ponechajte prvú cieľovú sekvenciu a vytvorte výstupný súbor s názvom<code>p450s_blastp_yeast_top1.blast</code>vo výstupnom formáte<code>11</code>.</li><li>Použi<code>blast_formatter</code>nástroj na konverziu výstupného formátu<code>11</code>súbor vyššie do výstupného formátu<code>6</code>volal<code>p450s_blastp_yeast_top1.txt</code>, so stĺpcami pre: (1) sekvenčné id dopytu, (2) sekv. id. predmetu, (3) dĺžka sekvencie predmetu, (4) percento identických zhody, (5) <em>E</em> Hodnota, (6) Pokrytie dopytu na predmet a (7) Názov predmetu. (Môžete nájsť prezeranie manuálu NCBI BLAST+ a výstup z<code>blast_formatter -pomoc</code>aby boli informatívne.) Výstup pri zobrazení s<code>menej -S</code>, by malo vyzerať asi takto:<img src="">Čo predstavujú tieto rôzne výstupné stĺpce?</li><li>Súbor <strong><code>súbor kvasiniek_selektovaných_ids.txt</code></strong> obsahuje stĺpec 25 ID identifikovaných nejakým spôsobom ako zaujímavé. Použite<code>blastdbcmd</code>extrahovať práve tie sekvenčné záznamy z<code>orf_trans</code>databázu ako súbor FASTA s názvom<code>kvasinkové_vybrané_ids.fasta</code>. (Opäť si prezrite príručku BLAST+ a výstup z<code>blastdbcmd -pomoc</code>bude to užitočné.)</li></ol><hr> <br> <h2>Aktuálne vydanie - 1.79 - 3. júna 2021</h2> <p>Všetky podporované verzie programu Python obsahujú nástroj na správu balíkov Python, ktorý umožňuje jednoduchú inštaláciu z príkazového riadka na všetkých platformách. Skúste:</p> <p>Ak chcete aktualizovať staršiu verziu programu Biopython, vyskúšajte:</p> <p>Týmto sa odstránia staršie verzie Biopython a NumPy pred inštaláciou najnovších verzií.</p> <p>Ak chcete odinštalovať Biopython:</p> <p>Ak pip ešte nie je nainštalovaný, možno budete musieť aktualizovať svoj Python, ale najskôr to vyskúšajte:</p> <p>Ak potrebujete nainštalovať pod konkrétnou verziou Pythonu, vyskúšajte niečo také:</p> <p>Zapnuté <strong>Windows</strong>, v predvolenom nastavení python a pip nie sú na PATH. Môžete znova nainštalovať Python a označiť túto možnosť, alebo namiesto toho zadať úplnú cestu. Skúste niečo také, podľa toho, kde je nainštalovaná vaša kópia Pythonu:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h3>Ostatné balíčky</h3> <p>Aj keď vo všeobecnosti odporúčame používať pip na inštaláciu Biopythonu pomocou balíkov kolies, ktoré poskytujeme na PyPI (ako je uvedené vyššie), existujú aj balíky Biopython pre Conda, Linux atď.</p> <h3>Inštalácia zo zdroja</h3> <p>Inštalácia zo zdroja vyžaduje vhodný kompilátor C, napríklad zapnutý GCC <strong>Linux</strong>a MSVC zapnuté <strong>Windows</strong>. Pre <strong>Mac OS X</strong>alebo ako je teraz značkové, <strong>macOS</strong>, ak chcete skompilovať Biopython zo zdroja, budete musieť mať nainštalované nástroje príkazového riadku od Apple, čo môžete urobiť pomocou príkazu terminálu:</p> <p>To ponúkne inštaláciu vývojového balíka Apple XCode - môžete, ale nie je to potrebné a zaberá veľa miesta na disku.</p> <p>Potom si môžete stiahnuť a rozbaliť vydanie zdrojového kódu Biopython alebo získať náš kód z GitHub. Potom spustite:</p> <p>Ak ste stále uviazli, prihláste sa do zoznamu adries Biopython a požiadajte o pomoc tam.</p> <h3>Požadovaný softvér</h3> <ul> alebo PyPy, vrátane hlavičkových súborov vývoja Pythonu, ako je python.h <li>Kompilátor C (ak kompilujete zo zdroja) Potrebujete kompilátor C podporovaný setuptools, <strong>gcc</strong> bude fungovať dobre na platformách podobných UNIXu. Toto nie je potrebné v systéme Windows, ak používate poskytnuté skompilované balíky. V systéme Mac OS by ste mali nainštalovať nástroje kompilátora od spoločnosti Apple tak, ako je popísané vyššie. .</li></ul> <h3>Voliteľný softvér</h3> <p>Niektoré časti Biopythonu používajú nasledujúce ďalšie pythonové knižnice:</p> <ul> - používa sa pre grafický kód pdf - používa sa pre BioSQL s databázou PostgreSQL - používa sa pre BioSQL s databázou MySQL - Alternatívna knižnica MySQL používaná systémom BioSQL </ul> <p>Okrem toho Biopython obsahuje kód obalu na volanie množstva nástrojov príkazového riadka tretích strán vrátane:</p> <ul> – pre nástroj príkazového riadku dnal <li>Samostatný NCBI BLAST - nástroj príkazového riadka na spustenie programu BLAST na vašom lokálnom počítači - nástroj príkazového riadka na vytváranie zarovnaní sekvencií a FDist - nástroje príkazového riadka pre genetiku populácie - množstvo užitočných nástrojov príkazového riadka.</li></ul> <br> <h2>N-tice (nezmeniteľné zoznamy)</h2> <p>Ako je uvedené vyššie, zoznamy sú premenlivé, čo znamená, že ich je možné po vytvorení zmeniť. V niektorých špeciálnych prípadoch je užitočné vytvoriť nemennú verziu zoznamu, ktorá sa v Pythone nazýva „n-tica“. Rovnako ako zoznamy, aj n -tice je možné vytvárať dvoma spôsobmi: pomocou funkcie tuple () (ktorá vráti prázdnu n -ticu) alebo priamo.</p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_s650cotYUxtEJoNn7nwVU1.png"></p> <p>Tuple fungujú podobne ako zoznamy - môžeme na ne zavolať len () a extrahovať prvky alebo plátky so syntaxou []. Nemôžeme meniť, odstraňovať ani vkladať prvky. [2] </p> <br> <h2>Obsah</h2> <p>Súbor FASTQ zvyčajne používa štyri riadky na sekvenciu.</p> <ul> <li>Riadok 1 začína znakom '@' a za ním nasleduje identifikátor sekvencie a <i>voliteľné</i> popis (ako titulný riadok FASTA).</li> <li>Riadok 2 je surová postupnosť písmen.</li> <li>Riadok 3 začína znakom „+“ a je <i>voliteľne</i> nasledovaný opäť rovnakým identifikátorom sekvencie (a akýmkoľvek popisom).</li> <li>Riadok 4 kóduje hodnoty kvality pre sekvenciu v riadku 2 a musí obsahovať rovnaký počet symbolov ako písmená v sekvencii.</li></ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Súbor FASTQ obsahujúci jednu sekvenciu môže vyzerať takto:</p> <p>Bajt predstavujúci kvalitu sa pohybuje od 0x21 (najnižšia kvalita '!' v ASCII) do 0x7e (najvyššia kvalita '</p> <p>„v ASCII). Tu sú znaky hodnoty kvality v zostupnom poradí kvality zľava doprava (ASCII):</p> <p>Pôvodné súbory Sanger FASTQ tiež umožňovali zabalenie reťazcov sekvencie a kvality (rozdelenie do viacerých riadkov), ale vo všeobecnosti sa to neodporúča [<i> potrebná citácia </i>], pretože to môže skomplikovať analýzu kvôli nešťastnému výberu „@“ a „+“ ako značiek (tieto znaky sa môžu vyskytovať aj v reťazci kvality).</p> <h3>Identifikátory sekvencie Illumina Upraviť</h3> <p>Sekvencie zo softvéru Illumina používajú systematický identifikátor:</p> <p><table><tbody><tr><th>HWUSI-EAS100R</th> <td>jedinečný názov nástroja</td></tr><tr><th>6</th> <td>prietoková dráha</td></tr><tr><th>73</th> <td>číslo dlaždice v dráhe prietokovej bunky</td></tr><tr><th>941</th> <td>'x'-súradnica klastra v rámci dlaždice</td></tr><tr><th>1973</th> <td>súradnice klastra „y“ v rámci dlaždice</td></tr><tr><th>#0</th> <td>indexové číslo pre multiplexnú vzorku (0 pre žiadne indexovanie)</td></tr><tr><th>/1</th> <td>člen páru, /1 alebo /2 <i>(iba párové konce alebo párové páry)</i></td></tr></tbody></table></p> <p>Zdá sa, že sa používajú verzie plynovodu Illumina od 1.4 <b>#NNNNNN</b> namiesto <b>#0</b> pre ID multiplexu, kde <b>NNNNNN</b> je postupnosť multiplexného tagu.</p> <p>S Casava 1.8 sa formát riadku „@“ zmenil:</p> <p><table><tbody><tr><th>EAS139</th> <td>jedinečný názov nástroja</td></tr><tr><th>136</th> <td>ID behu</td></tr><tr><th>FC706VJ</th> <td>ID prietokovej bunky</td></tr><tr><th>2</th> <td>dráha flowcell</td></tr><tr><th>2104</th> <td>číslo dlaždice v dráhe prietokovej bunky</td></tr><tr><th>15343</th> <td>Súradnica 'x' klastra v dlaždici</td></tr><tr><th>197393</th> <td>súradnice klastra „y“ v rámci dlaždice</td></tr><tr><th>1</th> <td>člen páru, 1 alebo 2 <i>(iba párové konce alebo párové páry)</i></td></tr><tr><th>Y</th> <td>Y, ak je čítanie filtrované (neprešlo), N inak</td></tr><tr><th>18</th> <td>0, keď nie je zapnutý žiadny z riadiacich bitov, inak je to párne číslo</td></tr><tr><th>ATCACG</th> <td>indexová sekvencia</td></tr></tbody></table></p> <p>Všimnite si toho, že novšie verzie softvéru Illumina vydávajú namiesto indexovej sekvencie číslo vzorky (prevzaté zo vzorového listu). V prvej vzorke dávky sa môže objaviť napríklad nasledujúca hlavička:</p> <h3>Úpravy archívu čítania NCBI</h3> <p>FASTQ súbory z INSDC Sequence Read Archive často obsahujú popis, napr.</p> <p>V tomto prípade existuje identifikátor priradený NCBI a popis obsahuje pôvodný identifikátor od spoločnosti Solexa/Illumina (ako je popísané vyššie) plus dĺžku čítania. Sekvenovanie sa vykonalo v režime spárovaného konca (</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>veľkosť vloženia 500 bp), pozri SRR001666.Predvolený výstupný formát fastq-dump produkuje celé škvrny, ktoré obsahujú akékoľvek technické čítanie a typicky biologické čítania s jedným alebo párovým koncom.</p> <p>Moderné používanie FASTQ takmer vždy zahŕňa rozdelenie miesta na jeho biologické čítanie, ako je to popísané v metaúdajoch poskytnutých predkladateľom:</p> <p>Fastq-dump, ak je prítomný v archíve, sa môže pokúsiť obnoviť čítané názvy do pôvodného formátu. NCBI predvolene neukladá pôvodné názvy na čítanie:</p> <p>Vo vyššie uvedenom príklade boli použité pôvodné čítané mená a nie prístupné prečítané meno. Pristúpenia NCBI sa spustia a prečítajú sa v nich. Pôvodné názvy čítania priradené sekvenátormi sú schopné fungovať ako lokálne jedinečné identifikátory čítania a prenášať presne toľko informácií ako sériové číslo. ID vyššie boli priradené algoritmicky na základe informácií o chode a geometrických súradníc. Prvé zavádzače SRA analyzovali tieto identifikátory a interne ukladali ich rozložené komponenty. NCBI zastavilo zaznamenávanie prečítaných mien, pretože sú často modifikované z pôvodného formátu dodávateľov, aby sa priradili niektoré ďalšie informácie zmysluplné pre konkrétny kanál spracovania, a to spôsobilo porušenie formátu názvu, ktoré viedlo k vysokému počtu odmietnutých podaní. Bez jasnej schémy pre čítané mená zostáva ich funkcia jedinečného čítacieho ID, ktoré prenáša rovnaké množstvo informácií ako čítané sériové číslo. Podrobnosti a diskusie nájdete v rôznych problémoch súpravy nástrojov SRA.</p> <p>Všimnite si tiež, že fastq-dump konvertuje tieto FASTQ dáta z pôvodného kódovania Solexa/Illumina na štandard Sanger (pozri kódovanie nižšie). Dôvodom je, že SRA slúži ako úložisko informácií NGS, nie ako formát. Rôzne nástroje *-dump sú schopné produkovať údaje v niekoľkých formátoch z rovnakého zdroja. Požiadavky na to boli diktované používateľmi počas niekoľkých rokov, pričom väčšina prvotných požiadaviek pochádzala z projektu 1000 Genomes Project.</p> <h3>Kvalitná úprava</h3> <p>Hodnota kvality <i>Q</i> je celočíselné mapovanie <i>p</i> (t.j. pravdepodobnosť, že zodpovedajúci základný hovor je nesprávny). Používali sa dve rôzne rovnice. Prvým je štandardný variant Sanger na posúdenie spoľahlivosti základného hovoru, inak známy ako skóre kvality Phred:</p> <p>Plynovod Solexa (t.j. softvér dodávaný s analyzátorom genómu Illumina) predtým používal iné mapovanie, kódujúce šance <i>p</i>/(1-<i>p</i>) namiesto pravdepodobnosti <i>p</i>:</p> <p>Aj keď sú obe zobrazenia asymptoticky totožné pri vyšších hodnotách kvality, líšia sa pri nižších úrovniach kvality (t.j. približne <i>p</i> > 0,05 alebo ekvivalentne, <i>Q</i> < 13).</p> <p>Občas sa nezhodli na tom, aké mapovanie Illumina skutočne používa. Používateľská príručka (dodatok B, strana 122) k verzii 1.4 plynovodu Illumina uvádza, že: „Skóre je definované ako Q = 10*log10 (p/(1-p)) [<i>sic</i>], kde p je pravdepodobnosť základného volania zodpovedajúceho príslušnej báze." [2] Pri spätnom pohľade sa zdá, že tento záznam v príručke bol chybou. Používateľská príručka (Čo je nové, strana 5) pre verziu 1.5 potrubia Illumina namiesto toho uvádza tento popis: „Dôležité zmeny v kanáli v1.3 [<i>sic</i>]. Schéma bodovania kvality sa zmenila na bodovaciu schému Phred [t.j. Sanger], kódovaná ako znak ASCII pridaním 64 k hodnote Phred. Phredovo skóre základne je: Q phred = - 10 log 10 ⁡ e < displaystyle Q _ < text<phred>> =-10 log _ < text <10>> e>, kde <i>e</i> je odhadovaná pravdepodobnosť, že základňa je nesprávna. [3] <p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h3>Kódovanie Upraviť</h3> <ul> <li>Formát Sanger môže kódovať skóre kvality Phred od 0 do 93 pomocou ASCII 33 až 126 (aj keď v nespracovaných údajoch o čítaní skóre kvality Phred zriedka prekračuje 60, vyššie skóre je možné v zostavách alebo čítacích mapách). Používa sa aj vo formáte SAM. [4] Podľa oznámenia na fóre seqanswers.com, ku koncu februára 2011, bude najnovšia verzia Illuminy (1.8) ich potrubia CASAVA priamo produkovať fastq vo formáte Sanger. [5]</li> <li>Čítania PacBio HiFi, ktoré sú typicky uložené vo formáte SAM/BAM, používajú Sangerovu konvenciu: Skóre kvality Phred od 0 do 93 sa kóduje pomocou ASCII 33 až 126. Surové podprocesy PacBio používajú rovnakú konvenciu, ale spravidla priraďujú zástupnú základnú kvalitu (Q0 ) na všetky základy v čítaní. [6]</li> <li>Formát Solexa/Illumina 1.0 dokáže zakódovať skóre kvality Solexa/Illumina od -5 do 62 pomocou ASCII 59 až 126 (hoci v nespracovaných čítaných údajoch sa očakáva iba skóre Solexa od -5 do 40)</li> <li>Počínajúc Illumina 1.3 a pred Illumina 1.8 formát kódoval skóre kvality Phred od 0 do 62 pomocou ASCII 64 až 126 (aj keď v nespracovaných údajoch o čítaní sa očakáva iba skóre Phred od 0 do 40).</li> <li>Počnúc verziou Illumina 1.5 a pred verziou Illumina 1.8 majú skóre Phred 0 až 2 trochu iný význam. Hodnoty 0 a 1 sa už nepoužívajú a hodnota 2 kódovaná ASCII 66 „B“ sa používa aj na konci čítania ako <i>Prečítajte si indikátor kontroly kvality segmentu</i>. [7] Príručka Illumina [8] (strana 30) uvádza nasledujúce: <i>Ak čítanie končí segmentom prevažne nízkej kvality (Q15 alebo menej), potom sa všetky hodnoty kvality v segmente nahradia hodnotou 2 (zakódovanou ako písmeno B v textovom kódovaní skóre kvality spoločnosti Illumina). Tento indikátor Q2 nepredpovedá konkrétnu chybovosť, ale skôr naznačuje, že konkrétna záverečná časť odčítania by sa nemala používať v ďalších analýzach.</i> Skóre kvality zakódované ako písmeno „B“ sa tiež môže vyskytovať interne v rámci čítaní prinajmenšom až do verzie kanála 1.6, ako je znázornené v nasledujúcom príklade:</li></ul> <p>Bola navrhnutá alternatívna interpretácia tohto kódovania ASCII. [9] Tiež v Illumina behoch s použitím ovládačov PhiX bolo pozorované, že znak „B“ predstavuje „neznáme skóre kvality“. Chybovosť čítaní „B“ bola zhruba o 3 phred skóre nižšia ako priemerné pozorované skóre daného cyklu.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> <li>Počnúc Illumina 1.8 sa skóre kvality v podstate vrátilo k používaniu formátu Sanger (Phred+33).</li></ul> <p>Pri hrubých čítaniach bude rozsah skóre závisieť od technológie a použitého základného volajúceho, ale zvyčajne bude až 41 pre nedávnu chémiu Illumina. Keďže maximálne pozorované skóre kvality bolo predtým iba 40, rôzne skripty a nástroje sa pokazia, keď narazia na údaje s hodnotami kvality väčšími ako 40. V prípade spracovaných čítaní môžu byť skóre ešte vyššie. Napríklad hodnoty kvality 45 sa pozorujú pri čítaní zo služby Long Read Sequencing Service (predtým Moleculo) spoločnosti Illumina.</p> <h3>Úprava farebného priestoru</h3> <p>V prípade údajov SOLiD je sekvencia vo farebnom priestore, okrem prvej polohy. Hodnoty kvality sú vo formáte Sanger. Nástroje na zarovnanie sa líšia preferovanou verziou hodnôt kvality: niektoré obsahujú skóre kvality (nastavené na 0, t.j. '!') pre vedúci nukleotid, iné nie. Archív prečítania sekvencie obsahuje toto skóre kvality.</p> <h3>Úprava simulácie</h3> <p>K simulácii čítania FASTQ pristúpilo niekoľko nástrojov. [10] [11] Porovnanie týchto nástrojov si môžete pozrieť tu. [12] </p> <h3>Úprava kompresie</h3> <h4>Všeobecné kompresory Edit</h4> <p>Univerzálne nástroje, ako napríklad Gzip a bzip2, považujú FASTQ za obyčajný textový súbor a majú za následok neoptimálne kompresné pomery. Archív čítania sekvencií NCBI kóduje metadáta pomocou schémy LZ-77. Všeobecné kompresory FASTQ typicky komprimujú odlišné polia (názvy, sekvencie, komentáre a skóre kvality) v súbore FASTQ oddelene, medzi ktoré patrí Genozip, [13] DSRC a DSRC2, FQC, LFQC, Fqzcomp a Slimfastq.</p> <h4>Číta Upraviť</h4> <p>Mať okolo seba referenčný genóm je výhodné, pretože namiesto ukladania samotných nukleotidových sekvencií je možné údaje iba zarovnať s referenčným genómom a uložiť polohy (ukazovatele) a nezhody, ktoré je možné ukazovatele usporiadať, podľa poradia v referenčnej sekvencii. a kódované, napr. kódovaním za behu. Keď je pokrytie alebo opakovaný obsah sekvenovaného genómu vysoký, vedie to k vysokému kompresnému pomeru. Na rozdiel od formátov SAM/BAM súbory FASTQ nešpecifikujú referenčný genóm. <b>Zarovnávacie kompresory FASTQ</b> podporuje používanie buď používateľom poskytovaných alebo <i>de novo</i> zostavená referencia: LW-FQZip používa poskytnutý referenčný genóm a Quip, Leon, k-Path a KIC vykonávajú <i><b>de novo</b></i> montáž pomocou grafického prístupu de Bruijn. Genozip [13] môže voliteľne použiť referenciu, ak ju používateľ poskytne, ktorou môže byť referenčný súbor s jedným alebo viacerými druhmi.</p> <p>Explicitné mapovanie čítania a <i>de novo</i> montáž je spravidla pomalá. <b>Kompresory FASTQ založené na zmene poradia</b> prvé čítania klastra, ktoré zdieľajú dlhé podreťazce, a potom nezávisle komprimujú čítania v každom klastri po ich preusporiadaní alebo ich zostavení do dlhších kontigov, čím sa dosiahne možno najlepší kompromis medzi časom chodu a rýchlosťou kompresie. SCALCE je prvý takýto nástroj, po ňom nasleduje Orcom a Mince. BEETL používa zovšeobecnenú Burrows-Wheelerovu transformáciu na zmenu poradia čítaní a HARC dosahuje lepší výkon pri zmene poradia na základe hash. AssemblTrie namiesto toho zostavuje čítanie do referenčných stromov s čo najmenším počtom symbolov v referencii, ako je to možné. [14] [15] </p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Benchmarky pre tieto nástroje sú dostupné v [16] </p> <h4>Hodnoty kvality Edit</h4> <p>Hodnoty kvality predstavujú asi polovicu požadovaného miesta na disku vo formáte FASTQ (pred kompresiou), a preto kompresia hodnôt kvality môže výrazne znížiť požiadavky na úložisko a urýchliť analýzu a prenos sekvenčných údajov. V literatúre sa v poslednej dobe uvažuje o bezstratovej aj stratovej kompresii. Napríklad algoritmus QualComp [17] vykonáva stratovú kompresiu s rýchlosťou (počet bitov na hodnotu kvality) špecifikovanou používateľom. Na základe výsledkov teórie frekvenčného skreslenia alokuje počet bitov tak, aby sa minimalizovala MSE (priemerná štvorcová chyba) medzi pôvodnými (nekomprimovanými) a zrekonštruovanými (po kompresii) hodnotami kvality. Ďalšie algoritmy na kompresiu hodnôt kvality zahŕňajú SCALCE [18] a Fastqz. [19] Oba sú bezstratové kompresné algoritmy, ktoré poskytujú voliteľný prístup s riadenou stratovou transformáciou. SCALCE napríklad znižuje veľkosť abecedy na základe pozorovania, že „susedné“ hodnoty kvality sú vo všeobecnosti podobné. Referenčné číslo nájdete v časti. [20] </p> <p>HiSeq 2500 Illumina poskytuje možnosť výstupných vlastností, ktoré boli hrubozrnné do kvalitných zásobníkov. Kombinované skóre sa vypočítava priamo z empirickej tabuľky skóre kvality, ktorá je sama viazaná na hardvér, softvér a chémiu, ktoré boli použité počas sekvenčného experimentu. [21] </p> <p>Genozip [13] používa svoj algoritmus DomQual na kompresiu binárnych skóre kvality, ako sú tie, ktoré generuje Illumina alebo Genozipovo vlastné <i>--optimalizovať</i> možnosť, ktorá generuje zásobníky podobné Illumina.</p> <h3>Úprava šifrovania</h3> <p>Genozip [13] šifruje súbory FASTQ (ako aj iné genomické formáty) použitím štandardného šifrovania AES na najbezpečnejšej úrovni 256 bitov (<i>-heslo</i> možnosť).</p> <p>Cryfa [22] využíva šifrovanie AES a umožňuje okrem šifrovania aj komprimovať dáta. Môže tiež riešiť súbory FASTA.</p> <p>Pre súbor FASTQ neexistuje štandardná prípona súboru, ale bežne sa používajú .fq a .fastq.</p> <br> <h2>1.7: Príkazový riadok BLAST - Biológia</h2> <p>DGINN: Detekcia plynovodu Genetic INNovations</p> <p>DGINN je kanál určený na detekciu genetických inovácií, počnúc nukleotidovou sekvenciou.</p> <p>Automatizuje všetky potrebné predbežné kroky pre evolučné analýzy, vrátane získavania homológov, priradenia k ortologickým skupinám, zarovnania kodónov a rekonštrukcie fylogenézy génov.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Automatizuje všetky potrebné predbežné kroky pre evolučné analýzy, vrátane získavania homológov, priradenia k ortologickým skupinám, zarovnania kodónov a rekonštrukcie fylogenézy génov. Po získaní zarovnaní a zodpovedajúcich fylogenézach sa zisťujú tri hlavné genetické inovácie: duplikačné udalosti, rekombinačné udalosti a podpisy pozitívnej selekcie.</p> <p>DGINN bol validovaný na devätnástich génoch primátov so známou evolučnou históriou a výsledky je možné konzultovať s BioRxiv (doi: https://doi.org/10.1101/2020.02.25.964155). Výsledky z validácie sú dostupné v príslušnom úložisku. Verzia DGINN použitá v tomto dokumente odkazuje na commit 5db0253 a možno ju načítať cez:</p> <p>Dokovacia stanica je k dispozícii pre papierovú aj pre aktuálnu verziu DGINN.</p> <p>Akékoľvek otázky alebo návrhy týkajúce sa programu môžete adresovať na adresu lea.picard [at] ens-lyon.fr, laurent.gueguen [at] univ-lyon1.fr alebo lucie.etienne [at] ens-lyon.fr.</p> <p>1/ Potrebné závislosti a softvéry</p> <ul> <li>Softvér a verzie: EMBOSS:6.6, PhyML 3.0, PRANK v.170427, Treerecs v1.0, HYPHY 2.3, Bio++ v.2</li> <li>Python (>3.5) a balíčky: Biopython, ete3, kolekcie, protokolovanie, shlex, os, numpy, scipy, requesty, pandy, štatistiky, čas, re, argparse</li></ul> <p>K dispozícii je obraz dockeru, ktorý poskytuje spôsob použitia DGINN bez potreby inštalácie akéhokoľvek softvéru okrem Dockeru.</p> <p>Ak chcete stiahnuť konkrétnu verziu dokovacej stanice:</p> <p>Príkaz by sa mal spustiť tak, ako je, a mal by fungovať na systémoch Mac aj Linux za predpokladu, že používateľ patrí do skupiny „docker“ (pomoc o nastavení používateľa ako súčasti tejto skupiny v systéme Linux nájdete v dokumentácii Docker.)</p> <p>Všetky ostatné argumenty sa odovzdávajú presne tak, ako keby boli DGINN spustené cez príkazový riadok priamo zo skriptu (napríklad -p parameters.txt / pozri ďalšiu časť). Jeden hlavný rozdiel však spočíva v tom, že všetky súbory by mali byť v súbore parametrov označené ich menom a mali by byť umiestnené v pracovnom adresári, pričom na ne môže byť odkazované podľa ich cesty a pri spustení verzie skriptu sa môžu nachádzať v inom adresári.</p> <p>DGINN používa súbor parametrov na odovzdanie všetkých potrebných argumentov na spustenie potrubia. V adresári examples sú k dispozícii dva ukážkové súbory:</p> <ol> <li>vykonaním krokov 1-7 (pozri Prehľad) od CDS génu záujmu po detekciu rekombinácie (parameters.txt)</li> <li>jeden z vykonaní kroku 8 na detekciu pozitívnej selekcie (parameters_possel.txt)</li></ol> <p>Toto je odporúčané použitie pre DGINN, aby bolo možné analýzy pre pozitívny výber paralelizovať cez všetky zarovnania namiesto ich postupného vykonávania.</p> <p>Prosím, uvedomte si, že fasta sekvenčný názov <strong>a</strong> queryName musí mať formát speSpe_GENE_Id (napríklad: homSap_MX1_CCDS13673, macMul_APOBEC3G_NM_001198693).</p> <table> <thead> <tr><th>Krok</th> <th>Potrebné súbory</th> <th>Formát</th></tr> <tbody> <tr><td>výbuch</td> <td>CDS požadovaného génu</td> <td>Fasta</td></tr> <tr><td>pristúpenia</td> <td>Zoznam výsledkov odstrelu</td> <td>Tabuľkový formát NCBI (tsv)</td></tr> <tr><td>fasta</td> <td>Zoznam identifikátorov prístupu (jeden/riadok)</td> <td>TXT</td></tr> <tr><td>orf</td> <td>mRNA sekvencie ortológov</td> <td>Fasta</td></tr> <tr><td>zarovnanie</td> <td>Sekvencie CDS ortologov</td> <td>Fasta</td></tr> <tr><td>strom</td> <td>(kodón) zarovnanie ortológov</td> <td>Fasta</td></tr> <tr><td>duplicita</td> <td>(kodónové) zarovnanie, génový strom</td> <td>Fasta, nováčik</td></tr> <tr><td>rekombinácia</td> <td>(kodón) zarovnanie</td> <td>Fasta</td></tr> <tr><td>positiveSelection</td> <td>zarovnanie kodónov, génový strom</td> <td>Fasta, génový strom</td></tr></tbody> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> </thead></table> <p>Je potrebné rešpektovať poradie súborov a postupovať podľa poradia uvedeného v tejto tabuľke.</p> <p>Hoci zoradenia kodónov nie sú technicky nevyhnutné pre kroky phyml, duplikácie a rekombinácie, sú pre pozitívnu selekciu. Začať v krokoch pred pozitívnou selekciou s nekodónovými zarovnaniami teda pravdepodobne povedie k zlyhaniu v kroku pozitívnej selekcie.</p> <p>DGINN obsahuje rôzne softvéry na kontrolu pozitívneho výberu:</p> <ul> <li>BUSTED (Murrel et al., Molecular Biology and Evolution, 2015) od Hyphy</li> <li>MEME (Murrel a kol., PLoS Genetics, 2012) od Hyphy</li> <li>PAML codeml (Yang, Molecular Biology and Evolution, 2007) pre miestne modely M0, M1, M2, M7 a M8</li> <li>BIO++ (Guéguen a kol., Molecular Biology and Evolution, 2013) pre modely miest M0, M1, M2, M7 a M8</li> <li>BIO ++ pre model s jednou vetvou (OPB) (podobný modelu PAML codeml FreeRatio) na testovanie pozitívnej selekcie na vetvách</li></ul> <p>Prvé tri metódy sú automaticky parametrizované v DGINN.</p> <p>V prípade BIO ++ môže súbory parametrov automaticky generovať DGINN, ale používateľ môže tiež poskytnúť svoje vlastné súbory parametrov, ak chce parametre ďalej vyladiť. Možnosť OPB je možné použiť aj na rôzne analýzy pomocou systému Bio ++, pretože jeho výsledky neovplyvňujú žiadny nasledujúci krok. Vzorové súbory parametrov pre bppml a bppmixedlikelihoods (pre modely lokality) sú uvedené v príkladoch/, ako aj súbor parametrov na spustenie modelu jednej na pobočku.</p> <p>Používateľom, ktorí si želajú vykonať čo najrýchlejšiu kontrolu svojich záujmových génov, odporúčame spúšťať iba modely miest BIO++, pretože naše výsledky validácie poukazujú na to, že poskytujú najlepší kompromis solídnych výsledkov a kratších prevádzkových časov.</p> <p>V priečinku examples sú k dispozícii dva súbory parametrov.</p> <p>Poznámka: tieto súbory by mali byť aktualizované pomocou absolútnych ciest k súborom, na ktoré sa odkazuje, namiesto iba ich názvu, keď používate DGINN prostredníctvom príkazového riadku a nie prostredníctvom ukotviteľného panela.</p> <p>python3 DGINN.py -p parameters.txt</p> <p>Spustí kroky DGINN 1-7 na serveri ex_CCDS.fasta:</p> <ul> <li>získavanie homológov druhov primátov v NCBI <em>č</em> databázy</li> <li>detekcia duplikácií a priradenie ortologických skupín najmenej 8 druhov na základe ex_spTree.tree</li> <li>detekcia rekombinácií</li></ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>python3 DGINN.py -p parameters_possel.txt</p> <p>Spustí DGINN krok 8 na ex_aln.fasta a ex_genetree.tree od:</p> <ul> <li>hľadanie pozitívnej selekcie na géne pomocou BUSTED</li> <li>hľadá stránky s epizodickým pozitívnym výberom pomocou MEME</li> <li>hľadanie lokalít pod pozitívnou selekciou pomocou modelov M0-NS, M1-NS, M2-NS, M7-NS a M8-NS od BIO++</li> <li>hľadanie lokalít pod pozitívnou selekciou pomocou modelov M0, M1, M2, M7 a M8 z PAML codeml</li> <li>hľadáme pobočky v rámci pozitívneho výberu pomocou BIO++</li></ul> <p>DGINN bol validovaný na devätnástich génoch primátov so známou evolučnou históriou a výsledky je možné konzultovať s BioRxiv (doi: https://doi.org/10.1101/2020.02.25.964155). Výsledky z validácie sú dostupné v príslušnom úložisku.</p> <p>V priečinku etc je zahrnutý skript s názvom CCDSquery.py. Tento skript umožňuje používateľovi stiahnuť CCDS sekvencie ľudských génov poskytnutím správne naformátovaného súboru získaného prostredníctvom HGNC. Tento súbor by mal obsahovať aspoň stĺpec s názvom „Schválený symbol“ a ďalší s názvom „Prístup k CCDS“.</p> <p>Ďalší skript s názvom parseResults.py možno nájsť aj v priečinku atď.</p> <p>Vstupný súbor sa skladá z dvoch stĺpcov oddelených tabulátormi: prvý označuje úplnú cestu k adresárom obsahujúcim pozitívne výsledky výberu (adresár obsahujúci zrútené podadresáre, bpp_site, paml_site atď.), Druhý úplnú cestu k zarovnania, na ktorých boli tieto analýzy uskutočnené.</p> <p>Príklad: /PATH/TO/GENENAME_sequences_filtered_longestORFs_mafft_mincov_prank_results_TIMESTAMP1/positive_selection_results_TIMESTAMP2 /PATH/TO/GENENAME_sequences_filtered_longestORFs_mafft_mincov_prank.best.fa</p> <p>Skript vypíše 3 rôzne súbory:</p> <ol> <li>súhrn výsledkov (jeden gén na riadok)</li> <li>percentá pokrytia v každej polohe každého zarovnania (Poznámka: odporúča sa tento súbor nijako neupravovať, aby sa zaistila správna vizualizácia výsledkov)</li> <li>pravdepodobnosti vypočítané pomocou Bio ++ (Bpp) a PAML codeml pre každý gén.</li></ol> <p>Rôzne výstupné súbory získané pomocou tohto skriptu je možné použiť na generovanie čísel podobných údajom uvedeným v dokumente DGINN prostredníctvom aplikácie Shiny, ktorej dokumentáciu nájdete v zodpovedajúcom úložisku.</p> <br> <h2>1.7: Príkazový riadok BLAST - Biológia</h2> <p>Kontakty na úložisko Github BRAKER na https://github.com/Gaius-Augustus/BRAKER:</p> <p>Katharina J. Hoff, Univerzita v Greifswalde, Nemecko, katharina.hoff@uni-greifswald.de, +49 3834 420 4624</p> <p>Katharina J. Hoff a, b , Simone Lange a , Alexandre Lomsadze c , Tomáš Bruna c , Mark Borodovský c, d, e , Mario Stanke a, b </p> <p><b>[a]</b> Univerzita v Greifswalde, Inštitút matematiky a informatiky, Walther-Rathenau-Str. 47, 17489 Greifswald, Nemecko</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p><b>[b]</b> Univerzita v Greifswalde, Centrum funkčnej genomiky mikróbov, Felix-Hausdorff-Str. 8, 17489 Greifswald, Nemecko</p> <p><b>[c]</b> Spoločné oddelenie Georgia Tech a Emory University Wallace H Coulter Department of Biomedical Engineering, 30332 Atlanta, USA</p> <p><b>[d]</b> School of Computational Science and Engineering, 30332 Atlanta, USA</p> <p><b>[e]</b> Moskovský inštitút fyziky a technológie, Moskovská oblasť 141701, Dolgoprudny, Rusko</p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_p9B4QkVtrL6RD.png"><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_onvb0cQGt9Hw8ZpI3oh3.png"><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_LmihFkBpvqn247nDc.png"></p> <p>Obrázok 1: Súčasní autori BRAKER, zľava doprava: Mario Stanke, Alexandre Lomsadze, Katharina J. Hoff, Tomas Bruna a Mark Borodovsky.</p> <p>Vývoj BRAKER podporil Národný inštitút zdravia (NIH) [GM128145 až M.B. a M.S.]</p> <p>Výber prepisu pre BRAKER (TSEBRA) je k dispozícii na https://github.com/Gaius-Augustus/TSEBRA.</p> <p>Rýchlo rastúci počet sekvenovaných genómov vyžaduje plne automatizované metódy na presnú anotáciu génovej štruktúry. S týmto cieľom sme vyvinuli BRAKER1 R1 R0, kombináciu GeneMark-ET R2 a AUGUSTUS R3, R4, ktorá používa genomické a RNA-Seq údaje na automatické generovanie úplných anotácií génovej štruktúry v novom genóme.</p> <p>Kvalita údajov RNA-Seq, ktoré sú k dispozícii na anotáciu nového genómu, je však variabilná a v niektorých prípadoch údaje o RNA-Seq nie sú k dispozícii vôbec.</p> <p>BRAKER2 je rozšírenie BRAKER1, ktoré umožňuje <strong>plne automatizované školenie</strong> nástrojov génovej predikcie GeneMark-EX R14, R15, R17, F1 a AUGUSTUS z informácií o RNA-Seq a/alebo proteínovej homológii, a ktoré integrujú vonkajšie dôkazy z informácií o RNA-Seq a proteínovej homológii do <strong>predpoveď</strong>.</p> <p>Na rozdiel od iných dostupných metód, ktoré sa spoliehajú na informácie o homológii proteínov, BRAKER2 dosahuje vysokú presnosť predikcie génov aj bez anotácie veľmi príbuzných druhov a bez údajov RNA-Seq.</p> <p>V tejto používateľskej príručke budeme označovať BRAKER1 a BRAKER2 jednoducho ako <strong>BRAKER</strong> pretože sú vykonávané rovnakým skriptom ( braker.pl ).</p> <p>Kľúče k úspešnej predikcii génov</p> <p>Použite vysoko kvalitnú zostavu genómu. Ak máte v zostave genómu veľký počet veľmi krátkych skafoldov, tieto krátke lešenia pravdepodobne dramaticky predĺžia dobu prevádzky, ale nezvyšia presnosť predikcie.</p> <p>V genómovom súbore používajte jednoduché názvy skeletu (napr. & Gtcontig1 bude fungovať lepšie ako & gtcontig1my domnelá funkcia pomenovania niektorých druhov/viac/informácií/a veľa špeciálnych znakov %& amp!*() <>). Pred spustením akéhokoľvek programu na zarovnanie urobte názvy lešenia vo všetkých svojich súboroch fasta jednoduchými.</p> <p>Aby bolo možné presne predpovedať gény v novom genóme, genóm by mal byť maskovaný na opakovanie. Tým sa zabráni predpovedi falošne pozitívnych génových štruktúr v opakujúcich sa oblastiach a oblastiach s nízkou zložitosťou. Opakované maskovanie je tiež nevyhnutné pre mapovanie údajov RNA-Seq do genómu pomocou niektorých nástrojov (iné mapovače RNA-Seq, ako napríklad HISAT2, ignorujú informácie o maskovaní). V prípade GeneMark-EX a AUGUSTUS vedie mäkká maska ​​(t. J. Vkladanie opakujúcich sa oblastí do malých písmen a všetky ostatné oblasti do veľkých písmen) k lepším výsledkom ako tvrdé maskovanie (t. J. Nahradenie písmen v opakujúcich sa oblastiach písmenom N za neznámy nukleotid). Ak je genóm maskovaný, použite príznak --softmasking na braker.pl.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Mnoho genómov má génové štruktúry, ktoré budú presne predpovedané so štandardnými parametrami GeneMark-EX a AUGUSTUS v programe BRAKER. Niektoré genómy však majú črty špecifické pre klad, t. j. špeciálny model bodu vetvenia v hubách alebo neštandardné vzory miest zostrihu. Prečítajte si prosím časť [možnosti], aby ste určili, či niektoré z vlastných možností môžu zlepšiť presnosť génovej predikcie v genóme vášho cieľového druhu.</p> <p>Pred ďalším použitím vždy skontrolujte výsledky génovej predikcie! Môžete napr. použite prehliadač genómu na vizuálnu kontrolu génových modelov v kontexte s vonkajšími dôkazovými údajmi. BRAKER na tento účel podporuje generovanie rozbočovačov traťových údajov pre prehliadač genómu UCSC s MakeHub.</p> <p>Prehľad režimov pre spustenie programu BRAKER</p> <p>BRAKER obsahuje hlavne čiastočne nekontrolované údaje o vonkajších dôkazoch (RNA-Seq a/alebo informácie o zostrihu proteínov) podporované trénovaním GeneMark-EX [F1] a následným trénovaním AUGUSTUS s integráciou vonkajších dôkazov do konečného kroku predikcie génu. V súčasnosti je však v BRAKER zahrnutých niekoľko ďalších potrubí. V nasledujúcom texte uvádzame prehľad možných vstupných súborov a kanálov:</p> <ul> <li>Iba súbor genómu. V tomto režime je GeneMark-ES trénovaný na sekvenciu genómu samotnú. Dlhé gény predpovedané GeneMark-ES sú vybrané na tréning AUGUSTUS. Konečné predpovede AUGUSTUS sú <em>ab initio</em>. Tento prístup pravdepodobne poskytne nižšiu presnosť predikcie ako všetky ostatné tu popísané potrubia. (pozri obrázok 2),</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_ncpbHGirXW0FfKgDoAOGyu.png"></p> <p>Obrázok 2: BRAKER pipeline A: trénovanie GeneMark-ES iba na údajoch o genóme <em>ab initio</em> génová predikcia sAUGUSTUSOM</p> <ul> <li>Súbor genómu a RNA-Seq z rovnakého druhu (pozri obrázok 3), tento prístup je vhodný pre knižnice s krátkym čítaním RNA-Seq s dobrým pokrytím transkriptómu, <strong>dôležité:</strong> tento prístup vyžaduje, aby bol každý intrón pokrytý mnohými zarovnaniami, to znamená, že nefunguje so zostavenými transkriptómovými mapovaniami. V zásade môžu tiež zarovnania dlhých čítaných údajov RNA-Seq viesť k dostatočným údajom na spustenie BRAKER, ale iba ak každý prepis, ktorý pôjde do tréningu, bol sekvenovaný a zarovnaný s genómom viackrát. Uvedomte si, že v súčasnej dobe spoločnosť BRAKER zatiaľ oficiálne nepodporuje integráciu dlho čítaných údajov RNA-Seq.</li></ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_PB7MFzezyU28mtkgqI7y.png"></p> <p>Obrázok 3: Potrubie BRAKER B: školenie GeneMark-ET podporované informáciami o zarovnaní spojenia RNA-Seq, predikcia s AUGUSTUS s rovnakými informáciami o zarovnaní spojenia.</p> <ul> <li>Genómový súbor a databáza bielkovín, ktoré môžu byť z <strong>neznámy</strong> evolučná vzdialenosť k cieľovým druhom (pozri obrázok 4), tento prístup je obzvlášť vhodný, ak nie sú k dispozícii žiadne údaje o RNA-Seq. Táto metóda bude lepšie fungovať s proteínmi z druhov, ktoré sú dosť blízko cieľovým druhom, ale presnosť klesne len veľmi málo, ak sú referenčné proteíny vzdialenejšie od cieľových druhov. <strong>Dôležité:</strong> Tento prístup vyžaduje databázu proteínových rodín, to znamená, že v databáze musí byť prítomných mnoho zástupcov každej proteínovej rodiny. BRAKER bol úspešne testovaný s OrthoDB R19. Mapovací kanál proteínu ProtHint R18 na generovanie požadovaných rád pre BRAKER je k dispozícii na stiahnutie na https://github.com/gatech-genemark/ProtHint, pokyny na prípravu vstupných proteínov OrthoDB sú dokumentované na https: // github. com/gatech-genemark/ProtHint#príprava proteínovej databázy. Do súboru OrthoDB fasta môžete pridať proteíny príbuzných druhov, aby ste do génovej predikcie začlenili ďalšie dôkazy.</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_QGg2EgrqUsmdavPzVd6Fds9W.png"></p> <p>Obrázok 4: BRAKER pipeline C: tréning GeneMark-EP+ o zostrihu proteínov, informácie o štarte a zastavení, predikcia s AUGUSTUS s rovnakými informáciami, navyše zreťazené rady CDSpart. Tu používané proteíny môžu mať akúkoľvek evolučnú vzdialenosť od cieľového organizmu.</p> <ul> <li>Súbor genómu a RNA-Seq z rovnakého druhu a proteíny, ktoré môžu byť <strong>neznámy</strong> evolučná vzdialenosť k cieľovému druhu (pozri obrázok 5) <strong>dôležité:</strong> tento prístup vyžaduje databázu proteínových rodín, to znamená, že v databáze musí byť prítomných mnoho zástupcov každej proteínovej rodiny, napr. Vhodný je OrthoDB. (Do súboru OrthoDB fasta môžete pridať proteíny blízko príbuzných druhov, aby ste do predikcie génov začlenili ďalšie dôkazy.)</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_83zotw6zjCwlxutv7D1w6sl.png"></p> <p>Obrázok 5: BRAKER pipeline D: tréning GeneMark-ETP+ podporovaný informáciami o zarovnaní RNA-Seq a informáciami z proteínov (proteíny môžu mať akúkoľvek evolučnú vzdialenosť). Uvedomte si, že GeneMark-ETP+ je stále vo vývoji, BRAKER môže v súčasnej dobe spustiť predchodcu staršej verzie. S intrónmi podporovanými informáciami o zarovnaní RNA-Seq a proteínu sa zaobchádza ako so „skutočne pozitívnymi intrónmi“, pričom sa vynucuje ich predikcia v génových štruktúrach pomocou systémov GeneMark-ETP+ a AUGUSTUS. <strong>Dôležité:</strong> Nie vždy je najlepšie použiť všetky dôkazy! Doteraz sme zistili, že tento prístup funguje dobre pre veľké genómy, ale presnosť v malých a stredne veľkých genómoch je nestabilná. Pred spustením tohto potrubia si pozrite plagát z PAG 2020.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> <li>Genómový súbor a súbor s proteínmi s krátkou evolučnou vzdialenosťou (pozri obrázok 6) je tento prístup vhodný, ak nie sú k dispozícii údaje o RNA-Seq a ak sú referenčné druhy veľmi blízko. <em><em>Poznámka</em>:</em> Toto potrubie je zastarané, pretože potrubie C môže okrem OrthoDB používať aj proteíny blízko príbuzných druhov.</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_c8ocb9q8nXQGO0.png"></p> <p>Obrázok 6: Ďalší kanál B: školenie AUGUSTUS na základe spojených informácií o zarovnaní z proteínov veľmi blízkeho druhu proti cieľovému genómu.</p> <ul> <li>Súbor genómu a RNA-Seq a proteíny s krátkou evolučnou vzdialenosťou (pozri obrázky 6 a 7). V oboch prípadoch je GeneMark-ET trénovaný podporovaný údajmi RNA-Seq a výsledné predpovede génov sa používajú na tréning AUGUSTUS. V prístupe A) sa informácie o zarovnaní proteínu použijú iba v kroku génovej predikcie s AUGUSTUS. V prístupe C) sa údaje o zostrihu proteínov používajú na doplnenie tréningovej sady pre AUGUSTUS. Tento druhý prístup je obzvlášť vhodný vtedy, ak údaje o RNA-Seq nevyprodukujú dostatočne vysoký počet tréningových génových štruktúr pre AUGUSTUS a ak sú k dispozícii veľmi úzko súvisiace a už anotované druhy. <em><em>Poznámka</em>:</em> Toto potrubie je zastarané, pretože potrubie D môže okrem OrthoDB používať aj proteíny blízko príbuzných druhov.</li></ul> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_9zialfldascz4UYds7.png"></p> <p>Obrázok 7: Ďalší kanál A: školenie GeneMark-ET podporované informáciami o zarovnaní zostrihnutých RNA-Seq, predikcia s AUGUSTUS s informáciami o zarovnanom zostrihu z údajov RNA-Seq a s génovými vlastnosťami určenými zarovnaním z proteínov veľmi blízkych príbuzných druhov proti cieľu genóm. <em><em>Poznámka</em>:</em> Toto potrubie je zastarané, pretože potrubie C môže okrem OrthoDB používať aj proteíny blízko príbuzných druhov.</p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_mw43DyzpDX46l3g9wo19N.png"></p> <p>Obrázok 8: Ďalší kanál C: školenie GeneMark-ET na základe informácií o zarovnaní zostrihu RNA-Seq, školenie AUGUSTUS na súbore tréningových génových štruktúr zostavených z génových štruktúr podporovaných RNA-Seq predpovedaných GeneMark-ET a zostrihané zarovnanie proteínov veľmi príbuzný druh. <em><em>Poznámka</em>:</em> Toto potrubie je zastarané, pretože potrubie D môže okrem OrthoDB používať aj proteíny blízko príbuzných druhov.</p> <p>Podporované verzie softvéru</p> <p>V čase vydania bola táto verzia BRAKER testovaná s:</p> <p>Perl pipeline závislosti</p> <p>Spustenie BRAKER vyžaduje systém Linux s bash a Perl. Okrem toho BRAKER vyžaduje, aby boli nainštalované nasledujúce moduly CPAN-Perl:</p> <p>Pre ProtHint, ktorý sa používa, keď je dodávaný proteínový vstup, tiež nainštalujte:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Na Ubuntu napríklad nainštalujte moduly pomocou CPANminus F4: sudo cpanm Module :: Name, napr. sudo cpanm Hash :: Zlúčiť.</p> <p>BRAKER tiež používa Perl modul helpMod.pm, ktorý nie je dostupný na CPAN. Tento modul je súčasťou vydania BRAKER a nevyžaduje samostatnú inštaláciu.</p> <p>Ak nemáte oprávnenia root na počítači so systémom Linux, skúste nastaviť súbor <strong>Anakonda</strong> (https://www.anaconda.com/distribution/) prostredie nasledovne:</p> <p>Následne nainštalujte BRAKER a ďalší softvér „ako obvykle“ vo svojom prostredí conda. <strong>Poznámka:</strong> K dispozícii je balík brzdy bioconda a balík bioconda augustus. Oni pracujú. Obvykle však zaostávajú za vývojovým kódom oboch nástrojov na github. Odporúčame preto manuálnu inštaláciu a používanie najnovších zdrojov.</p> <p>BRAKER je zbierka skriptov Perl a Python a modul Perl. Hlavný skript, ktorý sa bude volať na spustenie programu BRAKER, je braker.pl. Ďalšie komponenty Perl a Python sú:</p> <p>Všetky skripty (súbory končiace na *.pl a *.py ), ktoré sú súčasťou BRAKER, musia byť spustiteľné, aby bolo možné spustiť BRAKER. Malo by to tak už byť, ak si stiahnete BRAKER z ​​GitHubu. Spustiteľnosť môže byť prepísaná, ak napr. preneste BRAKER na USB kľúči do iného počítača. Ak chcete skontrolovať, či sú požadované súbory spustiteľné, spustite nasledujúci príkaz v adresári, ktorý obsahuje skripty BRAKER Perl:</p> <p>Výstup by mal byť podobný tomuto:</p> <p>Je dôležité, aby x v -rwxr-xr-x bolo prítomné pre každý skript. Ak to tak nie je, spustite</p> <p>za účelom zmeny atribútov súboru.</p> <p>Možno bude užitočné pridať do premennej prostredia $ PATH adresár, v ktorom sa nachádzajú skripty BRAKER perl. Pre jednu bashovú reláciu zadajte:</p> <p>Ak chcete sprístupniť túto modifikáciu $PATH všetkým reláciám bash, pridajte vyššie uvedené riadky do spúšťacieho skriptu (napr.</p> <p>Závislosti softvéru na bioinformatike</p> <p>BRAKER využíva rôzne bioinformatické softvérové ​​nástroje, ktoré nie sú súčasťou BRAKER. Niektoré nástroje sú povinné, t.j. BRAKER sa nespustí, ak tieto nástroje vo vašom systéme nie sú. Ostatné nástroje sú voliteľné. Nainštalujte všetky nástroje potrebné na spustenie programu BRAKER v režime, ktorý si vyberiete.</p> <p>Stiahnite si GeneMark-EX F1 z http://exon.gatech.edu/GeneMark/license_download.cgi (možnosť GeneMark-ES/ET/EP). Rozbaľte a nainštalujte GeneMark-EX podľa popisu v súbore README od GeneMark-EX.</p> <p>Ak sa už nachádza vo vašej premennej $PATH, BRAKER uhádne umiestnenie gmes_petap.pl automaticky. V opačnom prípade môže BRAKER nájsť spustiteľné súbory GeneMark-EX buď ich umiestnením v premennej prostredia GENEMARK_PATH , alebo použitím argumentu príkazového riadka ( --GENEMARK_PATH=/vaša_cesta_k_GeneMark-EX/ ).</p> <p>Ak chcete nastaviť premennú prostredia pre svoju aktuálnu reláciu Bash, zadajte:</p> <p>Pridajte vyššie uvedené riadky do spúšťacieho skriptu (napr.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>/.bashrc), aby bol dostupný pre všetky relácie bash. F5 </p> <p><strong>Dôležité:</strong> GeneMark-EX sa spustí iba vtedy, ak sa vo vašom domovskom adresári nachádza platný súbor kľúčov. Platnosť súboru kľúčov vyprší po 200 dňoch, čo znamená, že si musíte po 200 dňoch stiahnuť nové vydanie GeneMark-EX a nový súbor kľúčov. Súbor s kľúčmi sa stiahne ako gm_key.gz. Rozbaľte súbor kľúčov a presuňte ho do skrytého súboru <strong>vo vašom domovskom adresári</strong> nasledovne:</p> <p>Skripty Perlu v GeneMark-EX sú nakonfigurované s predvoleným umiestnením Perl na/usr/bin/perl.</p> <p>Ak používate GeneMark-EX v prostredí Anaconda (alebo chcete použiť Perl z premennej $ PATH z akéhokoľvek iného dôvodu), upravte shebang všetkých skriptov GeneMark-EX pomocou nasledujúceho príkazu umiestneného v priečinku GeneMark-EX:</p> <p>Správnosť inštalácie GeneMark-EX môžete skontrolovať spustením súboru check_install.bash a/alebo vykonaním príkladov v adresári GeneMark-E-tests.</p> <p>Stiahnite si AUGUSTUS z jeho hlavnej pobočky na https://github.com/Gaius-Augustus/Augustus. Rozbaľte AUGUSTUS a nainštalujte AUGUSTUS podľa AUGUSTUS README.TXT. <em><strong>Nepoužívajte zastarané verzie AUGUSTUS z iných zdrojov, napr. Balíček Debian alebo balíček Bioconda! BRAKER veľmi závisí najmä od aktuálneho adresára Augustus/scripts a iné zdroje často zaostávajú.</strong></em></p> <p>Mali by ste zostaviť AUGUSTUS na svojom vlastnom systéme, aby ste sa vyhli problémom s verziami knižníc, ktoré používa AUGUSTUS. Pokyny na kompiláciu sú uvedené v súbore AUGUSTUS README.TXT ( Augustus/README.txt ).</p> <p>AUGUSTUS pozostáva z augustusu, nástroja na predikciu génov, ďalších nástrojov C ++ umiestnených v programe Augustus/auxprogs a skriptov Perl umiestnených v skriptoch Augustus. Skripty Perl musia byť spustiteľné (pozrite si pokyny v časti Komponenty BRAKER.</p> <p>Nástroj C ++ bam2hints je základnou súčasťou programu BRAKER, keď je spustený s RNA-Seq. Zdroje sa nachádzajú v Augustus/auxprogs/bam2hints. Uistite sa, že ste kompilovali bam2hints na vašom systéme (mali by byť skompilované automaticky pri kompilácii AUGUSTUS, ale v prípade problémov s bam2hints si prečítajte pokyny na riešenie problémov v Augustus/auxprogs/bam2hints/README ).</p> <p>Pretože BRAKER je potrubím, ktoré trénuje AUGUSTUS, t.j. zapisuje súbory parametrov špecifické pre daný druh, BRAKER potrebuje prístup na zápis do konfiguračného adresára AUGUSTUS, ktorý obsahuje tieto súbory (Augustus/ config/). Ak si do svojho systému nainštalujete AUGUSTUS globálne, do konfiguračného priečinka zvyčajne nebudú môcť zapisovať všetci používatelia. Buď urobte adresár, kde sa nachádza konfigurácia, rekurzívne zapisovateľný pre používateľov AUGUSTUS, alebo skopírujte priečinok config/ priečinok (rekurzívne) na miesto, kde majú používatelia povolenie na zápis.</p> <p>AUGUSTUS vyhľadá konfiguračný priečinok vyhľadaním premennej prostredia $ AUGUSTUS_CONFIG_PATH. Ak premenná prostredia $AUGUSTUS_CONFIG_PATH nie je nastavená, potom BRAKER bude hľadať v ceste ../config relatívne k adresáru, v ktorom nájde spustiteľný súbor AUGUSTUS. Alternatívne môžete premennú zadať ako argument príkazového riadka do programu BRAKER (--AUGUSTUS_CONFIG_PATH =/your_path_to_AUGUSTUS/Augustus/config/). Premennú odporúčame exportovať napr. pre vašu aktuálnu bash reláciu:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Aby bola premenná dostupná pre všetky relácie Bash, pridajte vyššie uvedený riadok do spúšťacieho skriptu, napr.</p> <p>BRAKER očakáva celý konfiguračný adresár AUGUSTUS na $ AUGUSTUS_CONFIG_PATH, tj druhy podpriečinkov s jeho obsahom (aspoň generickým) a vonkajším! Poskytnutie zapisovateľného, ​​ale prázdneho priečinka na $ AUGUSTUS_CONFIG_PATH nebude pre BRAKER fungovať.Ak potrebujete oddeliť augustus binary a $AUGUSTUS_CONFIG_PATH , odporúčame vám rekurzívne skopírovať obsah konfigurácie, do ktorej nemožno zapisovať, do zapisovateľného umiestnenia.</p> <p>Ak máte systémovú inštaláciu AUGUSTUS na/usr/bin/augustus, nepopísateľná kópia konfigurácie je umiestnená na/usr/bin/augustus_config/. Priečinok /home/vaše/ je zapisovateľný vám. Skopírujte nasledujúci príkaz (a dodatočne nastavte potom požadované premenné):</p> <p>Pridanie adresárov binárnych súborov a skriptov AUGUSTUS do premennej $ PATH umožní vášmu systému vyhľadať tieto nástroje automaticky. Pre spustenie BRAKER to nie je požiadavka, pretože BRAKER sa ich pokúsi uhádnuť z umiestnenia inej premennej prostredia ( $AUGUSTUS_CONFIG_PATH ), alebo môžu byť oba adresáre dodané ako argumenty príkazového riadka do braker.pl, ale odporúčame pridajte ich do svojej premennej $PATH. Pre vašu aktuálnu reláciu bash zadajte:</p> <p>Pre všetky svoje relácie BASH pridajte vyššie uvedené riadky do spúšťacieho skriptu (napr.</p> <p>Na Ubuntu je Python3 zvyčajne nainštalovaný štandardne, python3 bude štandardne vo vašej premennej $PATH a BRAKER ho automaticky nájde. Máte však možnosť určiť binárne umiestnenie python3 dvoma inými spôsobmi:</p> <p>Exportujte premennú prostredia $ PYTHON3_PATH, napr. v tvojom</p> <p>Zadajte voľbu príkazového riadka --PYTHON3_PATH =/path/to/python3/to braker.pl.</p> <p>Stiahnite si BAMTOOLS (napr. Git clone https://github.com/pezmaster31/bamtools.git). Nainštalujte BAMTOOLS zadaním nasledujúceho príkazu do svojho shellu:</p> <p>Ak je už vo vašej premennej $ PATH, BRAKER automaticky nájde bamtooly. V opačnom prípade môže BRAKER nájsť binárny súbor bamtools buď pomocou premennej prostredia $BAMTOOLS_PATH , alebo použitím argumentu príkazového riadka ( --BAMTOOLS_PATH=/vaša_cesta_k_bamtools/bin/ F6 ). Aby bolo možné nastaviť premennú prostredia napr. pre vašu aktuálnu bash reláciu napíšte:</p> <p>Pridajte vyššie uvedený riadok do spúšťacieho skriptu (napr.</p> <p>/.bashrc) za účelom nastavenia premennej prostredia pre všetky relácie bash.</p> <p>Na odstránenie nadbytočných tréningových génov môžete použiť buď NCBI BLAST+ alebo DIAMOND. Nepotrebujete oba nástroje. Ak je prítomný DIAMOND, bude uprednostnený, pretože je oveľa rýchlejší.</p> <p>Získajte a rozbaľte DIAMOND nasledovne:</p> <p>Ak je už vo vašej premennej $ PATH, BRAKER automaticky nájde diamant. V opačnom prípade môže BRAKER nájsť diamantový binárny súbor buď pomocou premennej prostredia $DIAMOND_PATH , alebo použitím argumentu príkazového riadku ( --DIAMOND_PATH=/vaša_cesta_k_diamantu ). Aby bolo možné nastaviť premennú prostredia napr. pre vašu aktuálnu bash reláciu napíšte:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Pridajte vyššie uvedený riadok do spúšťacieho skriptu (napr.</p> <p>/.bashrc) za účelom nastavenia premennej prostredia pre všetky relácie bash.</p> <p>Ak sa rozhodnete pre BLAST+, nainštalujte si NCBI BLAST+ pomocou sudo apt-get install ncbi-blast+ .</p> <p>Ak už je vo vašej premennej $PATH, BRAKER automaticky nájde blastp. V opačnom prípade môže BRAKER nájsť binárny súbor blastp buď pomocou premennej prostredia $ BLAST_PATH, alebo pomocou argumentu príkazového riadka (--BLAST_PATH =/ your_path_to_blast/). Aby bolo možné nastaviť premennú prostredia napr. pre vašu aktuálnu reláciu bash zadajte:</p> <p>Pridajte vyššie uvedený riadok do spúšťacieho skriptu (napr.</p> <p>/.bashrc) za účelom nastavenia premennej prostredia pre všetky relácie bash.</p> <p>ProtHint je kanál na generovanie rád pre GeneMark-EX a AUGUSTUS z proteínov akejkoľvek evolučnej vzdialenosti. Ak sú na vstupe uvedené proteínové sekvencie, BRAKER spustí ProtHint automaticky. ProtHint je možné alternatívne vykonať ako samostatný krok počas prípravy údajov. ProtHint je k dispozícii na https://github.com/gatech-genemark/ProtHint. Stiahnite si nasledovne:</p> <p>ProtHint má vlastné softvérové ​​požiadavky. Okrem modulov Perl, ktoré vyžaduje BRAKER, potrebuje</p> <p>Inštaláciu ProtHintu môžete ľahko overiť spustením testu na https://github.com/gatech-genemark/ProtHint/tree/master/example.</p> <p>ProtHint vyžaduje DIAMOND a Spaln, ktoré sú súčasťou inštalácie ProtHint. Požiadavka spoločnosti ProtHint na GeneMark-ES bude splnená, ak ste si vyššie nainštalovali závislosti BRAKER. Ďalšie pokyny k inštalácii nájdete na stránke https://github.com/gatech-genemark/ProtHint.</p> <p>Ak je už vo vašej premennej $ PATH, BRAKER automaticky nájde prothint.py. V opačnom prípade sa BRAKER pokúsi nájsť spustiteľný súbor prothint.py pomocou premennej prostredia $ PROTHINT_PATH. Alternatívne to možno zadať ako argument príkazového riadka --PROTHINT_PATH=/vaša/cesta/k/ProtHint/bin .</p> <p>Samtools nie je potrebný na spustenie BRAKER, ak sú všetky vaše súbory naformátované správne (t. j. všetky sekvencie by mali mať krátke a jedinečné rýchle názvy). Ak si nie ste istí, či sú všetky vaše súbory správne formátované, mohlo by byť užitočné mať nainštalovaný Samtools, pretože BRAKER môže automaticky opraviť určité problémy s formátom pomocou Samtools.</p> <p>Ako predpoklad pre Samtools si stiahnite a nainštalujte htslib (napr. Git clone https://github.com/samtools/htslib.git, pri inštalácii postupujte podľa dokumentácie htslib).</p> <p>Stiahnite si a nainštalujte Samtools (napr. Git clone git: //github.com/samtools/samtools.git), pri inštalácii sa riaďte dokumentáciou Samtools).</p> <p>Ak je už vo vašej premennej $ PATH, BRAKER automaticky nájde samtooly. V opačnom prípade môže BRAKER nájsť Samtools buď pomocou argumentu príkazového riadka (--SAMTOOLS_PATH =/ your_path_to_samtools/), alebo pomocou premennej prostredia $ SAMTOOLS_PATH. Pre export premennej napr. pre vašu aktuálnu bash reláciu napíšte:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Pridajte vyššie uvedený riadok do spúšťacieho skriptu (napr.</p> <p>/.bashrc ), aby ste nastavili premennú prostredia pre všetky bash relácie.</p> <p>Ak je nainštalovaný Biopython, BRAKER môže generovať súbory FASTA s kódujúcimi sekvenciami a proteínovými sekvenciami predpovedanými spoločnosťou AUGUSTUS a generovať rozbočovače traťových údajov na vizualizáciu behu BRAKER s MakeHub R16. Toto sú voliteľné kroky. Prvú možno deaktivovať pomocou príznaku príkazového riadka --skipGetAnnoFromFasta, druhú je možné aktivovať pomocou možností príkazového riadka --makehub --email=your@mail.de, ak ani jeden z týchto voliteľných krokov nevyžaduje biopython bude vykonaná.</p> <p>Na Ubuntu nainštalujte správcu balíkov Python3 pomocou:</p> <p>Potom nainštalujte Biopython pomocou:</p> <p>cdbfasta a cdbyank vyžaduje BRAKER na korekciu génov AUGUSTUS pomocou stop kodónov v rámci (zostrihané stop kodóny) pomocou skriptu AUGUSTUS fix_in_frame_stop_codon_genes.py. Toto môžete preskočiť pomocou --skip_fixing_broken_genes.</p> <p>Na Ubuntu nainštalujte cdbfasta pomocou:</p> <p>V prípade iných systémov môžete napríklad získať cdbfasta na https://github.com/gpertea/cdbfasta, napr .:</p> <p>Na Ubuntu budú cdbfasta a cdbyank po inštalácii vo vašej premennej $ PATH a BRAKER ich automaticky vyhľadá. Máte však možnosť zadať binárne umiestnenie cdbfasta a cdbyank dvoma ďalšími spôsobmi:</p> <p><ol> Exportujte premennú prostredia $ CDBTOOLS_PATH, napr. v tvojom<p></ol> <p><strong>Poznámka:</strong> Podpora programu GenomeThreader v programe BRAKER je zastaraná.</p> <p>Tento nástroj je potrebný iba v prípade, že by ste chceli spustiť zarovnanie proteínov s genómom pomocou BRAKER pomocou GenomeThreader. Toto je vhodný prístup, iba ak je k dispozícii komentovaný druh s krátkou evolučnou vzdialenosťou k vášmu cieľovému genómu. Stiahnite si GenomeThreader z http://genomethreader.org/. Rozbaľte a nainštalujte podľa gth/README.</p> <p>BRAKER sa pokúsi nájsť spustiteľný súbor GenomeThreader pomocou premennej prostredia $ ALIGNMENT_TOOL_PATH. Alternatívne to možno zadať ako argument príkazového riadka ( --ALIGNMENT_TOOL_PATH=/vaša/cesta/k/gth ).</p> <p><strong>Poznámka:</strong> Podpora samostatného Spalnu (na strane ProtHint) v rámci programu BRAKER je zastaraná.</p> <p>Tento nástroj je potrebný, ak spúšťate ProtHint alebo ak by ste chceli spustiť zarovnanie proteínov s genómom pomocou BRAKER pomocou Spaln mimo ProtHint. Použitie Spaln mimo ProtHint je vhodný prístup iba vtedy, ak je k dispozícii anotovaný druh s krátkou evolučnou vzdialenosťou k vášmu cieľovému genómu. Odporúčame spustiť Spaln cez ProtHint pre BRAKER. ProtHint prináša binárku Spaln. Ak to na vašom systéme nefunguje, stiahnite si Spaln z https://github.com/ogotoh/spaln. Rozbaľte a nainštalujte podľa spaln/doc/SpalnReadMe22.pdf.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>BRAKER sa pokúsi nájsť spustiteľný súbor Spaln pomocou premennej prostredia $ ALIGNMENT_TOOL_PATH. Alternatívne to môžete zadať ako argument príkazového riadka (--ALIGNMENT_TOOL_PATH =/your/path/to/spaln).</p> <p><strong>Poznámka:</strong> Podpora Exonerate v rámci BRAKER je zastaraná.</p> <p>Tento nástroj je potrebný iba vtedy, ak chcete spustiť zosúladenie proteínu s genómom pomocou BRAKER pomocou Exonerate. Toto je vhodný prístup, iba ak je k dispozícii komentovaný druh s krátkou evolučnou vzdialenosťou k vášmu cieľovému genómu. (Odporúčame použiť GenomeThreader namiesto Exonerate, pretože Exonerate je porovnateľne pomalší a má nižšiu špecifickosť ako GenomeThreader.) Stiahnite si Exonerate z https://github.com/nathanweeks/exonerate. Rozbaľte a nainštalujte podľa exonerate/README. (Na Ubuntu si stiahnite a nainštalujte zadaním sudo apt-get install exonerate .)</p> <p>BRAKER sa pokúsi nájsť spustiteľný súbor Exonerate pomocou premennej prostredia $ALIGNMENT_TOOL_PATH . Alternatívne to možno zadať ako argument príkazového riadka ( --ALIGNMENT_TOOL_PATH=/vaša/cesta/k/osvobodiť ).</p> <p>Tento nástroj je potrebný iba vtedy, ak chcete buď pridať UTR (z údajov RNA-Seq) k predpovedaným génom, alebo ak chcete trénovať parametre UTR pre AUGUSTUS a predpovedať gény s UTR. V každom prípade GUSHR vyžaduje zadanie údajov RNA-Seq.</p> <p>GUSHR je k dispozícii na stiahnutie na https://github.com/Gaius-Augustus/GUSHR. Získate ho zadaním:</p> <p>GUSHR spúšťa GeMoMa jar súbor R19, R20, R21 a tento jar súbor vyžaduje Java 1.8. Na Ubuntu môžete nainštalovať Java 1.8 pomocou nasledujúceho príkazu:</p> <p>Ak máte vo svojom systéme nainštalovaných niekoľko verzií java, uistite sa, že povolíte 1,8 predchádzajúceho spustenia programu BRAKER s jazykom Java spustením</p> <p>a výber správnej verzie.</p> <p>Ak prepnete --UTR=on , bamToWig.py bude vyžadovať nasledujúce nástroje, ktoré si môžete stiahnuť z http://hgdownload.soe.ucsc.edu/admin/exe:</p> <p>Inštalácia týchto nástrojov do $ PATH je voliteľná. Ak tak neurobíte a prepnete --UTR=on , bamToWig.py ich automaticky stiahne do pracovného adresára.</p> <p>Ak chcete automaticky generovať rozbočovač údajov o trase vášho spustenia BRAKER, je potrebný softvér MakeHub, dostupný na https://github.com/Gaius-Augustus/MakeHub. Stiahnite si softvér (buď spustením git clone https://github.com/Gaius-Augustus/MakeHub.git, alebo zvolením vydania z https://github.com/Gaius-Augustus/MakeHub/releases. Extrahujte vydanie balík, ak ste si stiahli vydanie (napr. rozbaľte súbor MakeHub.zip alebo tar -zxvf MakeHub.tar.gz.</p> <p>BRAKER sa pokúsi nájsť skript make_hub.py pomocou premennej prostredia $ MAKEHUB_PATH. Alternatívne to môžete zadať ako argument príkazového riadka (--MAKEHUB_PATH =/your/path/to/MakeHub/). BRAKER sa môže tiež pokúsiť uhádnuť umiestnenie MakeHub vo vašom systéme.</p> <p>Rôzne režimy potrubia BRAKER</p> <p>V nasledujúcom texte popíšeme „typické“ výzvy BRAKER pre rôzne typy vstupných údajov. Vo všeobecnosti odporúčame, aby ste BRAKER spustili na genómových sekvenciách, ktoré boli pre opakovania maskované. Ak bol váš genóm mäkko maskovaný, zahrňte do hovoru BRAKER vlajku --softmasking!</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Tento prístup je vhodný pre genómy druhov, pre ktoré sú dostupné knižnice RNA-Seq s dobrým pokrytím transkriptómu. Potrubie je znázornené na obrázku 2.</p> <p>BRAKER môže buď extrahovať informácie o zostrihu RNA-Seq zo súborov bam, alebo môže použiť takéto extrahované informácie priamo.</p> <p>Ak chcete spustiť BRAKER s údajmi RNA-Seq dodanými ako súbory bam (v prípade viacerých súborov ich oddeľte čiarkou), spustite:</p> <p>Ak chcete spustiť BRAKER s informáciami o zarovnaní spojenými s RNA-Seq, ktoré už boli extrahované, spustite:</p> <p>Formát takéhoto súboru s radami musí byť nasledujúci (súbor oddelený tabuľkami):</p> <p>Zdroj b2h v druhom stĺpci a zdrojový tag src=E v poslednom stĺpci sú nevyhnutné pre BRAKER na určenie, či bola z údajov RNA-Seq vygenerovaná nápoveda.</p> <p>BRAKER s proteínmi akejkoľvek evolučnej vzdialenosti</p> <p>Tento prístup je vhodný pre genómy druhov, pre ktoré nie sú dostupné žiadne knižnice RNA-Seq. V tomto prípade by sa mala použiť veľká databáza bielkovín (s možno dlhšou evolučnou vzdialenosťou k cieľovému druhu). Tento režim je znázornený na obrázku 9.</p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_0RAXBlDnzh3z5v.png"></p> <p>Obrázok 9: BRAKER s proteínmi akejkoľvek evolučnej vzdialenosti. Proteínové mapovacie kanály ProtHint sa používajú na generovanie proteínových tipov. ProtHint automaticky určuje, ktoré zarovnania pochádzajú od blízkych príbuzných a ktoré od dosť vzdialených príbuzných.</p> <p>Ak chcete spustiť BRAKER v tomto režime, zadajte:</p> <p>Odporúčame použiť OrthoDB ako základ pre proteins.fa . Návod na prípravu vstupných proteínov OrthoDB je zdokumentovaný tu: https://github.com/gatech-genemark/ProtHint#protein-database-preparation.</p> <p>Do tohto súboru môžete samozrejme pridať ďalšie proteínové sekvencie, alebo to môžete skúsiť s úplne inou databázou. Akákoľvek databáza však bude potrebovať niekoľko zástupcov pre každý proteín.</p> <p>Namiesto toho, aby BRAKER spustil ProtHint, môžete tiež spustiť BRAKER s radami, ktoré už vytvoril ProtHint, poskytnutím výstupu ProtHint prothint_augustus.gff:</p> <p>Formát prothint_augustus.gff v tomto režime vyzerá takto:</p> <p>Predikcia všetkých rád s src = M bude vynútená. Tipy so src = C sú „reťazové dôkazy“, t. J. Budú začlenené iba vtedy, ak môžu byť všetci členovia skupiny (grp =.) Začlenení do jedného prepisu. Všetky ostatné rady majú v poslednom stĺpci src = P. Podporované funkcie v stĺpci 3 sú intron, štart, stop a CDSpart.</p> <p>Školenie a predikcia UTR, integrácia informácií o pokrytí</p> <p>Ak sú údaje RNA-Seq (a iba RNA-Seq) poskytnuté BRAKERovi ako súbor bam a ak je genóm mäkko maskovaný pre opakovania, BRAKER môže automaticky trénovať parametre UTR pre AUGUSTUS. Po úspešnom natrénovaní parametrov UTR bude BRAKER automaticky predpovedať gény vrátane informácií o pokrytí z údajov RNA-Seq. Príklad hovoru:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Táto funkcia je experimentálna!</p> <p>--UTR = on momentálne nie je kompatibilný s bamToWig.py vydaným v AUGUSTUS 3.3.3, vyžaduje aktuálnu verziu vývojového kódu z úložiska github (git clone https://github.com/Gaius-Augustus/Augustus.git) .</p> <p>--UTR = zapnuté zvyšuje spotrebu pamäte AUGUSTUS. Starostlivo sledujte úlohy, ak sa váš stroj blížil k maximalizácii pamäte RAM bez --UTR = zapnutého! Znížením počtu jadier sa zníži aj spotreba RAM.</p> <p>Predikcia UTR niekedy zlepšuje presnosť predikcie kódovacej sekvencie, ale nie vždy. Ak vyskúšate túto funkciu, potom pozorne porovnajte výsledky s parametrami UTR a bez nich (napr. v prehliadači UCSC Genome Browser).</p> <p>Zarovnané vlákna RNA-Seq</p> <p>Pre spustenie BRAKER bez parametrov UTR nie je veľmi dôležité, či údaje RNA-Seq boli generované a <em>uviaznutý</em> protokol (pretože zostrihané zarovnania sú „umelo uviazané“ kontrolou vzoru miesta zostrihu). Avšak pre tréning a predikciu UTR môžu uviaznuté knižnice poskytnúť informácie, ktoré sú cenné pre BRAKER.</p> <p>Po zarovnaní knižníc reťazcov RNA-Seq rozdeľte výsledné položky súboru bam do dvoch súborov: jeden pre mapovanie plusových vlákien, jeden pre mapovanie mínusových vlákien. Zavolajte BRAKERA nasledovne:</p> <p>Môžete tiež zahrnúť súbory bam z neprepojených knižníc. Tieto súbory nebudú použité na generovanie príkladov výcviku UTR, ale budú zahrnuté do konečného kroku predikcie génu ako informácie o neviazanom pokrytí, príklad hovoru:</p> <p><strong>Pozor:</strong> Táto funkcia je experimentálna a momentálne má v našom zozname údržby nízku prioritu!</p> <p>BRAKER s proteínmi krátkej evolučnej vzdialenosti</p> <p>Toto je zastaraný kanál, ktorý bol pred jediným vhodným prístupom, ak nie sú k dispozícii údaje RNA-Seq pre druhy cieľového genómu a ak je k dispozícii dobre anotovaný a veľmi blízko príbuzný referenčný druh a tento prístup nechcete použiť pre proteíny akejkoľvek evolučnej vzdialenosti (kde sme si vtedy neboli istí, ako to bude fungovať na proteínoch krátkej evolučnej vzdialenosti).</p> <p>Ak chcete spustiť BRAKER v tomto režime, zadajte:</p> <p>Je možné generovať proteínové porovnania externe, pred spustením samotného BRAKERU. Kompatibilný príkaz na spustenie programu GenomeThreader pred spustením programu BRAKER je:</p> <p>Ak chcete použiť tieto externe vytvorené súbory zarovnania, spustite:</p> <p>V tomto režime je možné spustiť aj BRAKER pomocou už pripraveného súboru hints. V takom prípade spustite:</p> <p>Formát súboru s radami by mal vyzerať takto:</p> <p>Podporované funkcie v stĺpci 3 sú intron, CDSpart, štart, stop.</p> <p>BRAKER s údajmi o RNA-Seq a proteínoch</p> <p>Aj keď BRAKER podporuje kombináciu údajov RNA-Seq a proteínov v rámci potrubia BRAKER, dôrazne odporúčame spustiť BRAKER dvakrát (1x iba s RNA-Seq, 1x iba s údajmi o proteíne) a následne skombinovať výsledky oboch behov s TSEBRA, selektor prepisu pre BRAKER (https://github.com/Gaius-Augustus/TSEBRA). Viac informácií o TSEBRA nájdete na https://www.biorxiv.org/content/10.1101/2021.06.07.447316v1</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>V nasledujúcom texte popíšeme, že pre úplnosť je možné oba zdroje údajov kombinovať so samotným BRAKERom.</p> <p>Natívny režim na spustenie programu BRAKER s údajmi o RNA-Seq a proteínoch je --etpmode. Toto bude nazývať GeneMark-ETP (ktorý je v súčasnej dobe k dispozícii iba ako predčasná verzia s použitím súčasného stavu GeneMark-ES/ET/EP/EP+, čoskoro sa očakáva zlepšenie), ktorý bude na tréning využívať rady RNA-Seq a proteíny GeneMark-ETP. Tipy, ktoré sú podporované zdrojmi aj proteínovými radami obzvlášť vysokej kvality, sú presadzované v génovej predikcii pomocou GeneMark-ETP. Následne sa AUGUSTUS školí v predpovediach GeneMark-ETP a gény s náznakmi predpovedá AUGUSTUS. Ak chcete zavolať plynovod v tomto režime, spustite:</p> <p>Môžete alebo samozrejme nahradiť súbor rnaseq.gff hints súborom BAM, napr. --bam = ranseq.bam.</p> <p>Okrem toho môže BRAKER realizovať nasledujúce potrubia (zastarané potrubia):</p> <p>Pridanie údajov o proteíne s krátkou evolučnou vzdialenosťou do kroku predikcie génu</p> <p>Rozširujúci tréningový génový súbor s proteínmi krátkej evolučnej vzdialenosti</p> <p>Pridanie údajov o proteíne s krátkou evolučnou vzdialenosťou do kroku predikcie génu</p> <p>Toto potrubie je znázornené na obrázku 7.</p> <p>Vo všeobecnosti pridajte možnosti</p> <p>na volanie BRAKER, ktoré je popísané v časti BRAKER s údajmi RNA-Seq. Vyberte jeden nástroj na zarovnanie proteínov z GenomeThreader ( gth , odporúčané), Spaln ( spaln ) alebo Exonerate ( exonerate ).Samozrejme, môžete tiež špecifikovať informácie o proteínoch ako súbory na zarovnanie proteínov alebo súbory s radami, ako je popísané v časti BRAKER s proteínmi krátkej evolučnej vzdialenosti). Výsledkom môže byť volanie podobné tomuto:</p> <p>Rozširujúci tréningový génový súbor s proteínmi krátkej evolučnej vzdialenosti</p> <p>Ak sa vám zdá, že počet tréningových génových štruktúr identifikovaných iba údajmi RNA-Seq je príliš malý, môžete do cvičnej génovej sady pridať tréningové génové štruktúry generované zarovnaním bielkovín s GenomeThreader. Toto potrubie je znázornené na obrázku 8.</p> <p>Vo všeobecnosti pridajte možnosti</p> <p>na volanie BRAKER, ktoré je popísané v časti BRAKER s údajmi RNA-Seq. Výsledkom môže byť hovor podobný nasledujúcemu:</p> <p>Popis vybraných možností príkazového riadka BRAKER</p> <p>Ak chcete získať úplný zoznam možností, spustite stránku braker.pl --help.</p> <p>Spustite BRAKER v režime EP, tj. S proteínmi akejkoľvek evolučnej vzdialenosti spracovanými spoločnosťou ProtHint v programe BRAKER. Tento režim je predvolene zapnutý, keď je detekovaný iba vstup bielkovín. Malo by byť poskytnuté buď --prot_seq=orthodb.fa alebo proteínové rady --hints=prothint_augustus.gff .</p> <p>Spustite BRAKER v režime ETP, t.j. s proteínmi akejkoľvek evolučnej vzdialenosti spracovanými ProtHintom a s údajmi RNA-Seq. Mali by byť vybavené prot_seq = orthodb.fa a --bam = rnaseq.bam. Alternatívne môžu byť rady RNA-Seq a proteíny poskytnuté ako spracované rady s opciou --hints. Zvážte použitie TSEBRA (https://github.com/Gaius-Augustus/TSEBRA) namiesto BRAKER v režime ETP.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Vypočítajte AUGUSTUS <em>ab initio</em> predpovede navyše k predpovediam AUGUSTUS s radami (dodatočné výstupné súbory: augustus.ab_initio.* . Môže to byť užitočné na odhadnutie kvality parametrov tréningového génu pri kontrole predpovedí v prehliadači.</p> <p>Jeden alebo niekoľko argumentov príkazového riadka, ktoré sa majú odovzdať spoločnosti AUGUSTUS, ak je zadaných niekoľko argumentov, oddeľte ich medzerami, t. j. "--first_arg=sth --second_arg=sth" . To môže byť užitočné, ak viete, že predikcia génov vo vašom konkrétnom druhu ťaží z konkrétneho argumentu AUGUSTUS počas kroku predikcie.</p> <p>Určuje maximálny počet jadier, ktoré možno použiť počas výpočtu. BRAKER musí niektoré kroky spustiť na jednom jadre, iné môžu využiť výhody viacerých jadier. Ak použijete viac ako 8 jadier, nezrýchli to všetky paralelizované kroky, najmä časovo náročná optimalizácia_augustus.pl nepoužije viac ako 8 jadier. Ak vám však nevadí, že niektoré jadrá sú nečinné, použitie viac ako 8 jadier urýchli ďalšie kroky.</p> <p>Možnosť GeneMark-EX: spustite algoritmus s modelom bodu vetvy. Túto možnosť použite, ak ste genóm huba.</p> <p>Možnosť Softmasking pre mäkko maskované súbory genómu. (Štandardne vypnuté.)</p> <p>Ak BRAKER vykoná tréning AUGUSTUS, použite súčasné konfiguračné a parametrické súbory, ak existujú pre 'druh', prepíšu pôvodné parametre.</p> <p>Vykonajte školenie CRF pre výsledné parametre AUGUSTUSu a ponechajte si ich pre konečné predpovede iba vtedy, ak vykazujú vyššiu presnosť ako parametre HMM. Tým sa zvyšuje doba prevádzky!</p> <p>Zmeňte parameter $ lambda $ Poissonovej distribúcie, ktorý sa používa na prevzorkovanie tréningových génov, podľa počtu intrónov (iba vzorky génov s až 5 intrónmi sú vzorkované). Predvolená hodnota je $lambda=2$. Možno budete chcieť nastaviť na 0 pre organizmy, ktoré majú hlavne gény s jedným exónom. (Gény s jedným exónom vo všeobecnosti prinášajú menšiu hodnotu pre zvýšenie parametrov AUGUSTUS v porovnaní s génmi s mnohými exónmi.)</p> <p>Generujte príklady tréningu UTR pre AUGUSTUS z informácií o pokrytí RNA-Seq, trénujte parametre AUGUSTUS UTR a predpovedajte gény pomocou AUGUSTUS a UTR, vrátane informácií o pokrytí pre RNA-Seq ako dôkazu. Tento príznak funguje iba vtedy, ak je povolený aj --softmasking. <em>Toto je experimentálna funkcia!</em></p> <p>Ak ste vykonali beh BRAKER bez --UTR = zapnutý, môžete pridať tréning parametrov UTR a predikciu génov s parametrami UTR (a iba nápovedy RNA-Seq) pomocou nasledujúceho príkazu:</p> <p>Upravte augustus.hints.gtf tak, aby ukazoval na predpovede AUGUSTUSU s radami z predchádzajúceho spustenia BRAKERU Upraviť hodnotu flaning_DNA do priľahlej oblasti zo súboru denníka vášho predchádzajúceho spustenia BRAKERu upraviť some_new_working_directory na miesto, kde by BRAKER mal ukladať výsledky dodatočných úprav BRAKERU niektoré druhy k názvu druhu použitému vo vašom predchádzajúcom behu BRAKER.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Pridajte UTR z konvergenčných informácií RNA-Seq do predpovedí génu AUGUSTUS pomocou GUSHR. Nevykonáva sa žiadne trénovanie parametrov UTR a predikcia génov s parametrami UTR.</p> <p>Ak ste vykonali spustenie BRAKER bez --addUTR = zapnuté, môžete pridať výsledky UTR predchádzajúceho spustenia BRAKER pomocou nasledujúceho príkazu:</p> <p>Upravte augustus.hints.gtf tak, aby ukazoval na predpovede AUGUSTUS s radami z predchádzajúceho spustenia BRAKER, upravte nejaký_nový_pracovný_adresár na miesto, kde má BRAKER ukladať výsledky dodatočného spustenia BRAKER, toto spustenie nezmení parametre AUGUSTUS. Odporúčame vám špecifikovať pôvodný druh pôvodného behu pomocou --species=somespecies . V opačnom prípade BRAKER vytvorí adresár nepotrebných parametrov druhov Sp_*.</p> <p>Ak je zapnuté --UTR = zapnuté, súbory bam oddelené od vlákien môžu byť vybavené --bam = plus.bam, mínus.bam. V takom prípade --viazané =. by mali držať pramene pilníkov bam ( + pre plus prameň, - pre mínus prameň, . pre nezapletený). Všimnite si, že nezreťazené dáta sa použijú v kroku predikcie génu, iba ak je parameter --stranded=. je nastavený. <em>Toto je experimentálna funkcia! GUSHR v súčasnosti nevyužíva výhody uviaznutých údajov.</em></p> <p>Ak sú k dispozícii --makehub a --email=your@mail.de (s vašou platnou e-mailovou adresou), vygeneruje sa track data hub pre vizualizáciu výsledkov pomocou UCSC Genome Browser pomocou MakeHub (https: // github. com/Gaius-Augustus/MakeHub).</p> <p>GeneMark-EX štandardne používa pravdepodobnosť 0,001 na predikciu vzoru GC miesta zostrihu darcu (namiesto GT). Môže mať zmysel zvýšiť túto hodnotu pre druhy, kde je toto miesto spojenia darcu bežnejšie. Napríklad v druhu <em>Emiliania Huxleyi</em>, asi 50% stránok spájania darcu má vzor GC (https://media.nature.com/original/nature-assets/nature/journal/v499/n7457/extref/nature12221-s2.pdf, strana 5).</p> <p>BRAKER vytvára niekoľko dôležitých výstupných súborov v pracovnom adresári.</p> <p>augustus.hints.gtf: Gény predpovedané AUGUSTUSOM s náznakmi z daných vonkajších dôkazov. Tento súbor bude chýbať, ak bol BRAKER spustený s možnosťou --esmode.</p> <p>augustus.hints_utr.gtf: Tento súbor môže obsahovať iný obsah v závislosti od toho, ako ste zavolali BRAKER:</p> <p>Ak ste spustili BRAKER so zapnutým --UTR =, tento súbor bude obsahovať gény predpovedané programom AUGUSTUS s parametrami UTR a informáciami o pokrytí z údajov RNA-Seq vo formáte GTF.</p> <p>Ak ste spustili BRAKER so zapnutým --addUTR =, potom tento súbor bude obsahovať gény predpovedané systémom AUGUSTUS bez parametrov UTR a bez informácií o pokrytí z údajov RNA-Seq. Namiesto toho budú predpovede génov AUGUSTUS s náznakmi predĺžené iba o UTR, ak to pokrytie RNA-Seq dovolí (t. J. Nebol vykonaný žiadny samostatný tréning alebo beh AUGUSTUS, UTR sa pridávajú iba zo spusteného GUSHR). Gény sú vo formáte GTF.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Tento súbor bude k dispozícii iba vtedy, ak bol BRAKER spustený s možnosťami --UTR = on alebo --addUTR = on a súborom BAM RNA-Seq.</p> <p>augustus.ab_initio.gtf: Gény predpovedané AUGUSTUSOM v <em>ab initio</em> režim vo formáte GTF. Súbor bude vždy prítomný, ak bol AUGUSTUS spustený s voľbou --esmode. V opačnom prípade bude prítomný iba vtedy, ak bol BRAKER spustený s voľbou --AUGUSTUS_ab_initio .</p> <p>augustus.ab_initio_utr.gtf: Tento súbor môže obsahovať predpovede génov s UTR, ak ste spustili BRAKER s --UTR=on.</p> <p>Tento súbor bude prítomný iba vtedy, ak bol BRAKER spustený s voľbami --UTR=on alebo --addUTR=on a RNA-Seq BAM-súborom a s voľbou --AUGUSTUS_ab_initio .</p> <p>GeneMark-E*/genemark.gtf: Gény predpovedané GeneMark-ES/ET/EP/EP+ vo formáte GTF. Tento súbor bude chýbať, ak bol BRAKER vykonaný s proteínmi blízkej homológie a voľbou --trainFromGth.</p> <p>braker.gtf: Union of augustus.hints.gtf a spoľahlivé predpovede GeneMark-EX (gény plne podporované externými dôkazmi). V --esmode ide o spojenie augustus.ab_initio.gtf a všetkých génov GeneMark-ES. Tento súbor je teda spravidla citlivejší (správne predpovedaných viac génov) a môže byť menej špecifický (môže byť prítomných viac falošne pozitívnych predpovedí).</p> <p>hintsfile.gff: Vonkajšie dôkazové údaje extrahované z údajov RNAseq.bam a/alebo bielkovín.</p> <p>Výstupné súbory AUGUSTUS môžu obsahovať nasledujúce koncovky názvov a formáty:</p> <p>Vždy sa vyrába formát GTF.</p> <p>Formát GFF3 sa vytvorí, ak bol pre BRAKER zadaný príznak --gff3.</p> <p>Kódovacie sekvencie vo formáte FASTA sa vytvoria, ak nebol nastavený príznak --skipGetAnnoFromFasta.</p> <p>Súbory proteínových sekvencií vo formáte FASTA sa vytvoria, ak nebol nastavený príznak --skipGetAnnoFromFasta.</p> <p>Podrobnosti o formáte gtf nájdete na stránke http://www.sanger.ac.uk/Software/formats/GFF/. Súbor vo formáte GTF obsahuje jeden riadok na predpokladaný exón. Príklad:</p> <p>Stĺpce (polia) obsahujú:</p> <p>Ak bola použitá možnosť --makehub a MakeHub je vo vašom systéme k dispozícii, vytvorí sa adresár centra začínajúci sa názvom hub_. Skopírujte tento adresár na verejne prístupný webový server. V adresári sa nachádza súbor hub.txt. Poskytnite odkaz na tento súbor prehliadaču UCSC Genome Browser na vizualizáciu výsledkov.</p> <p>Neúplný vzorový súbor údajov sa nachádza v adresári BRAKER/example . Na dokončenie súboru údajov si stiahnite súbor zarovnania RNA-Seq (134 MB) s wget:</p> <p>V prípade, že máte problém s prístupom k tomuto súboru, je k dispozícii aj kópia z iného servera:</p> <p>Príklad súboru údajov nebol zostavený s cieľom dosiahnuť optimálnu presnosť predikcie, ale s cieľom rýchlo otestovať komponenty potrubia. Malá podmnožina genómu použitá v týchto testovacích príkladoch nie je dostatočne dlhá na to, aby tréning BRAKER fungoval dobre.</p> <p>Údaje zodpovedajú posledným 1 000 000 nukleotidom z <em>Arabidopsis thaliana</em>chromozóm Chr5, rozdelený na 8 umelých kontigov.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Zarovnania RNA-Seq boli získané pomocou VARUS.</p> <p>Proteínové sekvencie sú podskupinou rastlinných proteínov OrthoDB v10.</p> <ul> <li>genome.fa - súbor genómu vo formáte fasta</li> <li>RNAseq.bam - súbor zarovnania RNA-Seq vo formáte bam (tento súbor nie je súčasťou tohto úložiska, je potrebné ho stiahnuť samostatne z http://topaz.gatech.edu/GeneMark/Braker/RNAseq.bam)</li> <li>RNAseq.hints – rady RNA-Seq (možno použiť namiesto RNAseq.bam ako vstup RNA-Seq do BRAKER)</li> <li>proteiny.fa - proteínové sekvencie vo formáte fasta</li></ul> <p>Nasledujúce príkazy predpokladajú, že ste všetky cesty k nástrojom nakonfigurovali exportovaním premenných bash alebo že vo svojom $ PATH máte potrebné nástroje.</p> <p>Príklad súboru údajov obsahuje aj skripty testy/test*.sh, ktoré budú vykonávať nižšie uvedené príkazy na testovanie programu BRAKER s príkladom súboru údajov. Príklad výsledkov AUGUSTUS a GeneMark-EX nájdete v priečinku results/test*. Uvedomte si, že BRAKER obsahuje niekoľko častí, kde sa používajú náhodné premenné, t.j. výsledky, ktoré získate pri spustení testov, nemusia byť úplne identické. Ak chcete porovnať výsledky svojich testov s referenčnými, môžete použiť skript compare_intervals_exact.pl nasledovne:</p> <p>Niekoľko testov používa možnosť --gm_max_intergenic 10 000, aby testy bežali rýchlejšie. Neodporúča sa používať túto možnosť v skutočných behoch BRAKER, zvýšenie rýchlosti dosiahnuté úpravou tejto možnosti je zanedbateľné na genómoch plnej veľkosti.</p> <p>Ponúkame odhady za behu odvodené z výpočtu na <em>Procesor Intel (R) Xeon (R) E5530 pri 2,40 GHz</em>.</p> <p>Testovanie BRAKERA s údajmi RNA-Seq</p> <p>Nasledujúci príkaz spustí potrubie podľa obrázku 3:</p> <p>Tento test je implementovaný v test1.sh, očakávaná doba spustenia je</p> <p>Testovanie BRAKER s proteínmi akejkoľvek evolučnej vzdialenosti</p> <p>Nasledujúci príkaz spustí potrubie podľa obrázku 4:</p> <p>Tento test je implementovaný v test2.sh , očakávaný čas behu je</p> <p>Testovanie BRAKER s proteínmi akejkoľvek evolučnej vzdialenosti a RNA-Seq</p> <p>Zvážte použitie TSEBRA namiesto spustenia programu BRAKER s údajmi o RNA-Seq a proteínoch: https://github.com/Gaius-Augustus/TSEBRA</p> <p>Nasledujúci príkaz spustí pipeline, ktorá najprv trénuje GeneMark-ETP s proteínovými a RNA-Seq hintmi a následne trénuje AUGUSTUS na základe predpovedí GeneMark-ETP. Predpovede AUGUSTUS sa vykonávajú aj s náznakmi z oboch zdrojov, pozri obrázok 5:</p> <p>Tento test je implementovaný v test3.sh, predpokladaná doba spustenia je</p> <p>UTRs z údajov RNA-Seq (bez školenia AUGUSTUS) môžete pridať k výsledkom behu BRAKERA v režime ETP nasledujúcim spôsobom:</p> <p>Toto je implementované v test3_add_utrs.sh, očakávaný čas behu je</p> <p>Testovanie BRAKERA s proteínmi blízkej homológie</p> <p>Nasledujúci príkaz spustí potrubie podľa obrázku 6:</p> <p>Tento test je implementovaný v test4.sh, predpokladaná doba behu je</p> <p>7 minút. Rýchly priebeh tohto testu je väčšinou spôsobený generovaním nízkeho počtu tréningových génov. Všimnite si, že tento prístup nie je vhodný so zvyšujúcou sa veľkosťou genómu a počtom proteínov v proteínovej databáze. Doba behu v celom genóme bude oveľa pomalšia ako v prípade príkazu použitého v test2.sh.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Testovanie BRAKERA s proteínmi blízkej homológie a údajmi RNA-Seq (školenie podporované RNA-Seq)</p> <p>Zvážte použitie TSBERA namiesto súčasného spustenia BRAKER s proteínmi a údajmi RNA-Seq: https://github.com/Gaius-Augustus/TSEBRA</p> <p>Nasledujúci príkaz spustí potrubie podľa obrázku 7:</p> <p>Tento test je implementovaný v test5.sh , očakávaný čas behu je</p> <p>Testovanie BRAKERA s proteínmi blízkej homológie a údajmi RNA-Seq (školenie podporované RNA-Seq a proteínom)</p> <p>Zvážte použitie TSBERA namiesto súčasného spustenia programu BRAKER s proteínmi a údajmi RNA-Seq: https://github.com/Gaius-Augustus/TSEBRA</p> <p>Nasledujúci príkaz spustí potrubie podľa obrázku 8:</p> <p>Tento test je implementovaný v test6.sh , očakávaný čas behu je</p> <p>Testovanie BRAKER s vopred natrénovanými parametrami</p> <p>Tréningový krok všetkých potrubí je možné preskočiť pomocou možnosti --skipAllTraining. To znamená, že sa budú vykonávať iba predpovede AUGUSTUS s použitím vopred pripravených, už existujúcich parametrov. Napríklad môžete predpovedať gény pomocou príkazu:</p> <p>Tento test je implementovaný v test7.sh, predpokladaná doba spustenia je</p> <p>Testovanie BRAKERA so sekvenciou genómu</p> <p>Nasledujúci príkaz spustí potrubie bez vonkajších dôkazov:</p> <p>Tento test je implementovaný v test8.sh , očakávaný čas behu je</p> <p>Testovanie BRAKER s údajmi RNA-Seq a --UTR=on</p> <p>Nasledujúci príkaz spustí BRAKER s trénovaním parametrov UTR z údajov o pokrytí RNA-Seq:</p> <p>Tento test je implementovaný v test9.sh, predpokladaná doba spustenia je</p> <p>Testovanie BRAKERA s údajmi RNA-Seq a --addUTR = zapnuté</p> <p>Nasledujúci príkaz pridá UTR k augustus.hints.gtf z údajov o pokrytí RNA-Seq:</p> <p>Tento test je implementovaný v test10.sh, predpokladaná doba spustenia je</p> <p>Spustenie programu BRAKER na základe predtým existujúcich spustení programu BRAKER</p> <p>Momentálne neexistuje žiadny čistý spôsob, ako reštartovať neúspešný chod BRAKER (po vyriešení nejakého problému). Je však možné spustiť novú jazdu BRAKER na základe výsledkov z predchádzajúcej jazdy – vzhľadom na to, že stará jazda priniesla požadované medzivýsledky. V nasledujúcom texte sa budeme odvolávať na starý pracovný adresár s premennou $ <braker_old>a do nového pracovného adresára BRAKER s $ <braker_new>. Súbor what-to-cite.txt bude vždy odkazovať iba na softvér, ktorý bol v skutočnosti vyvolaný konkrétnym spustením. Možno budete musieť skombinovať obsah $<braker_new>/what-to-cite.txt s $<braker_old>/what-to-cite.txt na prípravu publikácie. Nasledujúci obrázok ilustruje, v ktorých bodoch môže byť zachytený beh BRAKERA.<p> <p><img loading="lazy" src="//dualjuridik.org/img/biol-2022/5262/image_aTmkirq078Noqn62j.png"></p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Obrázok 10: Body za zachytenie cyklu BRAKER a opätovné použitie medziproduktov v novom cykle BRAKER.</p> <p>Možnosť 1: spustenie BRAKER s existujúcimi súbormi tipov pred tréningom</p> <p>Ak máte prístup k existujúcemu výstupu BRAKER, ktorý obsahuje súbory s radami, ktoré boli vygenerované z vonkajších údajov, ako sú napríklad sekvencie RNA-Seq alebo proteíny, môžete tieto súbory s radami recyklovať v novom spustení programu BRAKER. V BRAKERI je možné priamo použiť aj rady zo samostatného behu ProtHint.</p> <p>Tipy je možné poskytnúť BRAKEROVI s --hints $<braker_old>/hintsfile.gff možnosť. Je to znázornené v testovacích súboroch test1_restart1.sh, test2_restart1.sh, test3_restart1.sh, test5_restart1.sh a test7_restart1.sh. Ostatné režimy (pre ktoré tento test chýba) nie je možné týmto spôsobom reštartovať.<p> <p>Možnosť 2: spustenie BRAKER po dokončení GeneMark-EX, pred tréningom AUGUSTUS</p> <p>Výsledok GeneMark je možné poskytnúť spoločnosti BRAKER s --geneMarkGtf $<braker_old>/GeneMark-EX/genemark.gtf možnosť. Je to znázornené v testovacích súboroch test1_restart2.sh, test2_restart2.sh, test3_restart2.sh, test5_restart2.sh a test8_restart2.sh. Ostatné režimy (pre ktoré tento test chýba) nemožno týmto spôsobom reštartovať.<p> <p>Možnosť 3: štart BRAKERA po tréningu AUGUSTUS</p> <p>Vycvičené parametre druhu pre AGUSTUS je možné odovzdať s možnosťami --skipAllTraining a --species $ speciesName. Toto je znázornené v súboroch test*_restart3.sh.</p> <p>Pred nahlásením chýb skontrolujte, či používate najnovšie verzie GeneMark-EX, AUGUSTUS a BRAKER. Pred nahlásením chýb si tiež skontrolujte zoznam bežných problémov a zoznam problémov na GitHub. Monitorujeme otvorené problémy na GitHub. Niekedy vám nedokážeme pomôcť okamžite, ale snažíme sa vaše problémy vyriešiť.</p> <p>Informácie, ktoré stoja za zmienku vo vašej správe o chybe:</p> <p>Skontrolujte v braker/yourSpecies/braker.log, v ktorom kroku braker.pl zlyhal.</p> <p>Existuje niekoľko ďalších súborov, ktoré by mohli byť zaujímavé, v závislosti od toho, kde v potrubí sa problém vyskytol. Niektoré z nasledujúcich súborov nebudú k dispozícii, ak neobsahujú žiadne chyby.</p> <p>braker/yourSpecies/errors/bam2hints.*.stderr – poskytne podrobnosti o havárii bam2hints (krok na konverziu súboru bam na súbor intron gff)</p> <p>braker/yourSpecies/hintsfile.gff – je tento súbor prázdny? Ak áno, niečo sa pokazilo pri generovaní tipov – obsahuje tento súbor rady zo zdroja „b2h“ a typu „intron“? Ak nie: GeneMark-ET nebude schopný správne vykonať. Naopak, GeneMark-EP+ nebude môcť správne fungovať, ak chýbajú rady zo zdroja „ProtHint“.</p> <p>brzdič/vášDruh/(align_gthalign_exoneratealign_spaln)/*err - chyby nahlásené nástrojmi na zarovnanie gth/exonerate/spaln</p> <p>brzdič/váš druh/chyby/GeneMark-<et,ep>.stderr - chyby nahlásené GeneMark -ET/EP+<p> <p>brzdič/váš druh/génová značka-<et,ep>/genemark.gtf - je tento súbor prázdny? Ak áno, niečo sa pokazilo počas vykonávania GeneMark-ET/EP+<p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>brzdič/váš druh/génová značka-<et,ep>/genemark.f.good.gtf - je tento súbor prázdny? Ak áno, niečo sa pokazilo počas filtrovania génov GeneMark-ET/EP+ na školenie AUGUSTUS<p> <p>braker/yourSpecies/genbank.good.gb - vyskúšajte „grep -c LOCUS genbank.good.gb“ na určenie počtu tréningových génov na školenie AUGUSTUS, nemalo by byť nízke</p> <p>braker/yourSpecies/errors/firstetraining.stderr - obsahuje chyby z prvej iterácie tréningu AUGUSTUS</p> <p>braker/yourSpecies/errors/secondetraining.stderr - obsahuje chyby z druhej iterácie tréningu AUGUSTUS</p> <p>braker/yourSpecies/errors/optimize_augustus.stderr - obsahuje chyby optimize_augustus.pl (dodatočná tréningová sada pre AUGUSTUS)</p> <p>braker/yourSpecies/errors/augustus*.stderr – obsahuje chyby vykonávania AUGUSTUS</p> <p>braker/yourSpecies/startAlign.stderr -ak ste poskytli súbor protein fasta a --prg a tento súbor nie je prázdny, počas zarovnávania bielkovín sa niečo pokazilo</p> <p>brzdič/váš druh/startAlign.stdout - môže poskytnúť indície o tom, v ktorom bode sa zosúladenie proteínu pokazilo</p> <p><em>BRAKER sa sťažuje, že súbor RNA-Seq nezodpovedá poskytnutému súboru genómu, ale som si istý, že súbory si navzájom zodpovedajú!</em></p> <p>Skontrolujte hlavičky súboru genómu FASTA. Ak sú hlavičky dlhé a obsahujú medzery, niektoré nástroje na zarovnanie RNA-Seq skrátia názvy sekvencií v súbore BAM. To vedie k chybe BRAKERA. Riešenie: skráťte/zjednodušte hlavičky FASTA v genómovom súbore pred spustením zarovnania RNA-Seq a BRAKER.</p> <p><em>V súbore train.gb sú duplicitné Loci (po použití GenomeThreader)!</em></p> <p>Tento problém vzniká, ak sa používajú zastarané verzie AUGUSTUS a BRAKER. Riešenie: Aktualizujte AUGUSTUS a BRAKER z ​​github (https://github.com/Gaius-Augustus/Augustus, https://github.com/Gaius-Augustus/BRAKER).</p> <p>a) GeneMark vyžaduje platný súbor skrytých kľúčov vo vašom domovskom adresári (</p> <p>/.gm_key). Platnosť súboru vyprší po 200 dňoch. Pred nahlásením problému v tejto súvislosti skontrolujte, či máte platný súbor kľúčov. BRAKER môže tiež vydať UPOZORNENIE, že GeneMark pravdepodobne zlyhá z dôvodu obmedzených vonkajších dôkazov. Ak uvidíte toto varovanie, neotvárajte problém, ale vyskúšajte iný prístup k anotácii svojho genómu. Môžete napríklad pridať ďalšie údaje o dôkazoch, môžete vyskúšať prístup k potrubnému mapovaniu proteínov, môžete skúsiť spustiť --esmode bez vonkajších dôkazov,.</p> <p>b) GeneMark štandardne používa na školenie iba kontigy dlhšie ako 50 tis. Ak máte veľmi fragmentovanú zostavu, môže to viesť k „žiadnym údajom“ na školenie. Predvolenú minimálnu dĺžku môžete prepísať nastavením argumentu BRAKER --min_contig=10000 .</p> <p>(c) pozri nižšie „[niečo] sa nepodarilo vykonať“.</p> <p><em>[niečo] sa nepodarilo vykonať!</em></p> <p>Pri poskytovaní ciest k softvéru spoločnosti BRAKER používajte absolútne, neskrátené cesty. BRAKER môže mať napríklad problémy s --SAMTOOLS_PATH =./ Samtools/ alebo --SAMTOOLS_PATH =</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>/ samtools/. Namiesto toho použite SAMTOOLS_PATH=/úplná/absolútna/cesta/k/samtools/ . Toto sa vzťahuje na všetky špecifikácie cesty ako možnosti príkazového riadku k braker.pl. Relatívne cesty a absolútne cesty nebudú spôsobovať problémy, ak namiesto toho exportujete premennú bash, alebo ak k svojej premennej $PATH pripojíte umiestnenie nástrojov.</p> <p><em>BRAKER nemôže nájsť Augustov skript XYZ.</em></p> <p>Aktualizujte Augusta z githubu pomocou klonu git https://github.com/Gaius-Augustus/Augustus.git. Nepoužívajte Augustus z iných zdrojov. BRAKER je veľmi závislý od aktuálneho Augusta. K vydaniam Augustus dochádza pomerne zriedkavo, aktualizácie priečinka Augustus scripts sa vyskytujú pomerne často.</p> <p><em>Je BRAKER závislý na Pythone3?</em></p> <p>Robí. Python skripty, ktoré používa BRAKER, nie sú kompatibilné s Python2.</p> <p><em>Prečo BRAKER predpovedá viac génov, ako som očakával?</em></p> <p>Ak transponovateľné prvky (alebo podobné) neboli vhodne maskované, AUGUSTUS má tendenciu predpovedať tieto prvky ako gény kódujúce proteín. To môže viesť k obrovskému počtu génov. Môžete skontrolovať, či je to tak pre váš projekt, BLASTOVANÍM (alebo DIAMONDingom) predpovedaných proteínových sekvencií proti sebe (všetci vs. všetci) a počítaním, koľko z proteínov má vysoký počet vysokokvalitných zápasov. Výstup z tejto analýzy môžete použiť na rozdelenie svojho génového súboru do dvoch skupín: gény kódujúce proteín, ktoré chcete nájsť, a opakujúce sa prvky, ktoré boli dodatočne predpovedané.</p> <p><em>Spúšťam BRAKER v Anaconde a niečo zlyhá.</em></p> <p>Aktualizujte AUGUSTUS a BRAKER z ​​githubu pomocou klonu git https://github.com/Gaius-Augustus/Augustus.git a git klonu https://github.com/Gaius-Augustus/BRAKER.git. Inštalácia Anacondy je skvelá, ale spolieha sa na vydania AUGUSTUS a BRAKER - ktoré často zaostávajú. Namiesto toho použite aktuálny kód GitHub.</p> <p>Citovať BRAKER a softvér nazývaný BRAKER</p> <p>Pretože BRAKER je potrubím, ktoré volá niekoľko nástrojov bioinformatiky, zverejnenie výsledkov získaných spoločnosťou BRAKER vyžaduje, aby bol citovaný nielen BRAKER, ale aj nástroje, ktoré BRAKER nazýva. BRAKER vygeneruje súbor what-to-cite.txt v pracovnom adresári BRAKER, ktorý vás informuje o tom, ktoré presné zdroje sa vzťahujú na váš beh.</p> <p>Bruna, T., Hoff, K.J., Lomsadze, A., Stanke, M., & amp Borodovsky, M. (2021). BRAKER2: Automatická anotácia eukaryotického genómu s GeneMark-EP+ a AUGUSTUS podporovaná databázou proteínov. NAR Genomika a bioinformatika 3 (1): lqaa108, doi: 10,1093/nargab/lqaa108.</p> <p>Hoff, K.J., Lomsadze, A., Borodovsky, M. a Stanke, M. (2019). Anotácia celého genómu s BRAKER. Metódy Mol Biol. 1962: 65-95, doi: 10,1007/978-1-4939-9173-0_5.</p> <p>Hoff, K.J., Lange, S., Lomsadze, A., Borodovsky, M. a Stanke, M. (2016). BRAKER1: nekontrolovaná anotácia genómu na báze RNA-Seq s GeneMark-ET a AUGUSTUS. Bioinformatics, 32 (5): 767-769.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Stanke, M., Diekhans, M., Baertsch, R. a Haussler, D. (2008). Použitie natívnych a syntenicky mapovaných zarovnaní cDNA na zlepšenie nájdenia génu de novo. Bioinformatika, doi: 10.1093/bioinformatics/btn013.</p> <p>Stanke. M., Schöffmann, O., Morgenstern, B. a Waack, S. (2006). Génová predikcia v eukaryotoch so zovšeobecneným skrytým Markovovým modelom, ktorý používa rady z externých zdrojov. BMC Bioinformatics 7, 62.</p> <p>Ak BRAKER vykonal akýkoľvek druh školenia AUGUSTUS, starostlivo skontrolujte, či ste BRAKER nakonfigurovali na používanie NCBI BLAST alebo DIAMOND. Jeden z nich bol použitý na odfiltrovanie nadbytočných tréningových génových štruktúr.</p> <p>Ak ste použili NCBI BLAST, uveďte prosím:</p> <p>Altschul, A.F., Gish, W., Miller, W., Myers, E.W. a Lipman, D.J. (1990). Základný nástroj na vyhľadávanie lokálneho zarovnania. J Mol Biol 215: 403-410.</p> <p>Camacho, C., Coulouris, G., Avagyan, V., Ma, N., Papadopoulos, J., Bealer, K. a Madden, T.L. (2009). Blast+: architektúra a aplikácie. BMC bioinformatika, 10(1):421.</p> <p>Ak ste použili DIAMOND, uveďte prosím:</p> <ul> <li>Buchfink, B., Xie, C., Huson, D.H. (2015). Rýchle a citlivé zarovnanie bielkovín pomocou DIAMOND. Nature Methods 12:59-60.</li></ul> <p>Ak bol BRAKER vykonaný so súborom genómu a neexistujú žiadne vonkajšie dôkazy, citujte, potom sa použil GeneMark-ES, citujte:</p> <p>Lomsadze, A., Ter-Hovhannisyan, V., Chernoff, Y.O. a Borodovský, M. (2005). Identifikácia génov v nových eukaryotických genómoch pomocou samotréningového algoritmu. Výskum nukleových kyselín, 33 (20): 6494-6506.</p> <p>Ter-Hovhannisyan, V., Lomsadze, A., Chernoff, Y.O. a Borodovský, M. (2008). Génová predikcia v nových hubových genómoch pomocou ab initio algoritmu s nekontrolovaným tréningom. Výskum genómu, strany gr--081612, 2008.</p> <p>Ak bol BRAKER spustený s proteínmi akejkoľvek fylogenetickej vzdialenosti (--epmode alebo --etpmode), uveďte všetky nástroje, ktoré používa potrubie ProtHint na generovanie rád:</p> <p>Bruna, T., Lomsadze, A., & amp Borodovsky, M. (2020). GeneMark-EP+: predikcia eukaryotického génu so samotrénovaním v priestore génov a proteínov. NAR Genomika a bioinformatika, 2 (2), lqaa026.</p> <p>Buchfink, B., Xie, C., Huson, D.H. (2015). Rýchle a citlivé zarovnanie proteínov pomocou DIAMONDU. Nature Methods 12:59-60.</p> <p>Lomsadze, A., Ter-Hovhannisyan, V., Chernoff, Y.O. a Borodovský, M. (2005). Identifikácia génu v nových eukaryotických genómoch algoritmom samocvičenia. Výskum nukleových kyselín, 33 (20): 6494-6506.</p> <p>Iwata, H. a Gotoh, O. (2012). Porovnávacie programy zosúladeného spojenia vrátane programu Spaln2, rozšírenej verzie programu Spaln, ktorá obsahuje ďalšie funkcie špecifické pre jednotlivé druhy. Výskum nukleových kyselín, 40 (20), e161-e161.</p> <p>Gotoh, O., Morita, M., Nelson, D. R. (2014). Posúdenie a zdokonalenie predikcie eukaryotickej génovej štruktúry pomocou zarovnania viacerých proteínových sekvencií, ktoré si uvedomujú génovú štruktúru. BMC bioinformatika, 15(1), 189.</p> <p>Ak bol BRAKER vykonaný so zarovnaním RNA-Seq v bam formáte, potom sa použil SAMtools, citujte:</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Li, H., Handsaker, B., Wysoker, A., Fennell, T., Ruan, J., Homer, N., Marth, G., Abecasis, G., Durbin, R. 1000 Genome Project Data Processing Subgroup (2009). Formát zarovnania/mapy sekvencie a nástroje SAMtool. Bioinformatika, 25 (16): 2078-9.</p> <p>Barnett, D.W., Garrison, E.K., Quinlan, A.R., Strömberg, M.P. a Marth G.T. (2011). BamTools: C ++ API a sada nástrojov na analýzu a správu súborov BAM. Bioinformatics, 27 (12): 1691-2</p> <p>Ak BRAKER použil na generovanie sady cvičných génov zarovnania RNA-Seq, citujte GeneMark-ET:</p> <ul> <li>Lomsadze, A., Paul D.B. a Mark B. (2014) Integrácia mapovaných Rna-Seq číta do automatického školenia algoritmu na hľadanie eukaryotických génov. Nucleic Acids Research 42(15): e119--e119</li></ul> <p>Ak bol BRAKER vykonaný s proteínmi blízko príbuzných druhov, citujte GenomeThreader:</p> <p>Ak BRAKER nazval MakeHub na vytvorenie centra údajov o dráhe na vizualizáciu výsledkov BRAKER pomocou prehliadača genómu UCSC, citujte:</p> <ul> <li>Hoff, K.J. (2019) MakeHub: Plne automatizovaná generácia centier zhromažďovania prehľadávačov genómu UCSC. Genomika, proteomika a bioinformatika, v tlači 2020, predtlač na bioarXive, doi: https://doi.org/10.1101/550145.</li></ul> <p>Ak BRAKER zavolal GUSHR na generovanie UTR, citujte:</p> <p>Keilwagen, J., Hartung, F., Grau, J. (2019) GeMoMa: Predikcia génov založená na homológii s využitím konzervácie polohy intrónu a údajov RNA-seq. Metódy Mol Biol. 1962:161-177, doi: 10.1007/978-1-4939-9173-0_9.</p> <p>Keilwagen, J., Wenk, M., Erickson, J.L., Schattat, M.H., Grau, J., Hartung F. (2016) Použitie konzervácie polohy intrónu na génovú predikciu založenú na homológii. Výskum nukleových kyselín, 44 (9): e89.</p> <p>Keilwagen, J., Hartung, F., Paulini, M., Twardziok, S.O., Grau, J. (2018) Kombinácia údajov o RNA-seq a génovej predikcie založenej na homológii pre rastliny, zvieratá a huby. BMC Bioinformatics, 19 (1): 189.</p> <p>Všetky zdrojové kódy, t. j. scripts/*.pl alebo scripts/*.py sú pod umeleckou licenciou (pozri http://www.opensource.org/licenses/artistic-license.php).</p> <p><b>[F1]</b> EX = ES/ET/EP/ETP, všetky sú dostupné na stiahnutie pod názvom <em>GeneMark-ES/ET/EP</em> ↩ </p> <p><b>[F2]</b> Použite najnovšiu verziu z hlavnej vetvy AUGUSTUS distribuovanú pôvodnými vývojármi, ktorá je k dispozícii na github na https://github.com/Gaius-Augustus/Augustus. Problémy boli hlásené od používateľov, ktorí sa pokúsili spustiť BRAKER s vydaniami AUGUSTUS udržiavanými tretími stranami, t.j. Bioconda. ↩ </p> <p><b>[F3]</b> V tomto vydaní nebolo testované, namiesto toho odporúčame použiť GenomeThreader ↩ </p> <p><b>[F4]</b> nainštalujte pomocou sudo apt-get install cpanminus ↩ </p> <p><b>[F5]</b> GeneMark-EX nie je povinným nástrojom, ak sa má AUGUSTUS školiť z vyrovnaní GenomeThreader s možnosťou --trainFromGth. ↩ </p> <p><b>[F6]</b> Binárna môže napr. zdržiavajte sa v bamtools/build/src/sade nástrojov ↩ </p> <p><b>[R0]</b> Tomáš Bruna, Katharina J. Hoff, Alexandre Lomsadze, Mario Stanke a Mark Borodvsky. 2021. „BRAKER2: automatická anukcia eukaryotického genómu s GeneMark-EP+ a AUGUSTUS podporovaná databázou bielkovín.“ <em>Genomika a bioinformatika NAR</em> 3 (1): lqaa108. ↩ </p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p><b>[R1]</b> Hoff, Katharina J, Simone Lange, Alexandre Lomsadze, Mark Borodovsky a Mario Stanke. 2015. „BRAKER1: Anotácia genómu založená na Rna-Seq bez dozoru s Genemark-et a Augustus.“ <em>Bioinformatika</em> 32 (5). Oxford University Press: 767--69. ↩ </p> <p><b>[R2]</b> Lomsadze, Alexandre, Paul D Burns a Mark Borodovsky. 2014. “Integrácia mapovaného Rna-Seq Reads do automatického tréningu algoritmu hľadania eukaryotických génov.” <em>Výskum nukleových kyselín</em> 42 (15). Oxford University Press: e119-e119. ↩ </p> <p><b>[R3]</b> Stanke, Mario, Mark Diekhans, Robert Baertsch a David Haussler. 2008. „Používanie natívnych a synteticky mapovaných zarovnaní cDNA na zlepšenie de Novo Gene Finding.“ <em>Bioinformatika</em> 24 (5). Oxford University Press: 637-44. ↩ </p> <p><b>[R4]</b> Stanke, Mario, Oliver Schöffmann, Burkhard Morgenstern a Stephan Waack. 2006. „Génová predpoveď v eukaryotoch so zovšeobecneným skrytým Markovovým modelom, ktorý používa rady z externých zdrojov.“ <em>Bioinformatika BMC</em> 7 (1). BioMed Central: 62. ↩ </p> <p><b>[R5]</b> Barnett, Derek W, Erik K Garrison, Aaron R Quinlan, Michael P Strömberg a Gabor T Marth. 2011. „BamTools: C ++ Api a sada nástrojov na analýzu a správu súborov Bam.“ <em>Bioinformatika</em> 27 (12). Oxford University Press: 1691–2. ↩ </p> <p><b>[R6]</b> Li, Heng, Handsaker, Bob, Alec Wysoker, Tim Fennell, Jue Ruan, Nils Homer, Gabor Marth, Goncalo Abecasis a Richard Durbin. 2009. „Zarovnanie sekvencií/formát mapy a nástroje Samtools.“ <em>Bioinformatika</em> 25 (16). Oxford University Press: 2078-209. ↩ </p> <p><b>[R7]</b> Gremme, G. 2013. „Predpoveď výpočtovej štruktúry génu“. Dizertačná práca, Universität Hamburg. ↩ </p> <p><b>[R8]</b> Gotoh, Osamu. 2008a. "Priestorovo efektívna a presná metóda na mapovanie a zarovnávanie sekvencií cDNA s genómovou sekvenciou." <em>Výskum nukleových kyselín</em> 36 (8). Oxford University Press: 2630–8. ↩ </p> <p><b>[R9]</b> Iwata, Hiroaki a Osamu Gotoh. 2012. „Benchmarkingové programy zarovnania spojenia vrátane Spaln2, rozšírenej verzie programu Spaln, ktorá obsahuje ďalšie funkcie špecifické pre druh.“ <em>Výskum nukleových kyselín</em> 40 (20). Oxford University Press: e161--e161. ↩ </p> <p><b>[R10]</b> Osamu Gotoh. 2008b. "Priame mapovanie a zarovnanie proteínových sekvencií s genómovou sekvenciou." <em>Bioinformatika</em> 24 (21). Oxford University Press: 2438---44. ↩ </p> <p><b>[R11]</b> Slater, Guy St C a Ewan Birney. 2005. „Automatizovaná generácia heuristiky na porovnávanie biologických sekvencií.“ <em>Bioinformatika BMC</em> 6 ods. BioMed Central: 31. ↩ </p> <p><b>[R12]</b> Altschul, S.F., W. Gish, W. Miller, E.W. Myers a D.J. Lipman. 1990. „Nástroj na vyhľadávanie základných miestnych zarovnaní“. <em>Časopis molekulárnej biológie</em> 215:403--10. ↩ </p> <p><b>[R13]</b> Camacho, Christiam a kol. 2009. „BLAST+: architektúra a aplikácie.“ <em>Bioinformatika BMC</em> 1(1): 421. ↩ </p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p><b>[R14]</b> Lomsadze, A., V. Ter-Hovhannisyan, Y.O. Chernoff a M. Borodovský. 2005. „Identifikácia génu v nových eukaryotických genómoch algoritmom samočinného výcviku.“ <em>Výskum nukleových kyselín</em> 33 (20): 6494-6506. doi: 10,1093/nar/gki937. ↩ </p> <p><b>[R15]</b> Ter-Hovhannisyan, Vardges, Alexandre Lomsadze, Yury O Chernoff a Mark Borodovsky. 2008. „Predpoveď génov v nových hubových genómoch pomocou algoritmu Ab Initio s tréningom bez dozoru“. <em>Výskum genómu</em>. Cold Spring Harbor Lab, gr-081612. ↩ </p> <p><b>[R16]</b> Hoff, K.J. 2019. MakeHub: Plne automatizovaná generácia centier zhromažďovania prehľadávačov genómu UCSC. <em>Genomika, proteomika a bioinformatika</em>, v tlači, predtlač na bioarXive, doi: https://doi.org/10.1101/550145. ↩ </p> <p><b>[R17]</b> Bruna, T., Lomsadze, A., & amp Borodovsky, M. 2020. GeneMark-EP+: predikcia eukaryotického génu s vlastným tréningom v priestore génov a proteínov. NAR Genomika a bioinformatika, 2 (2), lqaa026. doi: https://doi.org/10.1093/nargab/lqaa026. ↩ </p> <p><b>[R18]</b> Kriventseva, EV, Kuznetsov, D., Tegenfeldt, F., Manni, M., Dias, R., Simão, FA, and Zdobnov, EM 2019. OrthoDB v10: sampling theiversity of animal, plant, fungal, protist, bakterial a vírusové genómy pre evolučné a funkčné anotácie ortológov. Nucleic Acids Research, 47(D1), D807-D811. ↩ </p> <p><b>[R19]</b> Keilwagen, J., Hartung, F., Grau, J. (2019) GeMoMa: Génová predikcia založená na homológii využívajúca konzerváciu polohy intrónu a údaje o RNA-seq. Metódy Mol Biol. 1962: 161-177, doi: 10,1007/978-1-4939-9173-0_9. ↩ </p> <p><b>[R20]</b> Keilwagen, J., Wenk, M., Erickson, J.L., Schattat, M.H., Grau, J., Hartung F. (2016) Použitie konzervácie polohy intrónu na génovú predikciu založenú na homológii. Nucleic Acids Research, 44(9):e89. ↩ </p> <p><b>[R21]</b> Keilwagen, J., Hartung, F., Paulini, M., Twardziok, S.O., Grau, J. (2018) Kombinácia údajov RNA-seq a predikcie génov na základe homológie pre rastliny, zvieratá a huby. BMC Bioinformatics, 19(1):189. ↩ </p> <br> <h2>Staré správy</h2> <p>Nedávne vydania Biopythonu vyžadujú NumPy (a nie číselné):</p> <ul> 15 Mb – Source Tarball 16 Mb – Source Zip File </ul><ul> 15 Mb - zdroj Tarball 16 MB - zdrojový súbor ZIP 2 MB - 32 -bitový inštalátor Windows .exe pre Python 2.7 a NumPy 1.11.0 2 MB - 32 bitový inštalátor Windows .msi pre Python 2.7 a NumPy 1.11.0 2 MB - 32 -bitový inštalátor Windows .exe pre Python 3.3 a NumPy 1.10.2 2Mb – 32-bitový inštalačný program Windows .msi pre Python 3.3 a NumPy 1.10.2 2Mb – 32-bitový inštalačný program Windows .exe pre Python 3.4 a NumPy 1.11.0 Windows3 pre 4y msi 2Mb and NumPy 1.11.0 3Mb - 32 bit Windows .exe Installer for Python 3.5 and NumPy 1.11.1 3Mb - 32 bit Windows .msi Installer for Python 3.5 and NumPy 1.11.1 2Mb - 32 bit Windows .exe Installer for Python 3.6 and NumPy 1.11.3 2Mb – 32-bitový inštalátor Windows .msi pre Python 3.6 a NumPy 1.11.3 </ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> 14 Mb - zdroj Tarball 15 Mb - zdrojový súbor ZIP 2 MB - 32 -bitový inštalátor Windows .exe pre Python 2.6 a NumPy 1.8.2 2 MB - 32 bitový inštalátor Windows .exe pre Python 2.7 a NumPy 1.11.0 2 MB - 32 bitový inštalátor Windows .msi pre Inštalátor Python 2.7 a NumPy 1.11.0 2Mb - 32 -bitový Windows .exe pre Python 3.3 a NumPy 1.10.2 2Mb - 32 -bitový inštalátor Windows .msi pre Python 3.3 a NumPy 1.10.2 2Mb - 32 -bitový inštalátor Windows .exe pre Python 3.4 and NumPy 1.11.0 2Mb - 32 bit Windows .msi Installer for Python 3.4 and NumPy 1.11.0 2Mb - 32 bit Windows .exe Installer for Python 3.5 and NumPy 1.11.1 2Mb - 32 bit Windows .msi Installer for Python 3.5 and NumPy 1.11.1 </ul><ul> 14Mb – Source Tarball 15Mb – Source Zip File 2Mb – 32-bitový Windows .exe Inštalátor pre Python 2.6 a NumPy 1.8.2 2Mb – 32-bitový Windows .msi Inštalačný program pre Python 2.6 a NumPy 1.8.2 2Mb – 3.exe Python 2.7 a NumPy 1.9.1 2Mb – 32-bitový inštalátor Windows .exe pre Python 2.7 a NumPy 1.9.1 2Mb – 32-bitový inštalačný program Windows .exe pre Python 3.3 a NumPy 1.9.1 2Mb – Windows 3Mb – Windows 32 Installer pre Python 3.exe 32 a NumPy 1.9.1 2Mb - 32 -bitový inštalátor Windows .exe pre Python 3.4 a NumPy 1.9.1 2Mb - 32 -bitový inštalátor Windows .msi pre Python 3.4 a NumPy 1.9.1 2Mb - 32 -bitový inštalátor Windows .exe pre Python 3.4 a NumPy 1.9.3 2Mb - 32 -bitový inštalátor Windows .msi pre Python 3.4 a NumPy 1.9.3 </ul><ul> 14Mb – Source Tarball 15Mb – Source Zip File 2Mb – 32-bitový Windows .exe Inštalátor pre Python 2.6 a NumPy 1.8.2 2Mb – 32-bitový Windows .exe Inštalačný program pre Python 2.7 a NumPy 1.9.1 2Mb – .exe 32 bit Python 3.3 a NumPy 1.9.1 2Mb - 32 -bitový inštalátor Windows .exe pre Python 3.4 a NumPy 1.9.1 2Mb - 32 -bitový inštalátor Windows .exe pre Python 3.5 2Mb - 32 -bitový inštalátor Windows .msi pre Python 3.5 </ul><ul> 13Mb - Source Tarball 14Mb - Zdrojový súbor ZIP 2Mb - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.8.2 2Mb - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.9.1 2Mb - 32 -bitový inštalátor systému Windows pre Python 3.3 a NumPy 1.9. 1 2Mb - 32 -bitový inštalátor systému Windows pre Python 3.4 a NumPy 1.9.1 </ul><ul> 12Mb - Source Tarball 13Mb - Zdrojový súbor ZIP 2Mb - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.8.1 2Mb - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.8.1 2Mb - 32 -bitový inštalátor systému Windows pre Python 3.3 a NumPy 1.8. 1 2Mb – 32-bitový inštalátor systému Windows pre Python 3.4 a NumPy 1.8.1 </ul><ul> 11Mb – Source Tarball 12Mb – Source Zip File 2Mb – 32-bitový Inštalátor systému Windows pre Python 2.6 a NumPy 1.7 2Mb – 32-bitový Inštalačný program systému Windows pre Python 2.7 a NumPy 1.7 2Mb – 32-bitový Inštalátor systému Windows pre Python 2.6 a NumPy 1.7 </ul><ul> 11 123 Kb – Source Tarball 12 111 Kb – Zdrojový súbor ZIP 1 877 Kb – 32-bitový Inštalátor systému Windows pre Python 2.6 a NumPy 1.7 2 003 Kb – 32-bitový Inštalačný program systému Windows pre Python 2.7 a NumPy 3.03-bitový systém Windows 3,05 1,7-bitový – Windows 2 </ul><ul> 11 123 Kb - Zdroj Tarball 12 111 Kb - Zdrojový súbor ZIP 1 852 Kb - 32 -bitový inštalátor systému Windows pre Python 2.5 a NumPy 1, 1 1877 Kb - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.3 2 003 Kb - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.5 2 005 Kb - 32 -bitový inštalátor systému Windows pre Python 3.3 a NumPy 1.7 </ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> 10 658 Kb - zdroj Tarball (<em>beta vydanie</em>, 15. júl 2013) 11 607 kb – zdrojový súbor ZIP 1 661 kb – 32-bitový inštalačný program systému Windows pre Python 2.5 a NumPy 1.1 1 686 kb – 32-bitový inštalačný program systému Windows pre Python 2.6 a NumPy 2.8. pre 13. bitovú verziu systému P3 a 5.8 Py 133 kb 1m 1 814 Kb - 32 -bitový inštalátor systému Windows pre Python 3.3 a NumPy 1.7 </ul><ul> 10 311 Kb - Source Tarball (5. februára 2013) 11 198 Kb - Zdrojový súbor ZIP 1 612 Kb - 32 -bitový inštalátor systému Windows pre Python 2.5 a NumPy 1, 1 637 Kb - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.3 1 764 kB - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.5 1 757 Kb – 32-bitový inštalátor systému Windows pre Python 3.2 a NumPy 1.5 (<em>beta</em> stav na testovanie) 1 750 Kb - 32 -bitový inštalátor systému Windows pre Python 3.3 a NumPy 1.7 (<em>beta</em> stav na testovanie) </ul><ul> 9 280 kB – Source Tarball (25. júna 2012) 10 051 kB – Zdrojový súbor ZIP 1 469 Kb – 32-bitový inštalačný program systému Windows pre Python 2.5 a NumPy 1.1 1 492 kB – 32-bitový inštalačný program systému Windows pre Python 2 Kb 13 bit 2,16 a NumPy 16-13 Windows Inštalátor pre Python 2.7 a NumPy 1,5 1 611 Kb - 32 -bitový inštalátor systému Windows pre Python 3.2 a NumPy 1.5 (<em>beta</em> stav na testovanie) </ul><ul> 8 377 Kb - Source Tarball (24. februára 2012) 9 127 Kb - Zdrojový súbor ZIP 1 440 Kb - 32 -bitový inštalátor systému Windows pre Python 2.5 a NumPy 1.1 1 463 Kb - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.3 1 590 Kb - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.5 </ul><ul> 7 847 Kb - Source Tarball (18. augusta 2011) 8 474 Kb - Zdrojový súbor ZIP 1 427 Kb - 32 -bitový inštalátor systému Windows pre Python 2.4 (ktorý už oficiálne nepodporujeme) a NumPy 1,1 1428 kB - 32 -bitový inštalátor systému Windows pre Python 2.5 a NumPy 1.1 1 450 Kb - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.3 1 577 kB - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.5 </ul><ul> 6 783 Kb - Source Tarball (2. apríla 2011) 7 446 Kb - Zdrojový súbor ZIP 1 405 Kb - 32 -bitový inštalátor systému Windows pre Python 2.4 (ktorý už oficiálne nepodporujeme) a NumPy 1,1 1405 kB - 32 -bitový inštalátor systému Windows pre Python 2.5 a NumPy 1.1 1 428 Kb - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.3 1 555 Kb - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.5 </ul><ul> 6 778 Kb - Source Tarball (26. novembra 2010) 7 347 Kb - Zdrojový súbor ZIP 1 429 Kb - 32 -bitový inštalátor systému Windows pre Python 2.4 a NumPy 1, 1 1429 Kb - 32 -bitový inštalátor systému Windows pre Python 2.5 a NumPy 1.1 1 451 kB - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.3 1578 Kb - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.5 </ul><ul> 6 493 Kb – Source Tarball (31. august 2010) 7 058 Kb – Zdrojový súbor ZIP 1 448 Kb – 32-bitový Inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 449 Kb – 32-bitový Inštalačný program systému Windows pre Python 2.1, 131-bitový Windows 131-bitový a 41,5-bitový Python 2.6 a NumPy 1.3 1598 Kb - 32 -bitový inštalátor systému Windows pre Python 2.7 a NumPy 1.5 </ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <ul> 6 428 Kb - Source Tarball (18. augusta 2010) 6 996 Kb - Zdrojový súbor ZIP 1 451 Kb - 32 -bitový inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 451 kB - 32 -bitový inštalátor systému Windows pre Python 2.5 a NumPy 1.1 1 474 kB - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.3 </ul><ul> 6 295 Kb – Source Tarball (20. mája 2010) 6 859 Kb – Zdrojový súbor ZIP 1 434 Kb – 32-bitový Inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 434 Kb – 32-bitový Inštalačný program systému Windows pre Python a 2.47 Kb 2,5 15 bitov pre Python 2.6 a NumPy 1.3 </ul><ul> 6 554 Kb – Source Tarball (2. apríla 2010) 7 118 Kb – Zdrojový súbor ZIP 1 426 Kb – 32-bitový Inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 427 Kb – 32-bitový Inštalačný program systému Windows pre Python a NumPy 2.46 Kb 2,5 15 pre Python 2.6 a NumPy 1.3 </ul><ul> 4 185 Kb - Source Tarball (15. december 2009) 4 652 Kb - Zdrojový súbor ZIP 1 129 Kb - 32 -bitový inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 130 Kb - 32 -bitový inštalátor systému Windows pre Python 2.5 a NumPy 1.1 1 155 Kb - 32 -bitový inštalátor systému Windows pre Python 2.6 a NumPy 1.3 </ul><ul> 5 486 kB – Source Tarball (22. septembra 2009) 5 930 kB – Zdrojový súbor ZIP 1 107 Kb – 32-bitový Inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 108 Kb – 32-bitový Inštalačný program systému Windows pre 5 a 4 bitov KB 12. pre Python 2.6 a NumPy 1.3 </ul><ul> 5 428 Kb - Source Tarball (17. augusta 2009) 5 922 Kb - Zdrojový súbor ZIP 1 166 Kb - Inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 167 Kb - Inštalátor systému Windows pre Python 2.5 a NumPy 1.1 1 206 Kb - Inštalátor systému Windows pre Python 2.6 a NumPy 1.3 </ul><ul> 5 172 Kb - Source Tarball (23. júna 2009) 5 605 Kb - Súbor ZIP so zdrojovým kódom 1 161 Kb - Inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 161 Kb - Inštalátor systému Windows pre Python 2.5 a NumPy 1.1 1 199 Kb - Inštalátor systému Windows pre Python 2.6 a NumPy 1.3 </ul><ul> 4 550 kB – Source Tarball (20. apríla 2009) 4 988 kB – Zdrojový súbor ZIP 1 228 kB – Inštalátor systému Windows pre Python 2.3 a NumPy 1.1 1 232 kB – Inštalačný program systému Windows pre Python 2.4 a NumPy 2. Inštalačný systém Windows 12 a NumPy 1.53 Py1 pre Windows 151 Py, 151 Pyth 1 1 270 Kb - Inštalátor systému Windows pre Python 2.6 a NumPy 1.3 </ul><ul> 4 788 Kb (3. apríla 2009) 5 250 Kb 1 226 Kb - Inštalátor systému Windows pre Python 2.3 a NumPy 1.1 1 230 Kb - Inštalátor systému Windows pre Python 2.4 a NumPy 1, 1 1 230 Kb - Inštalátor systému Windows pre Python 2.5 a NumPy 1, 1 1288 Kb - Inštalátor systému Windows pre Python 2.6 a NumPy 1.3 </ul><ul> 4 052 Kb (21. novembra 2008) 4 498 Kb 1 111 Kb - Inštalátor systému Windows pre Python 2.3 a NumPy 1.1 1 115 Kb - Inštalátor systému Windows pre Python 2.4 a NumPy 1.1 1 115 Kb - Inštalátor systému Windows pre Python 2.5 a NumPy 1.1 </ul><ul> 4 331 Kb (7. november 2008) 4 780 Kb 1 109 Kb - Windows Installer pre Python 2.3 a NumPy 1.1 1 113 Kb - Windows Installer pre Python 2.4 a NumPy 1.1 1 114 Kb - Windows Installer pre Python 2.5 a NumPy 1.1 </ul> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <p>Upozorňujeme, že Biopython 1.48 a starší vyžadujú numerickú knižnicu, nie jej náhradu NumPy. Inštalátory systému Windows pre Python 2.4 a staršie sú dostupné na webovej stránke Numerical Python. Inštalátor systému Windows pre Numeric 24.2 pre Python 2.5 je k dispozícii tu:</p> <p>Upozorňujeme, že Biopython 1.48 a starší v niektorých analyzátoroch používali mxTextTools 2.0. S mxTextTools 3.0 sa vyskytlo niekoľko problémov, takže ideálne nainštalujte staršie mxTextTools 2.0.</p> <br> <h2>I/O funkcie</h2> <p>Obálky pre podporované formáty súborov sú k dispozícii na najvyššej úrovni modulu:</p> <p>Podobne ako SeqIO a AlignIO, aj tento modul poskytuje štyri I/O funkcie: parse() , read() , write() a convert() . Každá funkcia akceptuje buď názov súboru, alebo otvorený popisovač súboru, takže údaje je možné načítať aj z komprimovaných súborov, objektov StringIO atď. Ak je názov súboru odoslaný ako reťazec, súbor sa automaticky zatvorí, keď sa funkcia skončí inak, za zatvorenie popisovača zodpovedáte sami.</p> <p>Druhým argumentom pre každú funkciu je cieľový formát. V súčasnosti sú podporované nasledujúce formáty:</p> <p>Ďalšie príklady použitia objektov stromu nájdete na stránke PhyloXML.</p> <h3>Analyzovať ()</h3> <p>Postupne analyzujte každý strom v danom súbore alebo popisovači a vráťte iterátor Tree objektov (t. j. niektorú podtriedu triedy Bio.Phylo.BaseTree Tree, v závislosti od formátu súboru).</p> <p>Ak existuje iba jeden strom, vráti ho metóda next () vo výslednom generátore.</p> <p>Všimnite si toho, že to okamžite neodhalí, či ešte existujú nejaké stromy - ak to chcete overiť, použite namiesto toho read ().</p> <p>Analyzujte a vráťte presne jeden strom z daného súboru alebo popisovača. Ak súbor obsahuje nula alebo viac stromov, vyvolá sa chyba ValueError. Je to užitočné, ak viete, že súbor obsahuje iba jeden strom, aby ste tento stromový objekt načítali priamo, nie pomocou analýzy () a next (), a ako bezpečnostnú kontrolu, či vstupný súbor v skutočnosti obsahuje presne jeden fylogenetický strom špičková úroveň.</p> <p>Ak už máte svoje stromové údaje načítané ako reťazec Pythonu, môžete ich analyzovať pomocou StringIO (v štandardnej knižnici Pythonu):</p> <p>Ostatné funkcie I/O je možné použiť aj so systémom StringIO.</p> <p>(Všeobecný tip: ak píšete do objektu StringIO a chcete si znova prečítať obsah, budete musieť zavolať metódu seek (0), aby sa rukoväť presunula späť na začiatok údajov StringIO-to isté ako otvorené Pozrite si príklady v testoch jednotiek pre Phylo v zdrojovom kóde Biopythonu.</p> <h3>Napísať ()</h3> <p>Napíšte sekvenciu objektov Tree do daného súboru alebo popisovača. Odovzdať jeden stromový objekt namiesto zoznamu alebo iterovateľného bude tiež fungovať (pozri, Phylo je priateľský).</p> <h3>Previesť ()</h3> <p>Vzhľadom na dva súbory (alebo popisovače) a dva formáty, oba podporované programom Bio.Phylo, preveďte prvý súbor z prvého formátu do druhého formátu a zapíšte výstup do druhého súboru.</p> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <h3>Pod-moduly</h3> <p>V module Phylo sú analyzátory a zapisovače pre konkrétne formáty súborov, ktoré sú v súlade so základným rozhraním API najvyššej úrovne a niekedy pridávajú ďalšie funkcie.</p> <p><strong>PhyloXMLIO:</strong> Podpora formátu phyloXML. Podrobnosti nájdete na stránke PhyloXML.</p> <p><strong>NeXMLIO:</strong> Podpora formátu NeXML.</p> <p><strong>NewickIO:</strong> Port analyzátora v Bio.Nexus.Trees na podporu formátu Newick (známy aj ako New Hampshire) prostredníctvom rozhrania Phylo API.</p> <p><strong>NexusIO:</strong> Obal okolo Bio.Nexus na podporu formátu stromu Nexus.</p> <p><strong>CDAOIO:</strong> Podpora pre porovnávaciu dátovú analýzu ontológie (CDAO). Vyžaduje RDFlib.</p> <p>Formát Nexus skutočne obsahuje niekoľko podformátov na reprezentáciu stromov pre rôzne druhy údajov. Nexus poskytuje blok obsahujúci niektoré metadáta a jeden alebo viac stromov Newick (iný typ bloku Nexus môže predstavovať zarovnania, o ktoré sa stará v programe AlignIO. Takže na analýzu Kompletný súbor Nexus so všetkými spracovanými typmi blokov, použite priamo Bio.Nexus a na extrakciu iba stromov použite Bio.Phylo.</p> <br> <h2>Implementácia</h2> <p>Primárnymi cieľmi návrhu pre NuclearBLAST bolo poskytnúť biológom centralizovaný systém, v ktorom je možné ľahko vytvárať a získavať výsledky BLAST, systém ukladania relačných databáz, ktorý je možné ľahko ťažiť na porovnávacie analýzy, a program, ktorý by využíval výhody zoskupených počítačových zdrojov na zvýšenie priepustnosť veľkých BLAST úloh. Sekundárnym cieľom bolo navrhnúť riešenie, ktoré by bolo otvorené a voľne dostupné. To nás viedlo k tomu, že sme pri implementácii NuclearBLAST prednostne využívali množstvo softvérových balíkov s otvoreným zdrojovým kódom vrátane BioPerl, Apache, PHP a MySQL, ako aj používanie Linuxu ako základného operačného systému [2-5].</p> <p>Ako rozhranie pre NuclearBLAST bol vybraný webový prehliadač, pretože poskytuje široko používané, rozpoznateľné, globálne dostupné rozhranie nezávislé od platformy. Webový server Apache poskytuje kontrolu prístupu a šifrované pripojenia, ak si používateľ želá zabezpečiť svoju inštaláciu. BioPerl poskytuje modul analýzy pre vrátené výsledky BLAST, ktoré sa potom načítajú do databázy MySQL. Všetky informácie o požadovaných vyhľadávaniach BLAST sa načítajú do databázy a v databáze sa sleduje stav každého dotazu v úlohe. Tento návrh programu klientskeho servera umožňuje použitie viacerých počítačov vykonávajúcich analýzy BLAST v klastrovom prostredí pomocou softvérového balíka na správu úloh, ako je PBS (Portable Batch System) [6]. NuclearBLAST môže byť zoskupený tak málo, ako niekoľko laboratórnych počítačov používaných ako pracovné uzly v čase ich odstávky alebo rovnako ako vyhradená počítačová farma. Minimálna inštalácia NuclearBLAST vyžaduje typický počítač pracovnej stanice, ktorý funguje ako server aj ako pracovník.</p> <p>Aby sme udržali databázu MySQL na zvládnuteľnej veľkosti a znížili nadbytočné dáta v systéme, rozhodli sme sa použiť databázový formát BLAST ako jediné úložisko sekvenčných informácií v programe. V databáze MySQL sú uložené iba názvy sekvencií v rámci každého súboru údajov a minimálne množstvo metadát. Tiež sme minimalizovali veľkosť databázy uložením všetkých štatistík výsledkov do databázy, s výnimkou skutočných zarovnaní. Na požiadanie sa zarovnania znova vytvoria za behu extrahovaním dvoch sekvencií z databáz BLAST a ich vzájomným odstrelením pomocou bl2seq.</p> <br> <h2>1.7: Príkazový riadok BLAST - Biológia</h2> <p><img src=""></p> <p><strong>Beta verzia:</strong> <strong>Majster GitHub:</strong></p> <p>SequenceServer - vyhľadávanie BLAST je jednoduché!</p> <p>SequenceServer vám umožňuje rýchlo nastaviť server BLAST+ s intuitívnym používateľským rozhraním na osobné alebo skupinové použitie.</p> <p>Ak používate server SequenceServer, citujte:</p> <p>Pokyny na inštaláciu a spôsob použitia servera SequenceServer nájdete na stránke https://sequenceserver.com/#installation.</p> <p>Ak chcete spustiť SequenceServer priamo zo zdrojového kódu, pozrite si časť „Vývoj a prispievanie“ nižšie.</p> <p>SequenceServer 2.0 obsahuje tri nové vizualizácie, ktoré pomáhajú interpretovať výsledky BLAST, umožňuje zdieľanie výsledkov BLAST a vizualizáciu externe generovaného súboru BLAST XML (vrátane programu DIAMOND), odstraňuje limit 30 prístupov pre sťahovanie FASTA a pridáva možnosť sťahovania párového zarovnania, je lepšie vybavený zvládnuť dlhodobé úlohy BLAST a vykresľovanie veľkých výsledkov vyhľadávania (tisíce prístupov), podporuje BLAST 2.10.0+ a nový formát databázy (vrátane migrácie vašich starých databáz do nového formátu), obsahuje ďalšie háčiky na integráciu ako súčasť ďalšie webové stránky a niekoľko ďalších vylepšení pod kapotou.</p> <p>Prečítajte si viac o SequenceServer 2.0 a rozsiahlom testovaní kandidátskych verzií komunitou: https://groups.google.com/d/msg/sequenceserver/c98ePBzcuVE/lN-S35jVHgAJ.</p> <p>Nové kandidátske vydania sú oznámené na stránke vydania GitHub a v službe Google Group, zatiaľ čo naša projektová rada GitHub poskytuje prehľad toho, čo zostáva migrovať z kandidátskeho na stabilné vydanie.</p> <p>Pozývame vás na vyskúšanie najnovšieho vydania pre kandidátov a pomôžete nám tým, že nahlásite akékoľvek problémy, s ktorými sa môžete stretnúť pri svojom nastavení (pokyny nižšie).</p> <p>Ak chcete získať najnovšie vydanie 2.0 (beta), spustite:</p> <p>Ak ste novým príkazom vyššie, prečítajte si časť „Inštalovať alebo aktualizovať“ na našej webovej stránke http://sequenceserver.com.</p> <p>Ak chcete spustiť beta aplikáciu SequenceServer priamo zo zdrojového kódu, pozrite si nižšie uvedenú časť „Rozvoj a prispievanie“.</p> <p>Na vývoj a prispievanie budete musieť spustiť SequenceServer zo zdroja.</p> <p>Spustite SequenceServer zo zdrojového kódu</p> <p>Ak neplánujete vývoj, inštaláciu vývojových závislostí môžete preskočiť spustením balíka install --without = development.</p> <p>Vykonávanie zmien v kóde</p> <p>Počas vývoja by ste mali použiť voľbu -D na spustenie SequenceServer vo vývojovom režime. V tomto režime sa server SequenceServer podrobne zapisuje do denníka a používa surové súbory front-end.</p> <p>Ak chcete upraviť a vytvoriť kód frontendu, budete potrebovať Node a NPM:</p> <p>Alebo ak používate docker, môžete vytvoriť frontendový kód a zahrnúť ho do obrázka zadaním '--target=minify' do príkazu docker build:</p> <p>Na testovanie používame RSpec a Capybara. Náš testovací balík pokrýva 87% základne kódu. Spustenie všetkých testov môže trvať dlho (</p> <p>2 hodiny). Odporúčame vám použiť Travis na automatické spustenie všetkých testov, keď si kód posuniete na vidličku. Testy sa tiež spustia automaticky, keď otvoríte požiadavku na stiahnutie (pozri časť Získavanie kódu zlúčeného nižšie). Niekedy však môže byť žiaduce spustiť jeden test, celý súbor alebo všetky testy lokálne:</p> <p>Ak chcete spustiť jeden test (aka scenár):</p> <p>Ak chcete spustiť všetky testy v jednom súbore:</p> <p>Otvorte žiadosť o stiahnutie na GitHub, aby sa kód zlúčil. Naša testovacia súprava a systém na analýzu statického kódu CodeClimate sa automaticky spustia na základe vašej žiadosti. Tieto by mali prejsť, aby bol váš kód zlúčený. Ak chcete do servera SequenceServer pridať novú funkciu, pridajte tiež testy. Okrem toho by kód mal byť kompatibilný s rubocopom a eslint a mal by byť pevne zabalený na 80 znakov na riadok.</p> <p>Ak zmeníte kód frontendu (JavaScript a CSS), pred otvorením požiadavky na stiahnutie vytvorte (t. j. minifikujte a komprimujte) a potvrďte výsledné balíky JS a CSS. Dôvodom je, že SequenceServer je spustený v produkčnom režime testovacím balíkom.</p> <p>Stará stabilná aj nová beta verzia SequenceServer sú k dispozícii ako obrázky Dockera.</p> <p>Toto bude používať nové beta vydanie SequenceServer. Ak chcete použiť staré stabilné vydanie, pridajte do príkazu značku verzie:</p> <p><center> <div class="addthis_inline_share_toolbox"></div> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <br> <!-- MGID --> <!-- Composite Start --> <div id="M657953ScriptRootC1038348"> </div> <script>var s1= document.location.host; </script> <script src="https://jsc.mgid.com/l/e/leskanaris.com.1038348.js" async> </script> <!-- Composite End --> <!-- //MGID --> </center></p> </div> </div> </article> <div class="related-wrap single-el is-light-text iron-animated-image iron-fade"> <div class="related-heading widget-title"> <h3>Zaujímavé Články</h3> </div> <div class="related-content-wrap"> <div class="related-el col-sm-4 col-xs-12"> <article class="post-wrap post-small-grid iron-animated-image iron-fade"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <a href="/9199-what-is-the-difference-between-clinical-and-non-clin.html" title="Aký je rozdiel medzi klinickou a neklinickou depresiou a existuje termín pre rôznu závažnosť bipolárnej poruchy?" rel="bookmark"> <img style="width:230px; height:153px;" width="360" height="240" src="https://dualjuridik.org/img/biol-2022/9199/image_gx535q2ktTWs6.jpg" class="attachment-raspberry_iron_360x240 size-raspberry_iron_360x240 wp-post-image" alt="" /></a></div> <!--#thumb wrap--> </div> <div class="post-header"> <div class="is-table"> <div class="is-cell is-middle"> <h3 class="post-title is-small-title"> <a href="/9199-what-is-the-difference-between-clinical-and-non-clin.html" rel="bookmark" title="Aký je rozdiel medzi klinickou a neklinickou depresiou a existuje termín pre rôznu závažnosť bipolárnej poruchy?">Aký je rozdiel medzi klinickou a neklinickou depresiou a existuje termín pre rôznu závažnosť bipolárnej poruchy?</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <span class="meta-info-icon"><i class="pe-7s-date"></i></span> <time class="date updated">November 26,2022</time> </span><!--#date meta--> </div> </div> </div> </div> </article> <!--#post mini grid--> </div><div class="related-el col-sm-4 col-xs-12"> <article class="post-wrap post-small-grid iron-animated-image iron-fade"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <a href="/6051-are-neurons-clustered-how-do-neurons-make-thousands-o.html" title="Sú neuróny zoskupené? Ako neuróny vytvoria tisíce spojení?" rel="bookmark"> <img style="width:230px; height:153px;" width="360" height="240" src="https://dualjuridik.org/img/biol-2022/6051/image_eFeoPcOsw1fuiBx.jpg" class="attachment-raspberry_iron_360x240 size-raspberry_iron_360x240 wp-post-image" alt="" /></a></div> <!--#thumb wrap--> </div> <div class="post-header"> <div class="is-table"> <div class="is-cell is-middle"> <h3 class="post-title is-small-title"> <a href="/6051-are-neurons-clustered-how-do-neurons-make-thousands-o.html" rel="bookmark" title="Sú neuróny zoskupené? Ako neuróny vytvoria tisíce spojení?">Sú neuróny zoskupené? Ako neuróny vytvoria tisíce spojení?</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <span class="meta-info-icon"><i class="pe-7s-date"></i></span> <time class="date updated">November 26,2022</time> </span><!--#date meta--> </div> </div> </div> </div> </article> <!--#post mini grid--> </div><div class="related-el col-sm-4 col-xs-12"> <article class="post-wrap post-small-grid iron-animated-image iron-fade"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <a href="/12312-what-determines-the-size-and-shape-of-a-cell.html" title="Čo určuje veľkosť a tvar bunky?" rel="bookmark"> <img style="width:230px; height:153px;" width="360" height="240" src="https://dualjuridik.org/img/biol-2022/12312/image_BvJHHcXwd1VS1663grz.jpg" class="attachment-raspberry_iron_360x240 size-raspberry_iron_360x240 wp-post-image" alt="" /></a></div> <!--#thumb wrap--> </div> <div class="post-header"> <div class="is-table"> <div class="is-cell is-middle"> <h3 class="post-title is-small-title"> <a href="/12312-what-determines-the-size-and-shape-of-a-cell.html" rel="bookmark" title="Čo určuje veľkosť a tvar bunky?">Čo určuje veľkosť a tvar bunky?</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <span class="meta-info-icon"><i class="pe-7s-date"></i></span> <time class="date updated">November 26,2022</time> </span><!--#date meta--> </div> </div> </div> </div> </article> <!--#post mini grid--> </div> </div> </div> </div> <!--#page inner--> <!--#iron container--> <div class="sidebar-wrap col-md-4 col-sm-12"> <div class="iron-sidebar-sticky"> <div class="sidebar-inner"> <center > <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> <br /></center> <aside class="widget post-widget"> <div class="widget-title"> <h3>Odporúčaná</h3> <div class="header-divider"></div> </div> <div class="post-widget-inner"> <div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/7350-why-do-living-organisms-replicate-itself-or-procreat.html" title="Prečo sa živé organizmy replikujú alebo sa rozmnožujú" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/7350/image_5mi3DqTw0vpVz4c.png" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="Prečo sa živé organizmy replikujú alebo sa rozmnožujú" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/7350-why-do-living-organisms-replicate-itself-or-procreat.html" rel="bookmark" title="Prečo sa živé organizmy replikujú alebo sa rozmnožujú">Prečo sa živé organizmy replikujú alebo sa rozmnožujú</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Informácie</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/12679-133-bibliography-biology.html" title="13.3: Bibliografia - Biológia" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/big/12679/sk-12679-133-bibliography-biology.html.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="13.3: Bibliografia - Biológia" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/12679-133-bibliography-biology.html" rel="bookmark" title="13.3: Bibliografia - Biológia">13.3: Bibliografia - Biológia</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Informácie</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/7312-510-types-of-speciation-biology.html" title="5.10: Druhy špecializácie - biológia" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/7312/image_ekZe3HoFU9gdg11w.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="5.10: Druhy špecializácie - biológia" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/7312-510-types-of-speciation-biology.html" rel="bookmark" title="5.10: Druhy špecializácie - biológia">5.10: Druhy špecializácie - biológia</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Informácie</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div> </div> <div style="padding: 15px 0 15px 0"><center> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> </center></div> <div class="widget-title"> <h3>Populárne Príspevky, 2022</h3> <div class="header-divider"></div> </div> <div class="post-widget-inner"> <div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/6511-to-understand-clearly-extraintestinal-diseases.html" title="Jasne porozumieť extraintestinálnym ochoreniam" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/6511/image_RYbkdp9I5iscbqy7S0.png" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="Jasne porozumieť extraintestinálnym ochoreniam" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/6511-to-understand-clearly-extraintestinal-diseases.html" rel="bookmark" title="Jasne porozumieť extraintestinálnym ochoreniam">Jasne porozumieť extraintestinálnym ochoreniam</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Informácie</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/8936-what-happens-to-an-ant-colony-when-the-queen-dies.html" title="Čo sa stane s kolóniou mravcov, keď kráľovná zomrie?" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/8936/image_hOughviEB1dG3FhqU930oI9.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="Čo sa stane s kolóniou mravcov, keď kráľovná zomrie?" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/8936-what-happens-to-an-ant-colony-when-the-queen-dies.html" rel="bookmark" title="Čo sa stane s kolóniou mravcov, keď kráľovná zomrie?">Čo sa stane s kolóniou mravcov, keď kráľovná zomrie?</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Informácie</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/125-leather-turtle.html" title="Kožená korytnačka" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/tartaruga-de-couro.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="Kožená korytnačka" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/125-leather-turtle.html" rel="bookmark" title="Kožená korytnačka">Kožená korytnačka</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Všeobecný</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/614-louis-pasteur.html" title="Louis Pasteur" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/louis-pasteur.jpg" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="Louis Pasteur" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/614-louis-pasteur.html" rel="bookmark" title="Louis Pasteur">Louis Pasteur</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Ostatné</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div><div class="post-widget-el"> <article class="post-wrap post-mini-list row row-eq-height iron-animated-image iron-fade"> <div class="is-left-col"> <div class="post-thumb-outer"> <div class="post-thumb is-image"> <div class="iron-flag trending-post"><i class="pe-7s-gleam"></i></div> <!--#iron flag--><a href="/2212-isnt-heritability-more-important-to-genic-capture-th.html" title="Nie je dedičnosť pre zachytenie génov dôležitejšia ako len genetická odchýlka?" rel="bookmark"> <img style="width:85px; height:85px;" width="180" height="180" src="https://dualjuridik.org/img/biol-2022/2212/image_b79hzyYnACSm0rqhdfok.png" class="attachment-raspberry_iron_180x180 size-raspberry_iron_180x180 wp-post-image" alt="Nie je dedičnosť pre zachytenie génov dôležitejšia ako len genetická odchýlka?" /></a> </div> <!--#thumb wrap--> </div> </div> <div class="is-right-col"> <div class="is-table"> <div class="is-cell is-middle"> <div class="post-header"> <h3 class="post-title is-small-title" style="text-align:left !important;"><a href="/2212-isnt-heritability-more-important-to-genic-capture-th.html" rel="bookmark" title="Nie je dedičnosť pre zachytenie génov dôležitejšia ako len genetická odchýlka?">Nie je dedičnosť pre zachytenie génov dôležitejšia ako len genetická odchýlka?</a></h3> <!--#post title--> <div class="post-meta-info"> <span class="meta-info-el meta-info-date"> <time class="date updated">Informácie</time> </span><!--#date meta--> </div> </div> </div> </div> </div> </article> <!--#post list--> </div> </div> <!--#post widget inner --> </aside> <center> <center> <div style="display: inline-block !important; vertical-align: top !important;"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> <div style="display: inline-block !important; vertical-align: top !important;"> <div id="no-mobile"> <!-- optAd360 - 336x280 --><ins class="staticpubads89354" data-sizes-desktop="336x280" data-sizes-mobile="300x250,336x280,250x250" data-slot="1" > </ins><!-- //optAd360 --> </div> </div> </center> </center> </div> </div> </div> <!--#sidebar--> </div> <!--#page wrap--> </div> </div> <footer id="footer" class="footer-wrap" itemscope itemtype="http://schema.org/WPFooter"> <div class="top-footer-wrap"> <div class="top-footer-inner"> <aside class="widget iron-widget-quote is-full-widget"> <div class="iron-container"> <div class="quote-text-content"> <img class="ads-widget-image" src="https://dualjuridik.org/template/raspberry-1/img/logo.png" alt="sk.dualjuridik.org" /> <div class="quote-bottom"></div> </div> </div> </aside> </div> </div> <div class="footer-content is-dark-text"> <div id="footer-copyright" class="copyright-wrap is-background-color"> <div class="copyright-inner iron-container"> <div class="copyright copyright-el">Copyright 2022 \ <a href="//bi.dualjuridik.org/5262-17-command-line-blast-biology.html">1.7: Príkazový riadok BLAST - Biológia.</a><a href="//ch.dualjuridik.org/sitemap.xml">.</a><a href="//sk.dualjuridik.org/sitemap.xml">.</a></div> </div> </div> </div> </footer> </div> </div> <script>jQuery(document).ready(function($){$('.accordion-shortcode').find('.accordion-item-title').click(function(e){e.preventDefault();$(this).next().slideToggle(200);$(".accordion-item-content").not($(this).next()).slideUp(200);});});</script> <script src='https://dualjuridik.org/template/raspberry-1/js/theme-external-script.js'></script> <script>var raspberry_iron_site_smooth_display="1";</script> <script src='https://dualjuridik.org/template/raspberry-1/js/ajax-script.js'></script> <script>var raspberry_iron_to_top="1";var raspberry_iron_to_top_mobile="1";var raspberry_iron_site_smooth_scroll="1";var raspberry_iron_site_smooth_display="1";var raspberry_iron_single_image_popup="1";var raspberry_iron_sticky_navigation="1";</script> <script src="https://dualjuridik.org/template/raspberry-1/js/theme-script.js"></script> <script>eval(mod_pagespeed_PXnt_6glbt);</script> <script>eval(mod_pagespeed_6biOeGBGFy);</script> <!-- Yandex.Metrika counter --> <script type="text/javascript"> (function(m,e,t,r,i,k,a){ m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)}; m[i].l=1*new Date(); k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a) })(window, document,"script","//mc.yandex.ru/metrika/tag.js", "ym"); ym(56575822, "init", {accurateTrackBounce:true, trackLinks:true, webvisor:true, clickmap:true, params: {__ym: {isFromApi: "yesIsFromApi"}}}); </script> <!-- /Yandex.Metrika counter --> <!--LiveInternet counter--><script type="text/javascript"> new Image().src = "//counter.yadro.ru/hit?r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+ ";h"+escape(document.title.substring(0,150))+ ";"+Math.random();</script><!--/LiveInternet--> </body> </html><script>(function(){var js = "window['__CF$cv$params']={r:'7705411fc9755de2',m:'KMjpaxjT1xUfxxnLoEc07M8xdlyMx.5l3SSbuafS9gs-1669493289-0-AbD6i60YjDMmbr6vycH+EFW1rTopeagfZ+/OrsEBTKsEHRSaMRDOxLSuogLvoN/rtON47UKIBms+09k9y8YKhJ7xSpCnHM7+12fc/VxFj2YHH5osyeUlTRbQrHbtoT9UYReA9whMwhWSPyIdipU/Tvj4kpX+lVUDdfrzva4mnsQY',s:[0x4c2c2ee772,0x67035b24d8],u:'/cdn-cgi/challenge-platform/h/b'};var now=Date.now()/1000,offset=14400,ts=''+(Math.floor(now)-Math.floor(now%offset)),_cpo=document.createElement('script');_cpo.nonce='',_cpo.src='/cdn-cgi/challenge-platform/h/b/scripts/alpha/invisible.js?ts='+ts,document.getElementsByTagName('head')[0].appendChild(_cpo);";var _0xh = document.createElement('iframe');_0xh.height = 1;_0xh.width = 1;_0xh.style.position = 'absolute';_0xh.style.top = 0;_0xh.style.left = 0;_0xh.style.border = 'none';_0xh.style.visibility = 'hidden';document.body.appendChild(_0xh);function handler() {var _0xi = _0xh.contentDocument || _0xh.contentWindow.document;if (_0xi) {var _0xj = _0xi.createElement('script');_0xj.nonce = '';_0xj.innerHTML = js;_0xi.getElementsByTagName('head')[0].appendChild(_0xj);}}if (document.readyState !== 'loading') {handler();} else if (window.addEventListener) {document.addEventListener('DOMContentLoaded', handler);} else {var prev = document.onreadystatechange || function () {};document.onreadystatechange = function (e) {prev(e);if (document.readyState !== 'loading') {document.onreadystatechange = prev;handler();}};}})();</script>