Informácie

Prečo vysoký obsah A+T spôsobil problémy pre projekt genómu Plasmodium falciparum?

Prečo vysoký obsah A+T spôsobil problémy pre projekt genómu Plasmodium falciparum?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Hlavný dokument pre Plasmodium palciparum genómový projekt (Gardner et al., 2002) opakovane uvádzal, že problémy spôsobuje neobvykle vysoký obsah A+T (~ 80%) genómu. Napríklad naznačujú, že im to bránilo v prístupe klon po klone:

V Escherichia coli sa tiež nikdy neskonštruovali vysokokvalitné knižnice veľkých inzertov (A + T) bohatej DNA P. falciparum, čo vylučovalo stratégiu sekvenovania klon po klone.

A že to sťažilo anotáciu génov:

Pôvod mnohých kandidátskych génov pochádzajúcich z organel nebolo možné presvedčivo určiť, čiastočne kvôli problémom spojeným s analýzou génov s veľmi vysokým obsahom (A + T).

otázka:
Aký je biologický význam vysokého obsahu A+T a prečo by to spôsobovalo problémy v sekvenovaní genómu?

Odkaz:
Gardner, MJ, Hall, N., Fung, E., White, O., Berriman, M., Hyman, RW, Carlton, JM, Pain, A., Nelson, KE, Bowman, S., Paulsen, IT, James, K., Eisen, JA, Rutherford, K., et al. (2002) Sekvencia genómu ľudského parazita malárie Plasmodium falciparum. Príroda. 419 (6906), 498-511.


Technológie sekvenovania, ktoré boli vyvinuté za posledných 20 rokov, majú rozsah optimálneho využitia pri priemernej rýchlosti A+T/G+C. Oblasti bohaté na AT a GC sú komplikované na spracovanie rôznymi technológiami sekvenovania. Každá technológia má iný rozsah použitia, ale aby sme vymenovali aspoň jedno, technológia Illumina preferuje sekvencie v strednom rozsahu. Ak sa pokúsite sekvenovať genóm bohatý na AT podľa štandardného protokolu Illumina, sekvenujete neúplný genóm, ktorého fragmenty nie sú dokonalým odrazom pôvodného kompletného genómu. Iné technológie tvrdia, že sú úplne nezaujaté k obsahu nukleotidov. Pacific Biosciences je jedným z nich a zdá sa, že ľudia súhlasia s týmto tvrdením po analýze údajov, ktoré produkujú ich stroje. Spoločnosť Oxford Nanopore Technologies tvrdí, že nemá takmer žiadne zaujatosti, ale k dnešnému dňu (2012-06-13) to neexistuje potvrdenie externými analýzami.

Okrem problémov so sekvenovaním môže byť softvér použitý na zostavovanie a označovanie sekvencií tiež náchylný na chyby v oblastiach bohatých na AT a GC. Mnohé z týchto problémov však pramenia z neúplnosti sekvenovania.


Nemôžem sa vyjadriť k tomu, ako bohatosť A+T komplikuje samotný proces sekvenovania, ale môžem sa vyjadriť ku komplikáciám, ktoré vznikajú pri anotácii sekvencie. Ab initio génové prediktory sú často založené na skrytých Markovových modeloch, ktoré sú veľmi citlivé na zloženie báz v genóme (dinukleotidy, trinukleotidy atď.). Tieto génové vyhľadávače zvyčajne fungujú veľmi zle, ak sú spustené v genóme, ktorý má oveľa odlišné základné zloženie ako ten, na ktorom bol trénovaný. To by mohlo vysvetliť niektoré ťažkosti, ktoré majú s analýzou génov v genóme.


Sekvenovanie často zahŕňa krok amplifikácie genómového materiálu. Štandardný spôsob, ako to dosiahnuť, je pomocou PCR, ale PCR je neobjektívna a nie dobre amplifikuje veľmi bohaté oblasti AT. Pri viacerých kolách PCR môžu dokonca oblasti s nízkym výskytom, ktoré nie sú také bohaté na AT, dominovať vo vzorke a skryť sekvencie bohaté na AT.

Toto nie je problém len pre de novo sekvenovanie, ale aj pre mnohé techniky založené na sekvenovaní (RNA-seq, ChIP-seq, your-favorite-seq...). V plazmódiu boli použité alternatívne metódy, ale nie sú také štandardné (zatiaľ?).

Pozri napr. H2A.Z vymedzuje intergénne oblasti epigenómu Plasmodium falciparum, ktoré sú dynamicky označené H3K9ac a H3K4me3 na http://www.plospathogens.org/article/info:doi/10.1371/journal.ppat.1001223


V minulosti pred masívne paralelným sekvenovaním vytvorili knižnicu klonovaných sekvencií a transformovali ich do E. coli. Vysoké AT sekvencie sa ťažko udržiavajú E. coli (možno kvôli podobnosti s promotérmi?).


Veľa už bolo povedané v predchádzajúcich odpovediach, takže len stručne pridám dva potenciálne problémy so silným skreslením AT / CG:

1) Potenciál sklzu polymerázy v dôsledku homopolymérov: vo všeobecnosti sa tým zavádzajú chyby, pretože v čítaniach môžete mať nechcené indely, ako aj začlenenie čisto nesprávnych báz. Toto je problém, ktorý sa môže stať aj pri PCR (aj keď teraz existuje veľa možností, ak chcete minúť). Všeobecne teda platí, že vyššia chybovosť a vyššie zlyhanie čítania.

2) Obtiažnosť zariadenia oddeľovať signály jednotlivých nukleotidov pre SANGER (všetko sa rozmazáva) alebo chyby kalibrácie pri sekvenovaní ďalšej generácie. Takže vyššie zlyhanie čítania (zlá kvalita).

3) Za predpokladu, že je teraz všetko v poriadku, oblasti s nižšou zložitosťou je možné VEĽMI ťažko zmapovať, nieto ešte zostaviť kompletný genóm od začiatku.

Dúfam, že to pomôže!


Expresné profilovanie schizontných a trofozoitových štádií Plasmodium falciparums dlhým oligonukleotidovým mikročipom

Celosvetová perzistencia rezistencie na liečivá Plasmodium falciparum, najsmrteľnejšia odroda ľudskej malárie, je globálnym problémom zdravia. The P. falciparum Projekt sekvenovania priniesol nové príležitosti na identifikáciu molekulárnych cieľov pre vývoj antimalarických liekov a vakcín.

Výsledky

Vyvinuli sme softvérový balík ArrayOligoSelector na navrhnutie mikročipy DNA špecifickej pre otvorený čítací rámec (ORF) pomocou verejne dostupného P. falciparum sekvencia genómu. Každý gén bol reprezentovaný jedným alebo viacerými dlhými 70 mérnymi oligonukleotidmi vybranými na základe jedinečnosti v genóme, vylúčenia sekvencie s nízkou komplexitou, vyváženého zloženia báz a blízkosti 3 'konca. Mikropole prvej generácie predstavujúce približne 6 000 ORF P. falciparum bol skonštruovaný genóm. Výkonnosť poľa bola hodnotená použitím kontrolných oligonukleotidových sád so zvyšujúcimi sa hladinami zavedených mutácií, ako aj tradičným Northern blottingom. Pomocou tohto súboru sme rozsiahle charakterizovali profil génovej expresie intraerytrocytových trofozoitových a schizontových štádií P. falciparum. Výsledky odhalili rozsiahlu transkripčnú reguláciu génov špecializovaných na procesy špecifické pre tieto dve fázy.

Závery

Mikročipy DNA založené na dlhých oligonukleotidoch sú výkonnými nástrojmi funkčnej anotácie a skúmania P. falciparum genóm. Profilovanie expresie trofozoitov a schizontov odhalilo gény spojené s procesmi špecifickými pre štádium a môže slúžiť ako základ pre budúce ciele liekov a vývoj vakcín.


Pozadie

Plasmodium vivax je najrozšírenejšou ľudskou maláriou a je zodpovedná za 70 � miliónov klinických prípadov ročne a za veľkú sociálno-ekonomickú záťaž pre krajiny ako Brazília a India, kde je najrozšírenejším druhom [1]. Bohužiaľ, kvôli problému s udržiavaním tohto parazita v kontinuite in vitro kultúra, skutočnosť, že vivaxová malária nie je taká život ohrozujúca ako malária falciparum, nízke parazitémie súvisiace s prirodzenými infekciami ľudí a ťažkosti s prispôsobením izolátov poľa rastu opíc, výskum P. vivax zostáva do značnej miery zanedbávaný. Navyše kvôli prísnej druhovej špecifickosti prirodzene získaných antimalarických ochranných imunitných reakcií je nepravdepodobné, že by vakcína proti Plasmodium falciparum bude aktívna proti P. vivax. Spoločne tieto údaje vyžadujú komplexné výskumné úsilie na štúdium P. vivax.

Na urýchlenie objavenia génov v bol použitý genomický prístup P. vivax konštrukciou knižnice v kvasinkových umelých chromozómoch pomocou parazitov získaných priamo od ľudského pacienta [2]. Sekvenovanie telomerického YAC z 155 771 bp z tejto knižnice skutočne odhalilo existenciu multi-génovej rodiny nazývanej vir (P. vivax variantné gény). vir gény sa s najväčšou pravdepodobnosťou podieľajú na únikoch imunity a predstavujú 15 �% z celkového obsahu génov parazita za predpokladu, že vir počet kópií génu 600 � kópií na haploidný genóm [3]. Ďalšie sekvenovanie 199 866 bp interného klonu YAC z tej istej knižnice identifikovalo 41 génov v konzervovanej syntéze s oblasťou chromozómu 3 v P. falciparum, ale zistilo sa, že v sekvencii YAC chýbajú ortológy P. falciparum gény, ktoré kódujú fenotypy cytoadherencie v rámci tej istej oblasti [4].

Rozsiahla sekvenčná analýza dvoch knižníc genómových DNA štiepených nukleázami z mungo: nukleotidov Pv MBN knižnice z kmeňa Belem [5] a knižnice Pv MBN č. 30 z kmeňa Salvador I [6] tiež urýchlila objav génov v P. vivax. Skutočne, porovnávacie v silikóne analýzy sekvencií GSS z týchto dvoch knižníc so sekvenciami GSS a EST z knižníc z P. falciparum a Plasmodium berghei, sa zvýšil najmenej o 10-násobok počtu predpovedaných P. vivax gény. Technické problémy s extrakciami poly (A) mRNA z P. vivax, však brzdili konštrukciu cDNA knižníc parazita určených na vysokovýkonné sekvenovanie [6]. Údaje o EST z P. vivax sú preto potrebné na validáciu týchto génových predpovedí a na vytvorenie génového indexu tohto parazita malárie. Najdôležitejšie sú údaje o EST z P. vivax budú kľúčové pri anotácii genómu kmeňa Salvador I, ktorý je v súčasnosti sekvenovaný na päťnásobné pokrytie TIGR [7].

Stavba a P. vivax Nedávno bola publikovaná knižnica cDNA získaná z parazitického materiálu zozbieraného priamo od 10 rôznych ľudských pacientov v brazílskej Amazónii [8]. Tento článok predstavuje prehľad EST z tejto knižnice, ktorý zahŕňa analýzy podobnosti, anotácie a priradenie terminológie génovej ontológie.


Prečo vysoký obsah A+T spôsobil problémy pre projekt genómu Plasmodium falciparum? - Biológia

Parazit malárie Plasmodium falciparum čelí drastickým osmotickým zmenám pri prechode obličkami a podieľa sa na masívnej biosyntéze glycerolipidov počas svojho vývoja v krvnom štádiu. Identifikovali sme jediný aquaglyceroporín (PfAQP) v takmer dokončenom genóme P. falciparum s najvyššou podobnosťou s Escherichia coli glycerolového facilitátora (50,4%), ale oba kanonické motívy Asn-Pro-Ala (NPA) v oblasti pórov sú zmenené na Asn-Leu-Ala (NLA) a Asn-Pro-Ser (NPS). Vyjadrenie v Xenopusoocyty ich robia vysoko priepustnými pre vodu aj glycerol. Cukorové alkoholy až do piatich uhlíkov a močoviny prechádzajú pórom. Mutačné analýzy motívov NLA/NPS ukázali ich štruktúrny význam, ale symetrické vlastnosti pórov boli zachované. PfAQP je exprimovaný v parazitoch v krvnom štádiu počas vývoja od prstencov cez trofozoity po schizonty a je lokalizovaný v parazite, ale nie v cytoplazme alebo membráne erytrocytov. Jeho jedinečná bifunkčnosť indikuje funkcie pri ochrane pred osmotickým stresom a účinne poskytuje prístup k zásobe glycerolu v sére na použitie pri tvorbe ATP a predovšetkým pri syntéze fosfolipidov.

Publikované, JBC Papers v tlači, 29. novembra 2001, DOI 10.1074/jbc.M110683200

Táto práca bola podporená spoločnosťami Deutsche Forschungsgemeinschaft a Fonds der Chemischen Industrie. Náklady na uverejnenie tohto článku boli čiastočne uhradené zaplatením poplatkov za stránku. Článok preto musí byť týmto označený „reklama“ v súlade s 18 U.S.C. § 1734 len na označenie tejto skutočnosti.

Nukleotidové sekvencie uvedené v tomto článku boli odoslané do GenBank ™/EBI Data Bank s prístupovým číslom.


Strom života

Pred pár dňami som dostal e-mail od kolegu, ktorého som dlhé roky nevidel. Bolo to od Malcolma Gardnera, ktorý pracoval v TIGR, keď som tam bol a teraz je v Seattle Biomed.

Jeho e-mail sa týkal zverejnenia kompletnej sekvencie genómu v roku 2002 Plasmodium falciparum - pôvodca väčšiny prípadov ľudskej malárie - pre ktoré bol hlavným autorom. Niekto poslal Malcolmovi e -mail so žiadosťou, či by mohol poskytnúť podrobnosti o nastaveniach použitých pri podrobných vyhľadávaniach, ktoré boli súčasťou evolučných analýz článku. Papier je voľne dostupný v Nature – aspoň zatiaľ – občas sa zdá, že Nature Publishing Group ho zaradí za platnú stenu, napriek tomu, že sľubuje, že to neurobí.

Malcolm ma kontaktoval, pretože som vykonal/koordinoval veľkú časť evolučnej analýzy uvedenej v tomto dokumente. Podotýkam - ako jeden z jediných ľudí na TIGR zameraných na evolúciu bolo celkom bežné, že za mnou ľudia chodili a pýtali sa, či by som im mohol pomôcť s ich genómom. Skoro vždy som povedal áno, pretože som rád robil také veci a v prvých dňoch sekvenovania genómu bolo skutočne vzrušujúce byť prvou osobou, ktorá sa opýta na údaje súvisiace s evolúciou.


Malcolm zahrnul e-mail, ktorý dostal (ktorý neobsahoval veľa podrobností) a písali sme si tam a späť a snažili sa zistiť, čo presne táto osoba chce. A potom som si povedal, dobre, možno by ma ten človek mal kontaktovať priamo, aby som zistil, čo skutočne chce/potrebuje. Zdalo sa neobvyklé, že sa niekto na niečo také pýta z 10 -ročného papiera, ale čo už.

Keď som komunikoval s touto osobou, začal som sa prehrabávať vo svojich súboroch a mozgu a snažil som sa spomenúť si, čo presne sa pre tento dokument urobilo pred viac ako 10 rokmi. Pamätám si Malcolma a ďalších z r Plasmodium komunita organizujúca niekoľko „jamborees“, ktorí sa pozerajú na anotáciu genómu. Na jednom z tých jamborees som sa stretol s niekoľkými ľuďmi zo Sanger Center (ktoré bolo jedným z veľkých hráčov v P. falciparum sekvenovanie genómu) s Malcolmom a - po nejakej diskusii som skončil pri troch hlavných veciach týkajúcich sa príspevku, ktoré popisujem nižšie.

Vec 1: Konzervované gény eukaryotov

Jednou z mojich analýz bolo použiť genóm na hľadanie génov konzervovaných v eukaryotoch, ale nie prítomných v baktériách alebo archaeách. Urobil som to, aby som sa pokúsil nájsť gény, ktoré by sa mohli považovať za pravdepodobne vynájdené na evolučnej vetve vedúcej k spoločnému predkovi eukaryotov.

Okrem toho, zhruba v rovnakom čase som bol požiadaný, aby som napísal Správy a pohľady na prírodu o vydaní knihy Schizosaccharomyces pombe genóm. V N & ampV som napísal „Sekvenovanie genómu: Brouhaha nad ostatnými kvasinkami“ som si všimol, ako autori použili genóm na vykonanie zaujímavej analýzy konzervovaných eukaryotických génov. S pomocou personálu prírody som tiež vytvoril figúrku, ktorá demonštrovala (druh) toho, o čo sa vo svojej analýze pokúšali - to bolo nájsť gény pochádzajúce z vetvy vedúcej k spoločnému predkovi eukaryotov, pre ktoré V tom čase boli k dispozícii genómy. Ako ďalšie stranou - S. pombe genómový papier a môj článok Správy a názory sú voľne dostupné.

Obrázok 1: Strom života s vetvami označenými podľa analýzy Wooda a kol. O génoch, ktoré môžu byť špecifické pre eukaryoty oproti prokaryotom a pre mnohobunkové versus jednobunkové organizmy. Baktérie a archaea sú prokaryoty (nemajú jadrá). Z Nature 415, 845-848 (21. februára 2002) | doi:10.1038/nature725. Eukaryotická časť stromu je založená na Baldaufovi a kol. 2000.

Každopádne som urobil podobnú analýzu, aká bola v S. pombe genómový papier a našiel som primeraný počet a pomohol som napísať sekciu pre tento článok.

Zoznam génov je dostupný ako doplnkový materiál na webovej stránke Nature. Bohužiaľ je to vo formáte MS Word, ktorý nie je najužitočnejší. Ale viac o tomto probléme na konci tohto príspevku.

Vec 2. Hľadanie duplikácií špecifických pre líniu

Ďalším aspektom porovnávacej genómovej analýzy, ktorú som robil pre väčšinu genómov na TIGR, bolo hľadanie duplikácií špecifických pre líniu (tj gény, ktoré prešli duplikáciami v línii študovaného druhu s vylúčením línií, pre ktoré sú iné genómy k dispozícii). Rýchly a špinavý spôsob, akým sme to robili, bolo jednoducho hľadať gény, ktoré sa lepšie zhodujú s iným génom z ich vlastného genómu ako s génmi v akomkoľvek inom genóme. Zoznam génov, ktoré sme identifikovali týmto spôsobom, je tiež poskytnutý ako dokument programu Word v doplnkových materiáloch.

Vec 3: Hľadanie génov odvodených z organel v jadrovom genóme P. falciparum

Vec 4: Analýza génov na opravu DNA

Arnab Pain a ja sme analyzovali gény, o ktorých sa predpokladá, že sa podieľajú na opravách DNA a procesoch rekombinácie, a napísali sme časť do článku:

Bohužiaľ, nemôžem do konca života zistiť, aké ďalšie parametre som použil na vyhľadávanie blastp. Som si na 99,9999% istý, že som použil predvolené nastavenia, ale bohužiaľ, neviem, aké predvolené nastavenia pre výbuch boli v tej dobe. A nie som si ani istý, ktorá verzia programu blastp bola vtedy nainštalovaná v počítačových systémoch TIGR. Určite musím urobiť lepšiu prácu, aby som sa ubezpečil, že všetko, čo robím, je skutočne reprodukovateľné.

Reprodukovateľnosť

To všetko ma privádza k skutočnej skutočnej časti tohto príbehu. Reprodukovateľnosť. Je to veľká vec. Každý by mal byť schopný reprodukovať to, čo bolo vykonané v štúdii. A bohužiaľ, je ťažké to urobiť, keď nie sú všetky metódy úplne popísané. A jeden by mal tiež poskytnúť priebežné výsledky, aby ľudia nemuseli opakovať všetko, čo ste urobili v štúdii, ale mohli iba reprodukovať časť. Bolo by dobré nechať napríklad uvoľniť všetky fylogenetické stromy z analýzy organelárnych génov v Plasmodium. Bohužiaľ, nezdá sa mi, že by som mal všetky tieto súbory, pretože boli uložené v adresári na TIGR venovanom tomuto projektu genómu a keďže už nie som v TIGR, nemám k tomuto materiálu rýchly prístup. Pravdepodobne sa stále povaľuje niekde na počítačových systémoch JCVI (TIGR, bohužiaľ, už oficiálne neexistuje . zhltol ho Inštitút J. Craiga Ventera. ). Ale budem ďalej pátrať a ak/keď ich nájdem, uverejním ich na nejakom mieste, ako je FigShare.

Možno ešte dôležitejšie je, že budem spolupracovať so svojím laboratóriom, aby som sa ubezpečil, že v budúcnosti uložíme/zaznamenáme/sprístupníme VŠETKO, čo ľuďom umožní reprodukovať, znova analyzovať, prehadzovať, znovu čokoľvek z našich dokumentov.

Kľúčová lekcia - naplánujte si vopred, ako budete zdieľať výsledky, metódy, údaje atď.


Variabilita kódujúcich sekvencií

Po zistení, že klinický prejav iatrogénne indukovanej malárie, používaný pri liečbe Treponema pallidum infekcií, ktoré sa líšili v závislosti od izolátov získaných z rôznych kontinentov a mali za následok druhovo špecifickú a izolátovo špecifickú imunitu, po prvýkrát vznikol koncept plazmodiálnej diverzity. Alozýmy a antigénne proteíny, najmä varianty parazitovej glukózofosfátizomerázy (GPI) a LDH (21), boli potom prvými plazmodiálnymi variantmi, ktoré boli rozpoznané. Varianty týchto enzýmov boli zistené u jednotlivých pacientov s maláriou, čo dokazuje existenciu zmiešaných infekcií s rôznymi P. falciparum klony u jednotlivých jedincov. Alelické variácie a geografické rozdiely niekoľkých génov boli potom demonštrované v štúdii na P. falciparum izoláty z Ázie, Afriky a Južnej Ameriky (30) a variantné proteíny bolo možné rozlíšiť pomocou monoklonálnych protilátok.

LSA-1, hlavný kandidát na podjednotkovú vakcínu, je proteín 200 kDa exprimovaný v štádiu pečene P. falciparum a akumulované v parazitofornej vakuole. Dva epitopy LSA-1 ukázali, že indukujú cytotoxické reakcie T-buniek v nosičoch konkrétnych variantov HLA-B. Gén kódujúci LSA-1 má veľkú centrálnu opakujúcu sa oblasť a neopakujúce sa sekvencie kódujúce N a C terminálne konce proteínu. Údaje o sekvencii kódujúceho génu sú obmedzené, je však známe, že na N-terminálnom a C-terminálnom konci sa vyskytujú nesynonymné mutácie.


Výsledky

Návrh a zostavenie syntetického génu

Dizajn oligo použitých na syntézu 2,1 kb pfsub-1 gén vyžadoval veľkú pozornosť k detailu, vzhľadom na požiadavku, aby bol v jednej PCR zmiešaný veľký počet. Nukleotidová sekvencia génu bola navrhnutá podľa P. pastoris preferencia používania kodónov (Bennetzen a Hall, 1982 Sreekrishna a kol., 1993). Okrem toho bol panel oligo dôsledne skrínovaný a spárovaný, aby spĺňal nasledujúce kritériá: (i) zníženie celkového obsahu A+T s elimináciou potenciálnych signálov ukončenia transkripcie (ii) eliminácia palindromických sekvencií vedúcich k stabilnej intramolekulárne vlásenky (iii) minimalizácia tandemových alebo invertovaných opakovaní (o dĺžke <10 bp), ktoré pravdepodobne povedú k nešpecifickému primingu a (iv) optimalizácia prekrývania 20 nukleotidov medzi každým 40-merovým primerom, aby sa získala teplota topenia v rozmedzí 58 - 62 ° C, aby sa umožnilo následné použitie primerov na sekvenovanie DNA. Konvenčná iniciačná sekvencia translácie Kozaka bola začlenená do extrémneho 5 'oligo pre efektívnu expresiu génu v P. pastoris a ďalších päť histidínových kodónov sa zaviedlo tesne pred stop kodónom do extrémneho 3' oliga. V strategických polohách syntetického génu bolo zavedených niekoľko unikátnych reštrikčných miest, aby sa uľahčila následná génová manipulácia a mutagenéza. Oligový dizajn sa uskutočnil pomocou Unixového kodónového optimalizačného programu CODOP (pozri Materiály a metódy). Tento program preloží danú sekvenciu DNA do proteínovej sekvencie a potom pomocou užívateľom definovanej tabuľky využitia kodónov spätne preloží proteínovú sekvenciu so zlepšeným využitím kodónov. Program odmietne kodóny s abundanciou pod hraničnou hodnotou, potom pridelí kodón s vysokou abundanciou každému zvyšku v proteínovej sekvencii s použitím kodónov s vysokou abundanciou v pomere k ich použitiu v tabuľke používania kodónov. Obidve vlákna sekvencie sa potom rozdelia na prekrývajúce sa oligo s dĺžkou 40 báz, pre všetky prekrytia sa vypočítajú teploty topenia a zobrazia sa reštrikčné miesta vytvorené pozdĺž sekvencie. Výsledný panel oligonukleotidov bol potom analyzovaný pomocou softvérového balíka Genetics Computer Group (GCG verzia 8-Unix) na prítomnosť nežiaducich opakovaní, obrátených opakovaní, štruktúr kmeňových slučiek a oblastí komplementarity, ktoré by potenciálne mohli viesť k nešpecifickej intermolekulárnej hybridizácii. Vo väčšine prípadov boli tieto sekvencie ľahko eliminované pri zachovaní preferencie kodónov. Neoptimálne kodóny sa použili len vtedy, ak to bolo potrebné na vytvorenie jedinečných reštrikčných miest alebo pri opakujúcich sa sekvenciách. Systematické, opakujúce sa používanie týchto dvoch programov viedlo k konečnému výberu 104 unikátnych oligonukleotidov na syntézu génov. Tabuľka I ukazuje porovnanie zloženia kodónov syntetického génu s kodónom divokého typu P. falciparum gén. Frekvencia kodónov, ktoré nie sú prítomné vo vysoko exprimovaných kvasinkových génoch, bola drasticky znížená a množstvo veľmi zriedkavých kodónov bolo eliminovaných. Napríklad 31 kodónov ATA (Ile) a 49 kodónov AAA (Lys) prítomných v natívnom géne bolo úplne odstránených. Celkové zloženie A+T bolo znížené zo 72% v natívnom géne na 53% v syntetickom produkte. Konečná, kodónovo optimalizovaná sekvencia syntetiky pfsub-1 sekvencia a relatívne polohy 104 oligonukleotidov sú znázornené na obrázku 1 spolu s predpovedanou sekvenciou aminokyselín.

Počiatočná montážna reakcia (obrázok 2) zahŕňala konštrukciu génu celej dĺžky zo stechiometrickej zmesi 104 oligonukleotidov. Alikvotná časť tejto zostavovacej reakčnej zmesi sa potom použila ako templát pre proces amplifikácie, v ktorom boli pridané iba dva najvzdialenejšie priméry zostavy, každý v koncentrácii 1 uM. Optimálne výťažky produktov PCR s použitím Pfu DNA polymeráza sa získala s 3 mM MgSO4 v PCR. Analýza dvoch PCR na 1% agarózových géloch odhalila prítomnosť 2,1 kb očakávaného produktu (obrázok 3A). V alternatívnom prístupe boli 5' a 3' "polovice" génu syntetizované oddelene vo forme dvoch fragmentov DNA s veľkosťou 1,1 a 1 kb (obrázok 3B). Podmienky PCR pre montážnu reakciu zostali nezmenené, aj keď počet oligonukleotidov v každej zostave klesol na 56 a 50 pre každú reakciu. Produkty syntetickej DNA sa ligovali s tupými koncami pMosModrá na klonovanie a sekvenovanie. Na sekvenačné reakcie priméry hybridizujú s miestami

V paneli použitom pri syntéze bolo vybraných 400 bp od seba v géne, čo umožnilo pokrytie obidvoch vlákien celého pfsub-1 sekvencia s konzistentnými prekrývaniami. Kompletná sekvenčná analýza troch z 2,1 kb klonov a piatich z každého z menších klonov identifikovala v priemere len 3,5 nukleotidových substitučných chýb na kb v 2,1 kb PCR produkte a v priemere len 1,5 kb chyby na kb v každom z dvoch 1,1 kb a 1 kB produktov. Tieto mutácie boli distribuované náhodne, čo naznačuje, že oligo neboli zdrojom chýb. Od r Pfu polymeráza, ktorá vykazuje 3′ → 5′ korekčnú exonukleázovú aktivitu, bola použitá pre všetky amplifikačné kroky, predpokladáme, že tieto chyby boli s najväčšou pravdepodobnosťou zavedené počas procesu zostavovania. Znížená frekvencia mutácií pozorovaná u menších produktov bola pravdepodobne priamym dôsledkom zníženia počtu oligonukleotidov zmiešaných dohromady počas montážnej reakcie.

Proteínová expresia

Výraz zo syntetiky pfsub-1 gén bol pôvodne hodnotený v P. pastoris. Signálna sekvencia PfSUB-1 bola nahradená pre-pro doménou domény S. cerevisiae a-párovací faktor klonovaním génu do SnaBI /EcoRI-štiepený pPIC9K a linearizovaný vektor použitý na transformáciu P. pastoris. Transformanty obsahujúce mnohopočetné chromozomálne inzercie rekombinantného vektora boli vybrané a po predbežných indukciách na výber klonov s najvyššou produkciou bol v 4 1 fermentore indukovaný jeden klon. Od N-glykozylácie v krvnom štádiu P. falciparum proteíny sú zriedkavé (Gowda a kol.(1997), indukcia sa uskutočnila v prítomnosti tunicamycínu. Klon nevylúčil žiadny rekombinantný proteín. Skúmanie celkových bunkových extraktov pomocou Western blottingu ukázalo, že indukovaný rekombinantný produkt sa akumuloval intracelulárne v nerozpustnej forme. Rekombinantný proteín využívajúci C-koncovú hexahistidínovú značku bol purifikovaný za denaturačných podmienok z extraktov indukovaného klonu nikel-chelátovou chromatografiou (Holzinger a kol.1996) (obrázok 4). Z týchto purifikačných údajov bola hladina expresie rekombinantného PfSUB-1 odhadnutá na 0,2–0,5 g/l. N-terminálne aminokyselinové sekvenovanie purifikovaného proteínu ukázalo, že N-koncová sekrečná signálna sekvencia a-faktora bola odstránená, zatiaľ čo doména a-faktora pro bola stále prítomná, čo naznačuje, že proteín prešiel translokáciou do kvasinkového ER, ale nebol ďalej spracované.

Bakulovírusový systém bol ďalej považovaný za alternatívny expresný systém, ktorý by mohol lepšie podporovať správne skladanie a posttranslačné spracovanie PfSUB-1. Použitie kodónov Autographa californica vírus nukleárnej polyhedrózy (AcMNPV) je menej prísny ako vírus P. pastoris ( Ranjan a Hasnain, 1994), takže sa usúdilo, že náš syntetický gén by mal byť dobre exprimovaný aj v bakulovírusovom systéme. Infekcia hmyzích buniek High Five TM v prítomnosti tunicamycínu v koncentrácii 0,5 μg/ml viedla k sekrécii ľahko detegovateľných hladín zjavne správne spracovaného PfSUB-1 (obrázok 5). Predbežné purifikačné behy so sekretovaným produktom ukázali, že hladiny expresie rekombinantného proteínu boli rádovo 2 až 5 mg/l (neuvedené).


Závery a perspektívy

Teraz je zrejmé, že členovia z dvoch proteínových rodín sú zapojení do procesov selekcie hostiteľských buniek, ktoré definujú tropizmus červených krviniek merozoitu parazita malárie. Rozmanitosť týchto proteínov v rámci genómov rôznych Plasmodium species umožňuje navrhnúť hypotetický model, kde by kombinácie ligandov a kontrola ich expresie mohli zodpovedať za výrazné invazívne správanie merozoitov v rôznych druhoch. Zatiaľ však nie sú k dispozícii žiadne presvedčivé dôkazy pre tento model, ani jemné detaily interakcií, ktoré sú základom výberu červených krviniek na inváziu. Niet pochýb o tom, že schopnosť geneticky modifikovať parazita viedla ku kvantovému pokroku v našom vnímaní týchto invazívnych mechanizmov a že prebiehajúce systematické analýzy parazitov s narušenými RBL a/alebo EBL génmi prinesú ďalšie poznatky. Tento prístup pravdepodobne neposkytne úplný pohľad na povahu selekcie červených krviniek, pokiaľ nie je spojený so štúdiami, kde sú definované aj receptory červených krviniek. Varianty červených krviniek, ktoré sa prirodzene nachádzajú v prírode, predstavujú bohatý zdroj materiálu pre tieto štúdie, ale tieto budú pravdepodobne nedostatočné. Pre tie parazity, ktoré sa dajú bežne udržiavať in vitro (P. falciparum a P. knowlesi) výzvou bude navrhnúť spôsoby, ako získať reprodukovateľne homogénnu populáciu červených krviniek s definovanými receptorovými charakteristikami. Riešením môžu byť pokroky v genetickej manipulácii s erytroblastmi a vo vytváraní veľkého počtu erytrocytov z týchto progenitorových buniek.

Demonštrácia, ktorá prechádza na alternatívne invazívne cesty, kde sa podieľajú rôzne ligandy a receptory, sa dá ľahko získať P. falciparum za laboratórnych podmienok a dôkaz, že k tomu dochádza aj u parazitov cirkulujúcich v endemických obyvateľoch, vyvoláva obavy v súvislosti s vakcínami proti malárii založenými na proteínoch RBL alebo EBL. Skutočnosť, že parazity, ktoré nevykazujú EBA175, vedúceho kandidáta na tieto vakcíny, sa stále môžu množiť (Duraisingh a kol., 2003b) sa môže premietnuť do výberu variantov úniku, ak je táto vakcína nasadená. Pesimizmus sa však musí zmierniť, pretože v skutočnosti nie je známe, či by tieto variantné línie parazitov, ktoré rastú v laboratórnych podmienkach, boli životaschopné. in vivo. Napriek tomu bolo nevyhnutné zvážiť zahrnutie dvoch alebo viacerých ligandov RBL a EBL do akejkoľvek vakcíny určenej na prevenciu interakcií medzi merozoitom a červenými krvinkami.

Nakoniec, jedným z hlavných predpokladov týkajúcich sa proteínov RBL a EBL je, že sa podieľajú výlučne na invázii červených krviniek. Vyplýva to predovšetkým zo skutočnosti, že tieto proteíny boli prvýkrát nájdené spojené s merozoitmi. Navyše pre mnohé z týchto proteínov bolo možné preukázať väzbu na červené krvinky a pre niektoré bol identifikovaný receptor červených krviniek. Nakoniec protilátky vytvorené proti množstvu týchto proteínov môžu inhibovať alebo meniť tropizmus a invazívne profily merozoitov. Existujú dve relatívne nedávne štúdie, ktoré spochybňujú platnosť tohto predpokladu. Najprv bola demonštrovaná expresia odlišných podskupín génov Py235 (rodina RBL) (na úrovni transkripcie aj proteínu) v sporozoite a v pečeňovom parazite (Preiser a kol., 2002). Za druhé, EBA175 (rodina EBL), dôležitý P. falciparum Ukázalo sa tiež, že kandidát na vakcínu proti invázii červených krviniek je exprimovaný na povrchu sporozoitov a v infikovanom hepatocyte (Grüner a kol., 2001). Zatiaľ čo expresiu týchto proteínov možno očakávať v pečeňových merozoitoch, ktoré sú predurčené na napádanie červených krviniek, ich úloha v biológii sporozoitu, parazitickej formy, ktorá interaguje so slinnými žľazami komárov, bunkami v koži, kde sa ukladá infekčné uhryznutie pred inváziou do hepatocytov sa ešte musí preskúmať. Systematické štúdie s cieľom určiť, ktorí z ďalších členov rodín RBL a EBL sú exprimovaní v prederytrocytových štádiách Plasmodium v súčasnosti prebiehajú. To môže viesť k identifikácii niektorých ligandov, ktoré špecificky interagujú s jediným typom hostiteľskej bunky, a ďalších, ktoré môžu byť súčasťou súboru parazitických proteínov zapojených do všetkých invazívnych udalostí.

In conclusion, elucidation of the molecular mechanisms underlying host cell tropism and invasion in Plasmodium parasites present researchers with a formidable challenge, both technically and intellectually. The resources that would be required to achieve this goal are justified by the central role these processes play in the survival of the parasite and in the possibility that the knowledge to be gained might yield novel and efficient strategies to control the infection.


Úvod

Quantifying the diversity of major surface antigens underlying immune evasion of HIV 1 and 2 and Influenza A has been central to characterizing the transmission dynamics of these important human pathogens. In addition, documentation of variation data has provided a basis for the development of candidate vaccine targets [1,2]. Surprisingly, in-depth molecular epidemiological sampling and population genomic analyses of the var genes encoding the major blood stage surface antigen of the malaria parasite, Plasmodium falciparum erythrocyte membrane protein 1 (PfEMP1), has not been done. This is largely due to the inherent difficulties in the population genomic analysis of highly diverse multigene families. We set out to develop and evaluate a rapid, molecular epidemiological population genomic framework to investigate var gene diversity in natural parasite populations, due to the importance of these genes to the biology of P. falciparum.

To achieve chronic infection, malaria parasites evade the host immune response by switching PfEMP1 isoforms through differential expression of members of the var multigene family [3𠄵]. PfEMP1 is expressed on the surface of blood stage parasites known as trophozoites [6] and the transmission (early gametocyte) stages [7]. Parasite adhesion occurs in the deep vasculature of host tissues by binding of PfEMP1 to host endothelial cell receptors. Some PfEMP1-adhesion interactions are proposed to lead to severe disease manifestations such as cerebral and placental malaria (reviewed in [8]). Variant specific anti-PfEMP1 antibodies are believed to contribute to the regulation of parasite density in a manner that decreases the incidence of clinical disease [9�]. This immunity may reduce the duration of infection in a variant-specific manner to drive the dynamics of multiple infections in semi-immune children [14] and induced infections in humans [15]. Immunity to PfEMP1 can thereby influence transmission by reducing persistence. It may also reduce transmission by regulating the density of asexual blood stages with potential to become transmission stages and by directly targeting early gametocytes to prevent the maturation of transmission stages [16]. Consequently, diversity of PfEMP1 or var genes is able to promote transmission success by immune evasion.

Describing the diversity of var genes presents a more complex problem than assessing the diversity of the single copy major surface antigen genes of HIV and Influenza A. Individual P. falciparum genomes have repertoires of var genes that can recombine with other repertoires during the obligatory sexual phase of the life cycle in the mosquito [17�]. There is also circumstantial evidence for ectopic recombination among var genes within the same genome, possibly during both meiosis and mitosis [20�]. Therefore, there is enormous potential to generate diversity, even among closely related genomes. Var genes are large (5� kb) and complex [23�], encoding variable numbers and classes of the adhesion domains, Duffy binding like (DBL: α, β, δ, ɛ, and γ classes) and cysteine interdomain rich (CIDR: α, β, and γ classes) [26]. Both size and complexity preclude population genomic analysis of the full var gene sequences. The DBLα encoding domain was used previously as a marker of var genes in investigations of diversity [21,22,27�] and expression [31�]. The small size (𢏁 kb) and ubiquitous presence of DBLα among var genes [24�,34] make this domain a suitable population genomic marker.

Previous analyses of var gene diversity have examined DBLα domain sequences from the var gene repertoires of allopatric (distantly related) [22,27,30] or just a few sympatric (closely related) [28,29] isolates. These studies have established that any pair of DBLα sequences from the same genome were on average as diverse as any pair from two different genomes, with a range of 45%�% amino acid identity [3,22,27,28]. This has made it impossible to identify var gene orthologs among genomes. Limited overlap (shared DBLα sequences) among var repertoires from sympatric isolates has also been reported [27�], suggesting that many genomes must be sampled to see the extent of diversity of these genes in natural populations. Given the importance of var genes to transmission, a systematic sequencing effort and population genomic analysis is needed to examine var gene diversity in sufficient depth to estimate levels of antigenic diversity within natural populations.

A high-throughput population genomic framework was developed to address sampling issues specific to the molecular epidemiological analysis of diverse multigene families. This allowed the random sampling of the var gene repertoires of culture-adapted and field isolates of P. falciparum by sequencing DBLα domains as population genomic markers ( Figure 1 ). Var genes were sampled from a “global” collection of isolates, including clones 3D7 and HB3 used in genome sequencing projects ([34] D. Wirth, personal communication). DBLα sequences from these isolates were used to validate the framework. The “global” DBLα sequences were combined with available data from previous studies and compared to that obtained from a local population of Papua New Guinea (PNG). The results show immense levels of diversity among the var genes with strong evidence of geographic structuring of variation. We demonstrate patterns of similarity among sequences that suggest the widespread action of recombination in creating and maintaining diversity.

The cumulative diversity of DBLα was determined by comparing each new DBLα repertoire to previous repertoire(s) using a 96% DNA sequence identity cut-off. We plotted the number of accumulating “types” (distinct sequences) against the number of “sequences” compared. For example, the first point on the plot will be the number of types found in both isolates A and B on the y-axis against the total number of sequences compared on the x-axis. The next point will be the number of types found in isolates A, B, and C against the total number of sequences compared. The plot shown here is the average curve of 1,000 permutations of the order that isolates were compared (i.e., isolates A, B, then C or A, C, then B or B, C, then A).


Informácie o autorovi

Afiliácie

Department of Immunology and Infectious Disease, Harvard School of Public Health, 665 Huntington Avenue, Boston, 02115, Massachusetts, USA

Sarah K. Volkman & Dyann F. Wirth

Broad Institute, 7 Cambridge Center, Cambridge, 02142, Massachusetts, USA

Sarah K. Volkman, Daniel E. Neafsey, Stephen F. Schaffner, Daniel J. Park & Dyann F. Wirth

School for Nursing and Health Sciences, Simmons College, 300 The Fenway, Boston, 02115, Massachusetts, USA

Department of Organismic and Evolutionary Biology, Harvard University, 26 Oxford Street, Cambridge, 02138, Massachusetts, USA