Informácie

Existuje rozdiel medzi polaritou a hydrofóbnosťou?

Existuje rozdiel medzi polaritou a hydrofóbnosťou?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Z literatúry sa zdá, že tieto dva pojmy sú pri diskusii o proteínových doménach a motívoch zameniteľné. Ale biochemicky, aké sú konkrétne rozdiely medzi týmito dvoma pojmami?

Aký je napríklad rozdiel v týchto vetách:

  1. Globulárne proteínové jadrá majú spravidla hydrofóbne oblasti, zatiaľ čo povrch obsahuje hydrofilné zvyšky smerujúce von.

  2. Vo všeobecnosti majú globulárne proteínové jadrá nepolárne oblasti, zatiaľ čo povrch obsahuje polárne zvyšky smerujúce do vonkajšej strany.


Hydrofobicita znamená averziu voči vode, ktorá je dôsledkom zvýšenia entropie systému v dôsledku interakcie voda-rozpustená látka.

Ako už bolo uvedené v inf3rno, polarita molekuly je spôsobená jej čistým dipólovým momentom. Je pravda, že polárne molekuly sa môžu rozpúšťať vo vode (pretože môžu interagovať s vodou prostredníctvom van der Waalsových síl, najmä síl Keesom a Debye).

CO2 je nepolárny, ale rozpúšťa sa vo vode (v skutočnosti reaguje s vodou). Väčšina nepolárnych látok nemôže interagovať s vodou prostredníctvom van der Waalsových síl.

Stručne povedané, polárne látky zvyčajne nie sú hydrofóbne (t. j. sú hydrofilné), avšak niektoré polárne molekuly, ako sú nitrily, ketóny a estery, môžu byť hydroneutrálne (v strede medzi hydrofóbnymi a hydrofilnými. Pozri tu). Aj veľké polárne molekuly sú nerozpustné vo vode, ako je 1,2-dichlórbenzén a nitrobenzény (Aby bola látka rozpustná, interakcie medzi rozpustenou látkou a rozpúšťadlom by mali byť silnejšie ako interakcie medzi rozpustenou látkou a rozpustenou látkou. „Rozpustný vo vode“ nemusí byť ekvivalentný s „hydrofóbnym“).

Naopak, nepolárne látky sú hydrofóbne (pokiaľ nejde o reaktívne rozpustené látky, ako je Cl2 a CO2).


Hydrofilné prostriedky priťahujú vodu, zatiaľ čo polárne znamená, že molekula má elektrický pól (póly).

Hydrofilná molekula alebo časť molekuly je molekula, ktorá má tendenciu interagovať s vodou alebo inými polárnymi látkami alebo sa v nich rozpúšťať.

  • wikipedia - hydrofil

Polárna molekula má čistý dipól ako výsledok opačných nábojov (t. j. s čiastočnými kladnými a čiastočnými zápornými nábojmi) z polárnych väzieb usporiadaných asymetricky.

Dlhopisy môžu spadať medzi jeden z dvoch extrémov - byť úplne nepolárny alebo úplne polárny. Úplne nepolárna väzba nastane, ak sú elektronegativity identické, a preto majú nulový rozdiel. Úplne polárna väzba sa presnejšie nazýva iónová väzba a vzniká vtedy, ak je rozdiel medzi elektronegativitami dostatočne veľký na to, aby jeden atóm skutočne odobral elektrón druhému. Pojmy „polárny“ a „nepolárny“ sa zvyčajne používajú na kovalentné väzby, to znamená na väzby, kde polarita nie je úplná. Na určenie polarity kovalentnej väzby pomocou numerických priemerov sa berie rozdiel medzi elektronegativitou atómov. Na Paulingovej stupnici, ak je výsledok menší ako 0,4, väzba je spravidla nepolárna kovalentná. Ak je výsledok medzi 0,4 a 1,7, väzba je spravidla polárna kovalentná. Ak je výsledok väčší ako 1,7, väzba sa všeobecne považuje za iónovú.

  • wikipedia - chemická polarita

Voda je polárna. pretože kyslík (3,5) je elektronegatívnejší ako vodík (2,2) a rozdiel (1,3) je medzi 0,4 ÷ 1,7. Kyslík má teda mierny negatívny náboj, zatiaľ čo vodíky majú vo vode mierne pozitívne náboje.

Polárne molekuly sú hydrofilné. napr NH3, EtOH atď... Nepolárne (alebo nepolárne) molekuly sú zvyčajne hydrofóbne, ale môžu existovať výnimky, napr. Cl2 je nepolárny, ale viac rozpustný vo vode ako CO alebo CO2, v dôsledku chemickej reakcie (Cl2 + H2O → HOCl + HCl). Alkoholy obsahujú polárnu -OH skupinu. Alkoholy s krátkym reťazcom sú rozpustné vo vode a sú tak hydrofilné, zatiaľ čo alkoholy s dlhým reťazcom sú vo vode menej rozpustné, sú hydrofóbne, pretože väčšina molekuly obsahuje nepolárne väzby. Molekuly s iónovými väzbami, ako je NaCl, sú hydrofilné, ale nie sú nevyhnutné vo vode rozpustné (napr. AgCl je vo vode zle rozpustný). Myslím si teda, že hydrofilnosť a polarita nie sú synonymá. Toto sú však len výnimky, väčšina hydrofilných zlúčenín je polárna a väčšina hydrofóbnych zlúčenín je nepolárna.

Aminokyselinové zvyšky (a predovšetkým bočné reťazce) nie sú výnimkou, takže v prípade nich sú tieto pojmy synonymá (určite najmenej 20 bežných aminokyselín).

Skladací model HP (hydrofóbno-polárneho) proteínu pochádza z článku Dill. Hovorí väčšinou o solpofóbnych a solpofilných zvyškoch. V súvislosti s vodou používajte termíny hydrofóbne, polárne a nabité aminokyselinové zvyšky. Tento druh klasifikácie aminokyselín môže byť starší, ale (predpokladám) nebol pred modelom HP taký dôležitý.

rozpúšťadlo na médium pozostávajúce z čistých solvofóbnych zvyškov. Na spracovanie vo vode rozpustných proteínov -(q - 2)g teda opisuje prenos hydrofóbnych zvyškov z vody do hydrofóbneho prostredia; na ošetrenie membránových proteínov -(q - 2)g charakterizuje prenos polárnych alebo nabitých zvyškov z nepolárneho prostredia do polárneho prostredia.

  • 1985 - Teória skladania a stability globulárnych proteínov

Podľa Dillovho článku zvyšky môžu byť

  • nabité (1 krát)
  • polárne (2 krát)
  • hydrofilné (0 krát)
  • solpofilný (8 -krát)
  • nepolárny (0 krát)
  • nepolárne (0 krát)
  • nerozpustný vo vode (1 krát)
  • hydrofóbny (3 krát)
  • solofóbny (23 -krát)

Skontroloval som google buď:

  • google"* aminokyselinový zvyšok"Vyhľadávanie

    • iónový 7
    • účtované 104 000
    • polárne 42 000
    • hydrofilné 917 000
    • nepolárnych 101 000
    • nepolárnych 326 000
    • nepolárne 44 000
    • hydrofóbna 111 000
  • googleproteín „* zvyšok“Vyhľadávanie

    • iónový 2 110
    • účtované 120 000
    • polárnych 53 000
    • hydrofilný 33 000
    • nepolárny 4 690
    • nepolárne 15 600
    • nepolárne 284 000
    • hydrofóbny 148 000

Preto sa často používajú všetky hydrofilné, hydrofóbne, nepolárne, polárne a nabité slová. Skontroloval som niektoré knihy a články, niektoré používajú klasifikáciu „hydrofóbne-polárne nabité +/-“ (rovnako ako Dill), ktorá sa zdá byť staršia ako klasifikácia „nepolárna-polárna (neutrálna, kyslá, zásaditá)“ v iných. článkov.

Teraz otázka stále stojí.

Aký je napríklad rozdiel v týchto vetách:

  1. Globulárne proteínové jadrá majú spravidla hydrofóbne oblasti, zatiaľ čo povrch obsahuje hydrofilné zvyšky smerujúce von.

  2. Vo všeobecnosti majú globulárne proteínové jadrá nepolárne oblasti, zatiaľ čo povrch obsahuje polárne zvyšky smerujúce do vonkajšej strany.

Nemyslím si, že je rozdiel medzi významom týchto dvoch viet.

Myslím, že zaujímavejšia otázka je, ktoré aminokyseliny sú v akých skupinách. Skontroloval som nejaké stupnice hydrofóbnosti.

  • Obrázok 1 - zhrnutie stupnice hydrofóbnosti

    • Hydrofobicita aminokyselín pre Kyte - Doolittle (kd), Wimley - White (ww), Hessa - Heijne (hh)
    • Index hydrofóbnosti pre bežné aminokyseliny pre tieto dva indexy
    • tutorvista - Aminokyseliny pre hodnoty pI (pI je možné použiť na filtráciu nabitých)

Zdá sa, že to zďaleka nie je zrejmé. Ako ste už uviedli, je to nepretržité spektrum a je ťažké vytvárať skupiny. Bolo zaujímavé, že Trp (ktorý je silne apolárny) mal záporné čísla na dvoch mierkach (možno údaje neboli spoľahlivé). Čo môžete povedať, ktoré aminokyseliny sú určite polárne (hydrofilné) a ktoré sú určite nepolárne (hydrofóbne). Na základe týchto informácií môžete povedať, ktoré zvyšky budú v nepolárnom jadre (hydrofóbne zvyšky) a ktoré budú na polárnom exteriéri (hydrofóbne zvyšky) a ktoré vytvoria vodíkové väzby hlavného reťazca (polárne zvyšky) a pravdepodobne soľné mostíky (polárne, nabité zvyšky). Ofc. to všetko môže viac -menej závisieť od pH ...


Hydrofóbne a hydrofilné

Hydrofóbne a hydrofilné sily sú interakcie, ktoré slúžia na udržanie chemických skupín umiestnených blízko seba. Také asociácie sú životne dôležité pre štruktúru zložiek mikroorganizmov .

Hydrofóbne („voda nenávidiace“) interakcie sa vytvárajú kvôli nenabitej povahe zahrnutých chemických skupín. Príkladom takejto chemickej skupiny je CH3. Všetky väzby okolo atómu uhlíka sú obsadené. Chemická skupina je opísaná ako nepolárna. Molekula vody — polárna molekula — preto nemôže vytvoriť asociáciu s nepolárnou chemickou skupinou. To má tendenciu vytvárať nestabilitu v sieti molekúl vody, a preto je to nežiaduce. Odpudivá sila okolitých molekúl vody pôsobí tak, že núti hydrofóbne oblasti do asociácie s podobnými oblasťami. Účinok býva tvorením hydrofóbneho „vrecka“ alebo „obalu“ v molekule alebo matrici proteínu alebo uhľohydrátu.

Hydrofilné („milujúce vodu“) sú možné interakcie s polárnou chemickou skupinou. Voda je polárna, pretože kyslík je oveľa elektronegatívnejší ako vodík, a preto elektróny zapojené do väzby kyslík-vodík trávia viac času v blízkosti atómu kyslíka. Vzhľadom na túto nerovnosť zdieľaním elektrónov získava atóm kyslíka čiastočný záporný náboj a atóm vodíka čiastočný kladný náboj. Väzby v molekule vody (orientované na 105 ° v „ohnutom“ molekulárnom tvare) sa navzájom nedokážu navzájom rušiť Ďalšie polárne skupiny potom môžu vytvárať väzby iónového typu s vodou. Regióny bielkovín a iných biologických materiálov, ktoré sú vystavené životnému prostrediu, sú typicky hydrofilné.

Hydrofóbne a hydrofilné interakcie môžu ovplyvniť tvar proteínu. Vzhľadom na polárnu alebo nepolárnu povahu stavebných blokov aminokyselín, ako aj v uhľohydrátových a lipidových zložkách mikroorganizmov, môžu molekuly a niekedy aj celé mikroorganizmy nadobúdať tvary a orientácie, ktoré závisia od intracelulárneho alebo extracelulárneho prostredia.

Sklon hydrofóbnych oblastí proteínu lipidovej molekuly k asociácii od vody je hlavnou hybnou silou pri skladaní proteínov do ich rozmerovej konfigurácie. Okrem toho by tvorba biologických membrán bola extrémne ťažká bez hydrofóbnych a hydrofilných interakcií. Biologické molekuly známe ako fosfolipidy majú hydrofilnú oblasť „hlavy“ a nepolárny, hydrofóbny „chvost“. Tieto sily spôsobujú, že sa molekuly fosfolipidov agregujú dohromady, takže polárne hlavy sú orientované smerom k vode a hydrofóbne chvosty sú uložené vo vnútri. Výsledkom je spontánne vytvorenie membrány. Inzercia funkčne špecializovaných proteínov do tejto takzvanej fosfolipidovej dvojvrstvy vytvára biologickú membránu veľkej zložitosti.

Pozri tiež Bakteriálne membrány a bunková stena Techniky biochemickej analýzy Biochémia Transport bunkovej membrány Plynulosť membrány


  • Rozdiel v elektronegativitách medzi atómami kyslíka a vodíka vytvára na atómoch čiastočné negatívne a kladné náboje.
  • Molekuly vody priťahujú alebo sú priťahované inými polárnymi molekulami.
  • Molekuly, ktoré sa nerozpúšťajú vo vode, sú známe ako hydrofóbne (vodu obávajúce) molekuly.
  • hydrofilné: majú afinitu k vode, ktorá je schopná absorbovať alebo byť zvlhčená vodou
  • hydrofóbne: nedostatok afinity k vode, ktorá nie je schopná absorbovať alebo byť zmáčaná vodou
  • polarita: Intermolekulárne sily medzi mierne pozitívne nabitým koncom jednej molekuly na negatívny koniec inej alebo tej istej molekuly.

Jednou z dôležitých vlastností vody a rsquos je, že je zložená z polárnych molekúl. Dva atómy vodíka a jeden atóm kyslíka v molekulách vody (H.2O) tvoria polárne kovalentné väzby. Aj keď molekula vody nemá čistý náboj, polarita vody vytvára mierne pozitívny náboj na vodíku a mierne negatívny náboj na kyslíku, čo prispieva k príťažlivosti vlastnosti vody a rsquosu. Náboje vody a rsquosu sa generujú, pretože kyslík je elektronegatívnejší alebo milujúci elektróny ako vodík. Je teda pravdepodobnejšie, že zdieľaný elektrón sa nachádza v blízkosti jadra kyslíka ako jadra vodíka. Pretože voda je nelineárna alebo ohnutá molekula, rozdiel v elektronegativite medzi atómami kyslíka a vodíka generuje čiastočný záporný náboj v blízkosti kyslíka a čiastočný kladný náboj v blízkosti oboch vodíkov.

Obrázok ( PageIndex <1> ): Nepolárne molekuly: Olej a voda sa nemiešajú. Ako ukazuje tento makroobraz ropy a vody, olej sa vo vode nerozpúšťa, ale namiesto toho vytvára kvapôčky. Je to spôsobené tým, že ide o nepolárnu zlúčeninu.

V dôsledku polarity vody každá molekula vody priťahuje iné molekuly vody kvôli opačným nábojom medzi nimi, čím sa vytvárajú vodíkové väzby. Voda tiež priťahuje alebo priťahuje ďalšie polárne molekuly a ióny, vrátane mnohých biomolekúl, ako sú cukry, nukleové kyseliny a niektoré aminokyseliny. Polárna látka, ktorá ľahko interaguje s vodou alebo sa vo vode rozpúšťa, sa označuje ako hydrofilná (hydro- = & ldquowater & rdquo -philic = & ldquoloving & rdquo). Naproti tomu nepolárne molekuly, ako sú oleje a tuky, neinteragujú dobre s vodou, ako je znázornené na obrázku. Tieto molekuly sa od nej skôr oddeľujú, než aby sa v nej rozpúšťali, ako to vidíme v šalátových dresingoch obsahujúcich olej a ocot (kyslý vodný roztok) . Tieto nepolárne zlúčeniny sa nazývajú hydrofóbne (hydro- = & ldquowater & rdquo -phobic = & ldquofearing & rdquo).

Vodíkové väzby: Táto interaktíva ukazuje interakciu vodíkových väzieb medzi molekulami vody.


HODNOTENIE VÝSLEDKOV UČENIA

Na najzákladnejšej úrovni je tento učebný plán úspešný, čo dokazujú vysoké skóre, ktoré študenti získavajú za prácu v tomto laboratóriu: z možných 30 bodov bol priemer 25,3 (n = 205). Protokoly serverov od skupín vykonávajúcich toto laboratórium navyše ukázali, že väčšina skupín vytvorila sériu štruktúr, ktoré sledovali zamýšľaný priebeh laboratória (údaje nie sú uvedené). Je zaujímavé, že tieto záznamy ukazujú, že rôzne skupiny študentov riešili problémy pomocou rôznych stratégií. Tabuľka I ukazuje jeden príklad, ktorý predstavuje časový sled štruktúr navrhnutých dvoma rôznymi skupinami pri riešení prvej časti problému 4.

Sekvencie v tabuľke I ukazujú, že aj keď obe skupiny sledovali rôzne cesty, obe problém vyriešili správne. Problém 4 požiadal študentov, aby pridali hydrofilnú skupinu (v tomto prípade -OH) k základnej štruktúre a potom určili, koľko hydrofóbnych uhlíkov bude potrebných na vyváženie príspevku -OH a obnovenie pôvodnej hodnoty logP. Skupina 1 začala s cyklobutánom. Pridali -OH a potom zistili, že tri uhlíky nie sú dostatočné, a tak pridali ďalšie tri, pričom prestrelili požadovanú hodnotu logP. Potom rýchlo odstraňovali nadbytočné uhlíky jeden po druhom, kým nedosiahli požadovaný logP. Skupina 2 začala s lineárnou štruktúrou, etánom a pracovala pomalšie, pridávala uhlíky jeden po druhom, kým nemali požadovaný logP. Hoci tieto dve skupiny sledovali rôzne cesty, našli rovnakú odpoveď: na prekonanie hydrofilného príspevku jednej skupiny -OH sú potrebné približne štyri uhlíky (koncept 4). Ostatné skupiny predviedli množstvo rôznych stratégií na riešenie každého z problémov v laboratóriu.

Irelevantné: irelevantná odpoveď

Atómy: uvedené konkrétne atómy podľa názvu prvku („kyslík“, „atóm C“ atď.)

Nabíjanie: uvedené nabíjanie („+“, „-“, „ión“, „nabíjanie“)

H-väzby: spomínané vodíkové väzby

Všetky prieskumy boli hodnotené nezávisle dvoma výskumníkmi. Spoľahlivosť medzi jednotlivými hodnoteniami bola stanovená pomocou Cohenovej Kappa [9]. Vo všetkých prípadoch bola Kappa väčšia ako zvyčajne akceptovaná hodnota 0,7.

Prieskum bol administrovaný pomocou upraveného protokolu pred/po inštrukcii, ktorý sme použili v iných štúdiách [8]. Študenti (spolu 169: 82% z 205 študentov v triede) vrátili prieskum pred inštrukciami bezprostredne po prvých troch prednáškach z chémie, ktoré sa zaoberali atómovou štruktúrou a kovalentnými väzbami. Po prednáškach o nekovalentnej väzbe približne polovica študentov (n = 80) dokončili post-prieskum na začiatku Laboratória chemických vlastností. Táto skupina bola vystavená iba prednáškam, nazýva sa skupina „Iba prednáška“. Druhá polovica triedy (n = 89) dokončil následný prieskum na konci laboratória chemických vlastností. Táto skupina zažila prednášku aj laboratórium, hovorí sa jej skupina „Prednáška a laboratórium“. Jednotlivé laboratórne sekcie boli náhodne zaradené do oboch skupín tak, že každá TA vyučovala jednu sekciu „Len prednáška“ a jednu „Prednáška a laboratórium“. Tento protokol je znázornený na obr

Obr. 2 ukazuje výsledky hodnotenia prieskumov všetkých štyroch skupín, stĺpce na tomto obrázku sú vytieňované, aby zodpovedali zodpovedajúcim stĺpcom na obr. 1. Náš protokol správy prieskumu umožňuje niekoľko relevantných porovnaní medzi týmito skupinami. Po prvé, pretože dve skupiny pred vyučovaním („Prednáška“ a „Prednáška a laboratórium“) sú náhodné vzorky študentskej populácie odobraté v rovnakom čase, ich skóre by sa nemalo výrazne líšiť. Zistilo sa, že je to pravda, pomocou testu χ 2 pre všetky zobrazené kategórie.

Rozdiely medzi skupinami „prednáška“ a „prednáška“ ukazujú účinok prednášok samy osebe (McNemarov test významnosti p <<0,05 označené hviezdičkou). Na základe toho sa percento študentov, ktorí boli schopní rozpoznať hydrofóbnejšie z týchto dvoch štruktúr (časť A) a vytvoriť správne vysvetlenia pre štruktúry, ktoré vytvorili v časti B, zvýšilo po prezentácii prednášky. Pokiaľ ide o kategórie reakcií, „prázdne“ a „nerelevantné“ reakcie na časť C výrazne klesli a zmienka o konkrétnych atómoch v molekule a vodíkových väzbách sa výrazne zvýšila. Laboratórne činnosti nemajú na tieto kategórie reakcií žiadny ďalší významný vplyv.

Rozdiely medzi skupinami „po prednáške“ a „po prednáške a laboratóriu“ odrážajú prírastkový účinok laboratória po prednáškach (pomocou testu χ 2 na významnosť p <0,05 označený „+“). Po prednáškach niektorí študenti vo svojich odpovediach spomenuli poplatok (Koncept 2), aj keď to nie je relevantné pre tento problém. Podiel študentov, ktorí poskytli toto nevhodné vysvetlenie, sa po laboratóriu výrazne znížil. Najdôležitejšie je, že schopnosť študentov kresliť chemicky správne štruktúry strednej hydrofóbnosti (časť B) sa zvýšila až po tom, ako študenti vykonali laboratórium. Tieto výsledky naznačujú, že zatiaľ čo prednášky poskytovali terminológiu, laboratórium bolo pre študentov potrebné na uvedenie týchto konceptov do praxe. Tieto výsledky sú v súlade s dôrazom laboratória na kreslenie štruktúr a skúmaním ich hodnôt logP a naznačujú, že predstavuje základnú súčasť učebných osnov. Pretože študenti trávia väčšinu svojho laboratórneho času prácou na počítačových cvičeniach, je pravdepodobné, že tieto práce významne prispejú k ich učeniu.


Ako možno rozlíšiť lipid od cukru?

Naše webové stránky sú možné zobrazovaním online reklám našim návštevníkom. Zvážte podporu nás deaktivovaním blokovania reklám.

(Posledná aktualizácia: 20. júla 2020) Štrukturálne vlastnosti lipidu (napr. Tryacylglycerol) a cukru (napr. Glukózy)

Predtým, ako prejdete k hlavnej téme “ako je možné rozlíšiť lipid od cukru ”, musíte vedieť, čo to je a z čoho sa skladá. Lipid a cukor sú biomolekuly a svojim spôsobom zohrávajú dôležitú úlohu. Molekuly cukru sú však prítomné v polymérnej forme nazývanej polysacharidy, zatiaľ čo molekuly lipidov nie sú polymérnej povahy.

Základnou vlastnosťou, ktorá môže odpovedať na otázku, ako je možné odlíšiť lipid od cukru, je hydrofóbnosť. Môžete sa opýtať, čo je hydrofóbnosť. Aby sme to jednoduchým spôsobom pochopili, hydrofóbnosť alebo hydrofóbnosť je vlastnosť biomolekúl, ktoré sú nerozpustné vo vode a nereagujú s molekulami vody. Také hydrofóbne molekuly majú tendenciu agregovať, keď sú umiestnené do vody alebo vodného rozpúšťadla. Rovnakým spôsobom existujú biomolekuly, ktoré sú rozpustné vo vode a sú schopné interakcie s molekulami vody, keď sú umiestnené vo vodnom prostredí.

Teraz poďme k veci. Ako nám teda hydrofóbia pomáha odlíšiť lipid od cukru. Cukry alebo uhľohydráty, ktoré sú viacsýtnymi zlúčeninami. nazývajú sa uhľohydráty, pretože sú to hydráty uhlíka. Ak vidíte empirický vzorec sacharidov, môžete vidieť, že sacharidy sú reprezentované ako Cn(H.2O)n. Prítomnosť hydroxyskupiny na väčšine atómov uhlíka spôsobuje, že molekula cukru je hydrofilná a všetky tieto skupiny -OH môžu vytvárať vodíkovú väzbu s molekulami vody vo vodnom prostredí. Preto sú molekuly cukru rozpustné vo vode a všetkých ostatných polárnych rozpúšťadlách.

Ak vidíte štruktúru lipidu, väčšina lipidov je tvorená voľnými mastnými kyselinami s dlhým reťazcom naviazanými na glycerol prostredníctvom esterovej väzby. Aj keď existujú niektoré lipidy, ako sú glykolipidy, ktoré obsahujú molekuly cukru a fosfolipidy, ktoré obsahujú hlavnú skupinu fosfátov, sú vo vode málo rozpustné alebo nerozpustné. Hlavným dôvodom nerozpustnosti vo vode je hydrofóbnosť spôsobená zvyškami voľných mastných kyselín.

Hoci esterová väzba je polárna a je schopná vytvoriť vodíkovú väzbu s molekulami vody, lipidy sú nerozpustné. Hydrofobicita spôsobená voľnými mastnými acylovými skupinami prevažuje nad polaritou, ktorú spôsobujú esterové väzby, a preto je celkovým výsledkom nerozpustnosť.


Hydrofilita vs. hydrofóbnosť a#8211 Význam vody v potravinách

Niekedy vám môže byť termín taký známy, že ho používate stále, zatiaľ čo iná osoba, ktorá ho nepozná, nevie, o čom hovoríte. Keď hovoríme o vede, môže to byť celkom bežný problém. A aj keď sa snažíme udržať úroveň našich príspevkov na takej úrovni, aby boli dostupné aj pre nevedeckých pracovníkov, prídu chvíle, keď bude naraz príliš veľa výrazov. Preto venujeme veľa príspevkov základom potravinárskej vedy. A toto je ďalší z nich, kde sa diskutuje o pojmoch hydrofilný a hydrofóbny, pričom sa zavádza polarita a elektronegativita.

Význam vody v potravinách

V potravinách je voda celkom bežná, aj keď je to podhodnotenie, je to veľmi bežné. A interakcia molekúl s vodou je teda niečo, čo často popisujeme. Niektoré molekuly sa môžu rozpustiť vo vode, zatiaľ čo iné nie, niektoré zložky radi sedia vo vode, zatiaľ čo iné nie. Na popísanie tohto správania pomocou vody je potrebná správna terminológia. Zvlášť najzákladnejším vzťahom k vode je molekula milujúca vodu alebo nenávidiaca vodu. Tu prichádzajú na rad hydrofilné a hydrofóbne.

Voda, elektronegativita a polarita

To, či molekula rada sedí vo vode alebo nie, má veľa spoločného s polaritou molekuly. Voda je takzvaná polárna molekula.

Všetky atómy majú elektróny ‘ plávajúce ’ okolo jadra svojho stredu. Tieto elektróny sú negatívne nabité. Stred atómu pritiahne elektróny k sebe. Sila, s akou to atóm robí, sa líši podľa atómu a vyjadruje sa pomocou termínu elektronegativita. Kyslík a dusík sú príklady atómov, ktoré dosť silno ťahajú atómy, majú vyššiu hodnotu elektronegativity.

Keď sa atómy navzájom spoja, nevyhrajú a všetky tak silno priťahujú atómy okolo seba. Nevyhrali iba#svoje vlastné elektróny, ale všetky elektróny v ich okolí. Atóm s vysokou elektronegativitou teda k sebe pritiahne všetky elektróny o niečo viac. Výsledkom je, že oblak elektrónov sa môže trocha posunúť a nemusí sa šíriť rovnomerne. Ak k tomu dôjde, molekula sa nazýva polárna.

Aby sa oblak posunul trochu mimo stredu, rôzne sily atómu by sa nemali navzájom rušiť. Ak napríklad existuje atóm, ktorý silne priťahuje na ľavú aj pravú stranu molekuly, pričom zvyšok je rovnomerný, tieto dve sily sa pravdepodobne navzájom zrušia. Ak však obaja sedia na jednej strane, vyhrali ’t.

Voda je polárna

Voda je príkladom takejto polárnej molekuly. Voda sa skladá z jedného atómu kyslíka a dvoch atómov vodíka. Kyslík priťahuje na elektróny o niečo ťažšie ako atómy vodíka. A čo viac, molekula vody nie je úplne symetrická. Inými slovami, sily sa nezrušia. Na nasledujúcom obrázku je znázornený obrázok 8217, pretože atómy vodíka sú nasmerované mierne nadol, horná strana má o niečo viac elektrónov ako dolná strana. Je to označené symbolom gréckej delty a typom náboja na každej strane.

Voda je polárna molekula.

Hydrofilné

Keď molekula rada sedí vo vode, nazýva sa to hydrofilná (= milujúca vodu). Hydrofilné molekuly majú tendenciu byť polárne molekuly, rovnako ako voda, ale môžu to byť aj ióny (napríklad rozpustené soli). Väčšina z nich má spoločné to, že majú nejaký nenulový elektrický náboj. Tieto poplatky môžu navzájom interagovať.

V potravinách sú bežnými príkladmi hydrofilných molekúl v potravinách cukry (majú kyslíkovú skupinu, ktorá ich robí polárnymi a majú tendenciu byť asymetrické), ale aj soľ alebo určité aminokyseliny.

Hydrofóbne

Naopak, keď molekula nechce sedieť vo vode, nazýva sa to hydrofóbna. Ak sa hydrofóbna molekula zmieša s vodou, budú mať tieto dve tendenciu sa oddeliť a vytvoriť dve jednotlivé fázy.

Hydrofóbne molekuly sú vo všeobecnosti nepolárne molekuly, nemajú toto mierne nerovnomerné rozloženie náboja. Najbežnejším príkladom hydrofóbnych molekúl v potravinách sú tuky a oleje.

Hydrofilné a hydrofóbne v jednom

Niektoré molekuly majú vo svojej štruktúre hydrofilné aj hydrofóbne rezy. To je obzvlášť bežné pre proteíny, ale je to tiež bežná vlastnosť takzvaných emulgátorov. Emulgátory môžu byť použité na zmiešanie oleja a vody a v tomto prípade to robia tak, že sedia vo vodnej aj olejovej fáze s inou časťou molekuly. Tak udržia tých dvoch pohromade a zabránia im v oddelení! Vaječný žĺtok v majonéze je toho skvelým príkladom.

Majonéza v pravom hornom rohu používa vaječný žĺtok ako emulgátor, ktorý pomáha predchádzať oddeľovaniu vody a tuku.


Sacharidy

Carbo- pochádza z latinského slova pre uhlie, hydr- pochádza zo slova pre vodu (hudōr) v gréčtine a -ate pochádza zo slova pre viac atómov kyslíka v chémii. Takže sacharidy sú mokré uhlie plné kyslíka! no.. takmer.

Sacharidy sa nazývajú uhľohydráty, pretože sú vyrobené z atómov uhlíka, vodíka a kyslíka a líšia sa v mnohých formách. V najjednoduchšej forme sa sacharidy nachádzajú ako monosacharidy (jednotlivé cukry). Pravdepodobne ste už počuli o glukóze-to je jeden z nich. Fruktóza, galaktóza a ribóza sú ďalšie príklady monosacharidov (nemusíte správne hláskovať na prvý pokus, nebojte sa). Keď sa dva monosacharidy spoja- vznikne disacharid (dva cukry, pravdepodobne teraz vidíte vzorec). Trstinový cukor (alebo len .. cukor v angličtine) sa vyrába z glukózy a fruktózy, ktoré sú navzájom spojené. Laktóza (vec, ktorú nájdete v mlieku a spôsobuje nevoľnosť Ázijcom a starým ľuďom) [2] je vyrobená z glukózy a galaktózy spojených dohromady. Škrob a vláknina sú polysacharidy a vyrobené z mnohých takýchto monosacharidov spojených dohromady.

Sacharidy sú zdrojom energie pre život. Svoje získate od zvierat, ktoré svoje získajú z rastlín (alebo môžete prostredníka odstrihnúť a chytiť ho priamo z rastlín). Rastliny si však pomocou vedy(.) a mágie VYRÁBAJÚ sacharidy zo vzduchu, vody a SLNEČNÉHO SVETLA (toto nie je v pohode). Sacharidy sú to, čo robí vaše jedlo chuťou tak dobre (tip: pizza, hranolky, biryani, pad thai, muffiny, koláče, šišky, čokolády, zmrzlina a zoznam pokračuje donekonečna), pravdepodobne preto, že ste sa vyvinuli tak, že ich máte radi. Sacharidy sa vo vašom žalúdku rozkladajú na jednoduché cukry (monosacharidy) a potom sa tieto jednoduché cukry ďalej rozkladajú vo vašich mitochondriách, aby sa uvoľnilo obrovské množstvo energie, ktorú používate na dýchanie, myslenie, pumpovanie krvi, trávenie, pohyb, beh, boj. „rozprávajte sa, rastte, opravujte a v zásade robte všetko, čo vás prinúti, ty. To sa dosahuje procesom nazývaným bunkové dýchanie, ktorý presahuje rámec tohto blogu (toto je jedna z vecí, ktoré by som nie s nadšením vysvetľovať. Tu je priznanie- milujem chémiu a virológiu, NIE biológiu).


Hydrofóbne samonosné monovrstvy

Sklo je v podstate sieť spojených atómov kremíka a kyslíka. Občas sa objaví obnažená OH alebo hydroxylová skupina [1]. Táto hydroxylová skupina má silnú polaritu rovnako ako voda v dôsledku skutočnosti, že kyslík je elektronegatívny. Pretože odhalené hydroxylové skupiny sú polárne rovnako ako voda, voda je do týchto skupín skutočne priťahovaná. Táto príťažlivosť spôsobuje, že sa voda prilepí na sklo a roztečie sa namiesto toho, aby sa valila. Rain-X a Aquapel zabraňujú tejto interakcii, aby sa voda mohla odtiecť hneď. Aby sme úplne pochopili, ako funguje, musia byť preskúmané chemické štruktúry.

PDMS je jednoduchý polymér zložený z kremíka, kyslíka a uhlíka obsahujúcich skupiny “metyl ”. Vďaka týmto metylovým skupinám obsahujúcim uhlík je polymér podobný olejom, pretože tieto uhlíky sú nepolárne rovnako ako uhlíky v oleji.

Dlhý reťazec uhlíka a fluóru ’s vytvára podobnú nepolárnu chemikáliu ako Rain-X

Čím je materiál hydrofóbnejší, tým je kontaktný uhol väčší, čím väčší je kontaktný uhol, tým ľahšie voda skĺzne. To dáva zmysel, pretože keď má voda veľký uhol, na vodnej kvapke sa menej drží a drží#8221.

Podľa štúdie Kamitaniho [8] má PDMS menší uhol sklzu (čo znamená, že sa ľahšie skĺzne), ale menší uhol kontaktu, zatiaľ čo súčasné chemikálie FAS majú väčší kontaktný uhol, ale väčší uhol sklzu. V tomto prípade je nesúlad spôsobený fyzikálnou povahou chemikálií. Reťazce perfluórovaných uhľovodíkov viac interagujú s molekulou vody, čo spôsobuje, že zostávajú na mieste [9]. Laboratórium bolo tiež schopné navrhnúť účinnejšiu chemikáliu FAS, ktorá zodpovedá PDMS. To by sa v budúcnosti mohlo použiť na vytvorenie lepšieho repelentu predného skla.

Aby sa FAS mohol viazať na sklené chemikálie, musí byť mierne upravený. Skupina obsahujúca kyslík je vynikajúca pri viazaní na sklo, ale iba vtedy, ak sú vystavené kyslíku. V prípade FAS sú všetky kyslík ’ viazané s uhlíkmi a nie sú exponované. Na vystavenie týchto kyslíkov je monomér FAS17 vystavený špecifickému množstvu kyseliny dusičnej. Táto kyselina dusičná štiepi väzbu medzi kyslíkom a uhlíkom, čo umožňuje odhalenie kyslíkových skupín [10]. Exponovaný kyslík sa potom ľahko viaže na exponované hydroxylové skupiny na skle. Vedľajším produktom tejto adície kyseliny je, že monoméry FAS polymerizujú. Predchádzajúci výskum ukázal, že diméry (dva monoméry dohromady) a triméry (tri monoméry dohromady) boli pri lepení na sklo najúčinnejšie. Pri ďalšej polymerizácii sa polymér stal príliš objemným na to, aby sa spojil so sklom. Nasledujúca schéma ukazuje proces aktivácie chemikálií FAS [11]:


Diskusia

Hydrofóbnosť bola dlho považovaná za jednu z primárnych hnacích síl pri skladaní proteínov. It has been shown, and reconfirmed by our results, that the hydrophobicity of an amino acid is, indeed, correlated with its average surface exposure. However, the degree to which this correlation extends to the relationship between specific amino acid sequences and surface patterns has received little investigation. We have now quantified this correlation for several widely used hydrophobicity scales, and have shown that amino acid hydrophobicity does play a statistically significant role in shaping the surface-exposure pattern of a structure. However the distributions of correlation coefficients are broad, and remain far from the optimal case in which the surface-exposure pattern would show a perfect correlation with the hydrophobicity pattern.

The origin of this suboptimal correlation may lie in the fact that there are factors other than hydrophobicity that contribute to the determination of a protein's final fold. There are clearly other forces at work in determining a protein's ultimate fold, for example, a recent study suggested that hydrophobicity alone cannot account for the observed thermodynamics of protein folding (Chan 2000 ). Thus, some residues' behavior may not be solely dictated by hydrophobicity. Using updated data, we carried out an analysis similar to Rose et al. ( 1985 ) to determine the surface-exposure distributions of each of the amino acids, and found that many were rather broad. Indeed, several amino acids have essentially flat distributions, and hence their exposure seems to be uncorrelated with their hydrophobicity. Such broad distributions are in part responsible for the less than optimal correlation, and we showed that using only a subset of amino acids that have more peaked distributions led to improved correlations. The exposure distributions reflect all of the forces that are involved in the folding process, and we have found several discrepancies between the most likely exposure of an individual amino acid and its hydrophobicity. An example is provided by cysteine, for which the ability to form disulfide bonds with other cysteine residues constitutes a factor independent of hydrophobicity that influences surface exposure. From the distributions we computed a scale that reflects the surface-exposure propensities of the amino acids. This goes beyond just hydrophobicity and leads to an improvement in the correlation between sequence and the surface-exposure pattern of a fold. Hence, for folding studies that use energy models that are based solely on side-chain solvation, using these database-derived distributions (or the ASAs computed from them) over the empirical hydrophobicity scales should lead to a better performance.

By far the greatest improvement was achieved when we computed the correlation coefficients between average hydrophobicity sequences and structures. The average hydrophobicity sequence gives a better measure of the sequence that best matches the structure (Finkelstein 1998 ). The low correlation observed at the single-sequence level shows that there can be a broad variation from that of the “best match” sequence. From theoretical models, it is predicted that thermodynamically stable folds are those that are also highly designable that is, they have a large number of sequences that fold into them (Li et al. 1996 Emberly et al. 2002 Miller et al. 2002 ). This large degree of mutational stability for designable folds means that there can be significant departures from the lowest energy sequence. In fact, if sequences were selected at random from a large pool of sequences that fold into a designable structure, it would be more likely to select a sequence far from the central “best match” sequence than not. Even if a sequence started near the “center” (best match sequence), its “neutral” evolution would lead it to somewhere farther away from the center in the sequence space owing to the sequence entropy (Li et al. 1998 Taverna and Goldstein 2002a ). Hence, the lack of strong correlation between sequence and structure found in the database could be a signature of designability in nature. It has also been postulated that it may even be advantageous for sequences to select against being near the “best match,” as such selection helps to improve plasticity in sequence space (Taverna and Goldstein 2002b ).

We have shown that the correlation improves when one uses the average hydrophobicity sequence however, we have also found that even the average sequence is not perfectly correlated with the surface-exposure pattern. This could simply be because of insufficient sampling of sequence space or could be evidence of something more fundamental. It has been argued that having a suboptimal correlation between a protein's amino acid sequence and surface-exposure pattern may help to improve the thermodynamic stability of the fold and “design out” competing folds (DeGrado 1997 ). All of the average hydrophobicity patterns for the most designable model helix structures have “misspellings” at various locations, where a misspelling involves the placement of a hydrophobic residue on an exposed site or a polar residue in the core. These departures from the optimal pairing of hydrophobicity with exposure have been shown in other theoretical studies (Emberly et al. 2002 ) to help increase the energy gap between the ground state and competing structures. If the hypothesis of designing out competing structures through suboptimal correlation is valid, this has important consequences for structural design based on binary patterning (Kamtekar et al. 1993 ). The surface pattern of the structure may act as a starting point for the selection of an amino acid sequence, but it may then prove advantageous to depart from this blueprint to improve thermodynamic stability. Database analysis of the type performed here may form the basis for advanced techniques to detect further correlations between sequence and structure that would help to better design sequences in protein design.


Výsledky

Assessing Topology-Prediction Accuracy.

We used three published datasets to test topology-prediction accuracy. First, prediction accuracy of membrane-span locations was assessed using the Reeb dataset, which is based on a nonredundant set of 188 high-resolution structures (with a pairwise sequence-identity cutoff of 20% ref. 16). For each of the query sequences in the Reeb dataset we defined “overlap10” to represent whether the correct number of membrane-spanning segments was predicted, and whether at least 10 residues of each predicted segment overlapped with an inserted segment in the experimentally determined structure. Second, to assess orientation-prediction accuracy we used a set of 609 Escherichia coli inner membrane proteins, for which the location of the C terminus (cytoplasmic or periplasmic) was experimentally determined (24). Third, we assessed discrimination of soluble and membrane-spanning proteins using an annotated nonredundant set (<30% pairwise sequence identity) of 3,400 soluble proteins and 311 membrane proteins of known structure (13, 25). We compared the performance of TopGraph and TOPCONS, a topology predictor that uses the consensus of five statistical predictors (13, 26), in these three tests, and additionally analyzed the overlap10 performance of the Lep scale on the Reeb dataset.

A Graphical Algorithm for Membrane-Topology Prediction.

We set ourselves the goal of predicting membrane-protein topology based on insertion energies and without invoking statistical inference to predict insertion propensities. Given a query sequence we start by using a sliding window to extract all subsequences of lengths 21–30 amino acid residues. The dsTβL scales (21) do not report on secondary-structure propensity nor on the existence of signal peptides, which are often cleaved post translationally. We therefore eliminate all signal peptides predicted by TOPCONS (13) and any subsequence that is predicted to be nonhelical (27), as well as subsequences that contain several charged or polar residues (Metódy SI). To the remaining segments we assign apparent insertion free energies according to the dsTβL scale (21) in each of the two orientations relative to the membrane (locating the C-terminus either in the cytoplasm or outside). Because segments vary in length, we estimate the location z of every amino acid position i in the segment relative to the membrane midplane: z ( i ) = 30 n i − 15 , [1] where n is the total number of residues in the segment and i is the amino acid position relative to the segment’s start z(i) ranges from −15 to +15 Å, for cytoplasmic and extracellular locations, respectively. The segment’s apparent insertion free energy is then given by: Δ G insertion app = ∑ i = 1 n Δ G AA z ( i ) , [2] where Δ G A A z ( i ) is the apparent insertion free energy for amino acid type AA at location z(i) according to dsTβL.

Before running predictions, we modified the dsTβL profiles for the positively charged residue Lys and for the hydrophobic residues Val, Leu, Ile, and Met (Fig. S1 and Table S1). Specifically, in the original dsTβL report (21), Val, Leu, and Met showed slightly nonsymmetric profiles, whereas the other hydrophobics, Ile and Phe, were close to symmetric, as expected. We therefore changed the hydrophobic residues’ profiles so that all were symmetric, and maintained the insertion energy at the membrane midplane as in the original dsTβL scales. Furthermore, the energy contribution of Lys at the cytoplasmic side of the membrane in the original dsTβL scale was slightly positive (+0.2 kcal/mol), thereby penalizing lysine-containing membrane-spanning segments. We therefore modified the Lys profile to be slightly negative (−0.1 kcal/mol) at the cytoplasm interface. These corrections increase the deviation between the polynomial functions used to fit the dsTβL data, but the most extreme deviation is only 0.84 kcal/mol (Leu at the membrane–cytoplasm interface Fig. S1 and Table S1). In preliminary prediction runs we noticed that these changes do not affect prediction accuracy significantly.

Corrections to the dsTβL insertion energies. (A) The dsTβL insertion profiles for hydrophobic residues normalized to the interval 0 (most hydrophobic) to 1 (least hydrophobic). Whereas the Ile and Phe profiles are nearly symmetric, as expected, the other profiles are not. (B) The insertion profiles of Ile, Leu, Val, and Met were corrected to be symmetric, and maintain the same insertion energy at the membrane midplane as measured in the original dsTβL experiment. The profile for Lys was modified to be slightly negative at the cytoplasmic side (−15 Å) this change favors the extension of hydrophobic segment to include cytoplasmic Lys residues. Equations for the modified profiles are provided in Table S1. The corrected profiles (red) are different from the original profiles (blue) by at most 0.84 kcal/mol (Leu at the cytoplasm–membrane interface Table S1).

Polynomial fit for the insertion profiles of amino acids that were modified relative to the dsTβL measurements (21)

We represent subsequences in the query and their apparent insertion energies as a graph, where nodes N. stand for each subsequence (Fig. 1A). Nodes N.i a N.j are connected with a directed edge N.iN.j if and only if N.i precedes and does not overlap with N.j in the query sequence and the two segments are inverted with respect to one another that is, one segment’s N terminus is cytoplasmic, and the other’s C terminus is cytoplasmic. In addition, a virtual source node is connected to all other nodes, and every edge is weighted according to its successor node’s Δ G i n s e r t i o n a p p (Eq. 2) that is, the weight of edge N.iN.j is the insertion energy of the segment represented by N.j plus the contributions from positive residues (Lys, Arg, and His) within a five amino acid stretch C terminal to N.i, and similarly, five amino acids N terminal to N.j (Metódy SI). In this graphical representation, the minimum-energy path starting from the source predicts not only the location of membrane-spanning segments, as in previous predictors, but also the orientation of the protein with respect to the membrane and the length of each inserted segment. To search for the minimum-energy path we use the Bellman–Ford algorithm (28), which takes under 10 s to find minimal paths on a representative 265 amino acid protein using a standard CPU.

Schematic representation of the graphical topology-prediction algorithm TopGraph. (A) Cylinders represent sequence segments (nodes in the graph) in either insertion orientation. Curved gray arrows represent edges connecting nodes curved black arrows denote the minimum-energy path. Faded cylinders represent nodes not in the minimum-energy path. (B) A constraint (dashed lines) eliminates all edges bypassing it, guaranteeing, by construction, that only segments satisfying the constraint are chosen. Vložky show final predicted topology.

Constraints on the locations of membrane-spanning segments within the query can improve prediction accuracy. In the benchmark below we test the unconstrained prediction as well as two types of constraints: from multiple-sequence alignments (MSA) of homologous sequences, and from the TOPCONS predictor (13). To maintain the validity of the apparent insertion energies we do not use information other than from the query sequence itself to assign segment energies rather, we use the information from MSAs or from TOPCONS only to determine where membrane spans are likely to be located, and compute the query’s insertion energy by optimizing the inserted segments’ precise locations and orientations within a stretch that includes five positions on either side of the segment determined using the MSA or TOPCONS. TopGraph MSA conducts the search in two steps: it first predicts membrane-spanning locations using the MSA, and subsequently uses this information as location constraints in a search for minimum-energy paths in the query sequence (Fig. S2). In TopGraph TOPCONS , by contrast, the locations of membrane-spanning segments are predicted using TOPCONS (13), and are then used to constrain the locations of membrane-spanning segments in a search for minimum-energy paths in the query (Fig. 1B). Alternative predictors could be used to constrain the locations of membrane-spanning segments with no loss in generality.

TopGraph MSA algorithm flowchart. (A) Nonredundant MSA is generated for a query sequence using BLAST, CD-HIT clustering, and MUSCLE alignment. For every possible segment Δ G i n s e r t i o n a p p is calculated. Values different from the query’s Δ G i n s e r t i o n a p p by more than 5 kcal/mol are discarded. The minimal value found is used as the weight for all edges leading to the segment’s node. The Bellman–Ford algorithm is applied to find the minimum energy topology. Using the minimal topology, constraints are derived for every chosen segment. A graph is rebuilt such that every segment found in the MSA is a constraint, and weights are assigned as the Δ G i n s e r t i o n a p p of the corresponding query sequence. The Bellman–Ford algorithm (28) is used again to find the minimal energy topology.

All three TopGraph variants predict the locations, lengths, orientations, and insertion energies of the query sequence. We note, additionally, that the graphical representation lends itself to imposing other types of constraints, which may be inferred from experimental or computational data for instance, if a certain segment N.k is known to span the membrane, all edges N.iN.j that bypass N.k may be eliminated (Fig. 1B). Conversely, nodes representing segments that are known not to cross the membrane may be eliminated, and prior data regarding the orientation of the protein in the membrane can be used to select the lowest-energy path through the graph in the known orientation. The ability to define a variety of topological constraints could aid the study of membrane proteins with incomplete structural data, such as on probe accessibility or proteolysis resistance (29), and we implemented a webserver providing free access to TopGraph including such manually constrained prediction (topgraph.weizmann.ac.il).

Prediction Accuracy Increases with Use of Prior Data.

The purist TopGraph predictor, with no use of prior data predicts the locations of membrane segments in single-span proteins with high accuracy (94% Fig. 2A). This high accuracy is not surprising given that the dsTβL scale is based on experimental data on a single-span membrane protein (21). Multispan membrane proteins are accordingly predicted less accurately, and above four segments prediction accuracy drops to 46% the overall prediction accuracy across the entire set is 78%. When either of the two lowest-energy predicted paths is compared with the known topology, prediction accuracy increases from 70% to 80% for proteins with two to four membrane spans, and more modestly for larger membrane domains. The preprocessing filters that remove signal peptides, highly charged and nonhelical segments make a substantial contribution to prediction accuracy by eliminating, on average, two-thirds of the segments with Δ G insertion app < 5 kcal/mol in each target sequence (Fig. S3). Nevertheless, prediction accuracy is high even in proteins, in which less than 20% of the sequence is eliminated by these filters specifically, all of these proteins are predicted correctly according to the overlap10 metric.

Topology-prediction benchmark. (A, Vľavo) Fraction of proteins where all predicted membrane spans overlap with experimentally observed membrane-spanning segments over at least 10 residues (overlap10) and there are no additional predicted segments. The number of proteins in each group is noted above the bars dashed lines represent accuracy when considering either of the two best-energy predictions. (Správny) Orientation-prediction accuracy of the C-terminal position (cytoplasmic or extracellular). (B) Distribution of insertion energies in individual membrane-spanning segments. Natural TMs reports the insertion-energy distribution of membrane-spanning segments annotated by the structure-based PDBTM (31). (C) Experimentally determined structure (PDB entry: 4K1C ref. 42) annotated according to the TopGraph MSA prediction: thin ribbon, extramembrane thick ribbon, membrane spanning two membrane-spanning segments with minimal and maximal predicted lengths are colored in turquoise and purple, respectively, and their lengths are noted.

Percent of segments eliminated by the secondary-structure and polar-residues filters in sequences from all four datasets. The percent of segments with Δ G i n s e r t i o n a p p < 5 kcal/mol, which pass the secondary-structure and polar-residues filters is calculated for every sequence in each dataset. Reeb dataset in red (16) experimentally determined C-terminus orientation dataset in blue (24) soluble and transmembrane datasets in yellow and green, respectively (13). The two filters prune over half of the segments, particularly in the nonredundant set of soluble proteins, where, on average >99% of each sequence is eliminated. (Vložka) The distribution of Δ G i n s e r t i o n a p p for every segment in the Reeb dataset that passes the PSIPRED and charges prefilters. Also 74% of the segments eliminated by the two filters also have very high apparent insertion energy Δ G i n s e r t i o n a p p > 5 kcal/mol (noted by the dashed vertical line).

For comparison, we replaced the dsTβL profiles with those from the Lep study (9) and tested prediction accuracy using the same algorithm as used for dsTβL (Fig. 2A). Bernsel et al. previously noted that the average energy assigned to single-spanning domains by the Lep scales is only slightly negative (approximately −0.3 kcal/mol) and that segments in multispanning domains are assigned positive energies on average (10), TopGraph Lep prediction accuracy is correspondingly modest (56%) for single-spanning domains it drops to 20% for proteins with two to four membrane spans, and there are nearly no correct predictions (3%) for larger membrane domains, with 34% overall prediction accuracy. These results are consistent with previous observations that the Lep insertion energetics are small for hydrophobic residues (9, 10, 17 ⇓ –19, 21, 30) because single-span membrane domains are typically more hydrophobic than multispan domains (10), the Lep scale predicts location more accurately in the former than in the latter.

We hypothesized that TopGraph MSA may improve prediction accuracy relative to the purist TopGraph. The basis for this hypothesis is that homologous proteins are likely to have the same topology. Furthermore, although any given membrane protein must encode sufficiently favorable membrane-insertion free energy, individual segments in any protein may have lower insertion propensity than aligned segments in homologs. TopGraph MSA retains TopGraph’s high accuracy in single-pass membrane proteins (95%) and indeed improves on unconstrained TopGraph, reaching 61% accuracy for membrane proteins with more than four spans and overall prediction accuracy of 84% (Fig. 2A). Furthermore, when considering either of the two lowest-energy paths, prediction accuracy improves to 87%, on par with TOPCONS (89%). TopGraph TOPCONS shows nearly identical performance to TopGraph MSA with overall prediction accuracy of 89%.

Energy-Based Prediction of Protein Orientation with Respect to the Membrane Plane.

The dsTβL scale differs from other scales in showing large asymmetries for the localization of the positively charged residues, Arg, Lys, and His, in the cytoplasm compared with the extracellular space (21) this asymmetry is a prerequisite for energy-based prediction of membrane-protein orientation. Indeed, TopGraph correctly predicts orientation in 84% of the proteins in a benchmark of 609 bacterial proteins of experimentally determined orientation (24) overall accuracy is 82% and 90%, for TopGraph MSA and TopGraph TOPCONS , respectively, compared with 90% for TOPCONS (Fig. 2A).

The three TopGraph variants output apparent insertion free energies that are based on the dsTβL scale (21). Applied to the Reeb dataset (16), nearly all segments (99%) predicted using the purist TopGraph exhibit negative apparent insertion energies with a mean of −6.9 kcal/mol (Fig. 2B). Using the more accurate predictors TopGraph MSA and TopGraph TOPCONS the mean shifts to −6.4 and −5.7 kcal/mol, respectively, and 95% of segments exhibit negative insertion energies. We computed the per-segment insertion free energies of verified membrane-spanning segments, by constraining locations to those observed in membrane–protein structures (31), and derived a very similar distribution of insertion energies (Fig. 2B), and further found that 98% of the membrane spans had apparent insertion energies below +5 kcal/mol. Our analysis suggests that individual membrane spans, even in large domains in which intersegment interactions can drive insertion, must encode sufficiently high insertion propensity. These insertion energies are in agreement with theoretical treatments, which predict an average of approximately −5 kcal/mol for membrane insertion of a single segment (1, 32). The values stand, furthermore, in contrast to the analysis of membrane segments using the Lep insertion scale (9), which computes average insertion energy of +0.8 kcal/mol (10).

The relatively large magnitude of per-helix insertion energies predicted by TopGraph implies that it may discriminate soluble from membrane-spanning proteins. Indeed, in a set of 3,400 proteins (13), we find that a cutoff of Δ G i n s e r t i o n a p p = −3 kcal/mol correctly discriminates membrane from soluble proteins with sensitivity of 96% and specificity of 93% (Table S2), comparable to other predictors (10, 33). We note that on average 99% of the sequence in soluble proteins is eliminated by the secondary-structure and polar-residues filters (Fig. S3), drastically simplifying prediction. We further find that individual membrane-spanning segments differ from segments in soluble proteins in that a large majority encode both hydrophobicity and orientation preference (the positive-inside rule Fig. S4).

Discrimination of membrane from extra membrane proteins in a set of 3,710 annotated proteins ref. 13