304 Nerezová svařovaná spirálová trubka / hadička zhemical zomponent, Biosyntetický potenciál globálního mořského mikrobiomu

Děkujeme, že jste navštívili Nature.com.Používáte verzi prohlížeče s omezenou podporou CSS.Chcete-li dosáhnout nejlepšího výsledku, doporučujeme použít aktualizovaný prohlížeč (nebo vypnout režim kompatibility v aplikaci Internet Explorer).Abychom zajistili trvalou podporu, zobrazujeme web bez stylů a JavaScriptu.
Posuvníky zobrazující tři články na snímku.Pro pohyb mezi snímky použijte tlačítka zpět a další, pro pohyb po jednotlivých snímcích použijte tlačítka posuvného ovladače na konci.

Podrobný popis produktu

304 Nerezová svařovaná vinutá trubka/trubka
1. Specifikace: Nerezová spirálová trubka / potrubí
2. Typ: svařované nebo bezešvé
3. Norma: ASTM A269, ASTM A249
4. Vnější průměr spirálové trubky z nerezové oceli: 6 mm až 25,4 mm
5. Délka: 600-3500MM nebo podle požadavku zákazníka.
6. Tloušťka stěny: 0,2 mm až 2,0 mm.

7. Tolerance: OD: +/-0,01 mm;Tloušťka: +/-0,01 %.

8. Velikost vnitřního otvoru cívky: 500MM-1500MM (lze upravit podle požadavků zákazníka)

9. Výška cívky: 200MM-400MM (lze upravit podle požadavků zákazníka)

10. Povrch: Světlý nebo žíhaný
11. Materiál: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, slitina 625, 825, 2205, 2507 atd.
12. Balení: tkané tašky v dřevěném pouzdře, dřevěná paleta, dřevěná hřídel nebo dle požadavku zákazníka
13. Zkouška: chemická složka, mez kluzu, pevnost v tahu, měření tvrdosti
14. Záruka: Kontrola třetí stranou (například: SGS TV) atd.
15. Použití: Dekorace, nábytek, přeprava ropy, výměník tepla, výroba zábradlí, výroba papíru, automobil, zpracování potravin, lékařství atd.

Veškeré chemické složení a fyzikální vlastnosti nerezové oceli, jak je uvedeno níže:

Materiál ASTM A269 Chemické složení % Max
C Mn P S Si Cr Ni Mo Pozn Nb Ti
TP304 0,08 2,00 0,045 0,030 1,00 18,0-20,0 8,0-11,0 ^ ^ ^ . ^
TP304L 0,035 2,00 0,045 0,030 1,00 18,0-20,0 8,0-12,0 ^ ^ ^ ^
TP316 0,08 2,00 0,045 0,030 1,00 16,0-18,0 10,0-14,0 2:00-3:00 ^ ^ ^
TP316L 0,035 D 2,00 0,045 0,030 1,00 16,0-18,0 10,0-15,0 2:00-3:00 ^ ^ ^
TP321 0,08 2,00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 ^ ^ ^ 5C -0,70
TP347 0,08 2,00 0,045 0,030 1,00 17,0-19,0 9,0-12,0 10C -1,10 ^

 

Materiál Tepelné zpracování Teplota F (C) Min. Tvrdost
Brinell Rockwell
TP304 Řešení 1900 (1040) 192 HBW/200 HV 90 HRB
TP304L Řešení 1900 (1040) 192 HBW/200 HV 90 HRB
TP316 Řešení 1900(1040) 192 HBW/200 HV 90 HRB
TP316L Řešení 1900(1040) 192 HBW/200 HV 90 HRB
TP321 Řešení 1900(1040) F 192 HBW/200 HV 90 HRB
TP347 Řešení 1900(1040) 192 HBW/200 HV 90 HRB

 

OD, palce Tolerance vnějšího průměru palec (mm) Tolerance WT % Délka Tolernace v palcích (mm)
+ -
≤ 1/2 ± 0,005 ( 0,13 ) ± 15 1/8 (3.2) 0
> 1/2 ~ 1 1/2 ± 0,005 (0,13) ± 10 1/8 (3,2) 0
> 1 1/2 ~< 3 1/2 ± 0,010 (0,25) ± 10 3/16 (4,8) 0
> 3 1/2 ~< 5 1/2 ± 0,015 (0,38) ± 10 3/16 (4,8) 0
> 5 1 / 2 ~ < 8 ± 0,030 (0,76) ± 10 3/16 (4,8) 0
8~< 12 ± 0,040 (1,01) ± 10 3/16 (4,8) 0
12~< 14 ± 0,050 (1,26) ± 10 3/16 (4,8) 0

Přirozená mikrobiální společenstva jsou fylogeneticky a metabolicky různorodá.Kromě nedostatečně prostudovaných skupin organismů1 má tato diverzita také bohatý potenciál pro objevy ekologicky a biotechnologicky významných enzymů a biochemických sloučenin2,3.Studium této rozmanitosti za účelem určení genomových drah, které syntetizují takové sloučeniny a vážou je k jejich příslušným hostitelům, však zůstává výzvou.Biosyntetický potenciál mikroorganismů v otevřeném oceánu zůstává do značné míry neznámý kvůli omezením v analýze dat o rozlišení celého genomu v globálním měřítku.Zde zkoumáme rozmanitost a rozmanitost biosyntetických genových klastrů v oceánu integrací asi 10 000 mikrobiálních genomů z kultivovaných buněk a jednotlivých buněk s více než 25 000 nově rekonstruovanými návrhovými genomy z více než 1 000 vzorků mořské vody.Tyto snahy identifikovaly asi 40 000 domnělých převážně nových biosyntetických genových shluků, z nichž některé byly nalezeny v dříve netušených fylogenetických skupinách.V těchto populacích jsme identifikovali linii obohacenou o biosyntetické genové shluky („Candidatus Eudormicrobiaceae“), které patřily do nekultivovaného bakteriálního kmene a zahrnovaly některé z biosynteticky nejrozmanitějších mikroorganismů v tomto prostředí.Z nich jsme charakterizovali fosfatázové-peptidové a pytonamidové dráhy, přičemž jsme identifikovali případy neobvyklé struktury bioaktivní sloučeniny a enzymologie, v daném pořadí.Na závěr tato studie ukazuje, jak mohou strategie založené na mikrobiomu umožnit zkoumání dříve nepopsaných enzymů a přírodních potravin ve špatně pochopené mikrobiotě a prostředí.
Mikrobi řídí globální biogeochemické cykly, udržují potravní sítě a udržují rostliny a zvířata zdravé5.Jejich obrovská fylogenetická, metabolická a funkční diverzita představuje bohatý potenciál pro objevování nových taxonů1, enzymů a biochemických sloučenin, včetně přírodních produktů6.V ekologických komunitách poskytují tyto molekuly mikroorganismům různé fyziologické a ekologické funkce, od komunikace až po konkurenci 2, 7 .Kromě svých původních funkcí poskytují tyto přírodní produkty a jejich geneticky kódované produkční cesty příklady pro biotechnologické a terapeutické aplikace2,3.Identifikaci takových cest a spojení značně usnadnilo studium kultivovaných mikrobů.Taxonomické studie přírodního prostředí však ukázaly, že naprostá většina mikroorganismů nebyla kultivována8.Tato kulturní zaujatost omezuje naši schopnost využívat funkční rozmanitost kódovanou mnoha mikroby4,9.
K překonání těchto omezení umožnil technologický pokrok za poslední desetiletí výzkumníkům přímo (tj. bez předchozí kultivace) sekvenovat fragmenty mikrobiální DNA z celých komunit (metagenomika) nebo jednotlivých buněk.Schopnost sestavit tyto fragmenty do větších fragmentů genomu a rekonstruovat mnohočetné metagenomicky sestavené genomy (MAG) nebo jednotlivé amplifikované genomy (SAG), v tomto pořadí, otevírá důležitou příležitost pro taxocentrické studie mikrobiomu (tj. mikrobiálních společenství a mikrobiomu).vydláždit nové cesty.vlastní genetický materiál v daném prostředí) 10,11,12.Nedávné studie skutečně značně rozšířily fylogenetické zastoupení mikrobiální diverzity na Zemi1, 13 a odhalily velkou část funkční diverzity v jednotlivých mikrobiálních komunitách, které dříve nebyly pokryty referenčními genomovými sekvencemi kultivovaných mikroorganismů (REF)14.Schopnost umístit neobjevenou funkční diverzitu do kontextu hostitelského genomu (tj. rozlišení genomu) je rozhodující pro predikci dosud necharakterizovaných mikrobiálních linií, které pravděpodobně kódují nové přírodní produkty15,16 nebo pro sledování takových sloučenin zpět k jejich původnímu producentovi17.Například kombinovaný přístup k metagenomické a jednobuněčné genomové analýze vedl k identifikaci Candidatus Entotheonella, skupiny metabolicky bohatých bakterií asociovaných s houbami, jako producentů různých léčivých potenciálů18.Navzdory nedávným pokusům o genomický průzkum různých mikrobiálních společenstev16,19 však stále chybí více než dvě třetiny globálních metagenomických dat pro největší oceán ekosystémů na Zemi16,20.Obecně tedy zůstává biosyntetický potenciál mořského mikrobiomu a jeho potenciál jako úložiště nových enzymatických a přírodních produktů do značné míry nedostatečně prozkoumán.
Abychom prozkoumali biosyntetický potenciál mořských mikrobiomů v globálním měřítku, nejprve jsme shromáždili mořské mikrobiální genomy získané pomocí metod závislých na kultuře a nekultivačních metod, abychom vytvořili rozsáhlou databázi fylogenetiky a genové funkce.Zkoumání této databáze odhalilo širokou škálu biosyntetických genových klastrů (BGC), z nichž většina patří do rodin dosud necharakterizovaných genových klastrů (GCF).Kromě toho jsme identifikovali neznámou bakteriální rodinu, která dosud vykazuje nejvyšší známou diverzitu BGC v otevřeném oceánu.Pro experimentální validaci jsme vybrali dvě dráhy ribozomální syntézy a posttranslačně modifikovaného peptidu (RiPP) na základě jejich genetických odlišností od aktuálně známých drah.Funkční charakterizace těchto drah odhalila neočekávané příklady enzymologie a také strukturně neobvyklé sloučeniny s inhibiční aktivitou proteázy.
Nejprve jsme se zaměřili na vytvoření globálního zdroje dat pro analýzu genomu se zaměřením na jeho bakteriální a archaální složky.Za tímto účelem jsme shromáždili metagenomická data a 1038 vzorků mořské vody z 215 globálně distribuovaných vzorkovacích míst (rozsah zeměpisné šířky = 141,6°) a několika hlubokých vrstev (od 1 do 5600 m hloubky, pokrývajících pelagické, mezopelagické a hlubinné zóny).Pozadí21,22,23 (obr. 1a, rozšířená data, obr. 1a a doplňková tabulka 1).Kromě širokého geografického pokrytí nám tyto selektivně filtrované vzorky umožnily porovnat různé složky mořského mikrobiomu, včetně bohaté na viry (<0,2 µm), bohaté na prokaryoty (0,2–3 µm), bohaté na částice (0,8 µm ).–20 µm) a kolonie zbavené virů (>0,2 µm).
a, Celkem 1038 veřejně dostupných genomů (metagenomika) mořských mikrobiálních společenství shromážděných z 215 globálně distribuovaných lokalit (62° jižní šířky až 79° severní šířky a 179° západní délky až 179° východní délky).Mapové dlaždice © Esri.Zdroje: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ a Esri.b, tyto metagenomy byly použity k rekonstrukci MAG (metody a doplňkové informace), které se liší v množství a kvalitě (metody) v souborech dat (označené barevně).Rekonstruované MAG byly doplněny o veřejně dostupné (externí) genomy, včetně ručně vyrobených MAG26, SAG27 a REF.27 Kompilace OMD.c, ve srovnání s předchozími zprávami založenými pouze na SAG (GORG)20 nebo MAG (GEM)16, OMD zlepšuje genomickou charakterizaci mořských mikrobiálních komunit (metagenomická četnost mapování; metoda) dvakrát až třikrát s konzistentnějším zastoupením do hloubky a zeměpisná šířka..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30-60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, úroveň seskupení OMD do klastrů druhů (95% střední nukleotidová identita) identifikuje celkem přibližně 8 300 druhů, z nichž více než polovina nebyla dříve charakterizována podle taxonomických anotací pomocí GTDB (verze 89) e, klasifikace druhů podle typu genomu ukázala, že MAG, SAG a REF se navzájem dobře doplňují v odrážení fylogenetické rozmanitosti mořský mikrobiom.Konkrétně 55 %, 26 % a 11 % druhů bylo specifických pro MAG, SAG a REF.NETOPÝŘI, Bermudský Atlantik Time Series;GEM, genomy mikrobiomu Země;GORG, globální oceánský referenční genom;Časová řada HOT, Havajský oceán.
Pomocí tohoto souboru dat jsme rekonstruovali celkem 26 293 MAG, většinou bakteriálních a archaálních (obr. 1b a rozšířená data, obr. 1b).Tyto MAG jsme vytvořili ze sestav ze samostatných, spíše než sdružených metagenomických vzorků, abychom zabránili zhroucení variace přirozené sekvence mezi vzorky z různých míst nebo časových bodů (metod).Kromě toho jsme seskupili genomové fragmenty na základě jejich korelací prevalence ve velkém počtu vzorků (od 58 do 610 vzorků, v závislosti na průzkumu; metodě).Zjistili jsme, že se jedná o časově náročný, ale důležitý krok24, který byl přeskočen v několika rozsáhlých rekonstrukčních pracích MAG16, 19, 25 a významně zlepšuje kvantitu (v průměru 2,7krát) a kvalitu (v průměru +20 %). genom.rekonstruován ze zde studovaného mořského metagenomu (rozšířená data, obr. 2a a další informace).Celkově toto úsilí vedlo ke 4,5násobnému zvýšení mořských mikrobiálních MAG (6násobné, pokud se berou v úvahu pouze vysoce kvalitní MAG) ve srovnání s nejkomplexnějším zdrojem MAG, který je dnes k dispozici16 (Metody).Tato nově vytvořená sada MAG byla poté kombinována s 830 ručně vybranými MAG26, 5969 SAG27 a 1707 REF.Dvacet sedm druhů mořských bakterií a archaea tvořilo kombinatorickou sbírku 34 799 genomů (obr. 1b).
Poté jsme vyhodnotili nově vytvořený zdroj, abychom zlepšili jeho schopnost reprezentovat mořské mikrobiální komunity a vyhodnotili dopad integrace různých typů genomů.V průměru jsme zjistili, že pokrývá přibližně 40–60 % mořských metagenomických dat (obrázek 1c), což je dvakrát až trojnásobek pokrytí předchozích zpráv pouze MAG v hloubce i zeměpisné šířce Více serial 16 nebo SAG20.Kromě toho jsme pro systematické měření taxonomické diverzity v zavedených sbírkách anotovali všechny genomy pomocí sady nástrojů (metod) databáze genomové taxonomie (GTDB) a použili jsme průměrnou nukleotidovou identitu celého genomu 95 %.28 k identifikaci 8 304 shluků druhů (druhů).Dvě třetiny těchto druhů (včetně nových kladů) se dříve v GTDB neobjevily, z nichž 2790 bylo objeveno pomocí MAG rekonstruovaného v této studii (obr. 1d).Kromě toho jsme zjistili, že různé typy genomů jsou vysoce komplementární: 55 %, 26 % a 11 % druhů se skládá výhradně z MAG, SAG a REF (obr. 1e).Kromě toho MAG pokrýval všech 49 typů nalezených ve vodním sloupci, zatímco SAG a REF reprezentovaly pouze 18 a 11 z nich.SAG však lépe reprezentuje diverzitu nejběžnějších kladů (rozšířená data, obr. 3a), jako jsou Pelagic Bacteriales (SAR11), přičemž SAG zahrnuje téměř 1300 druhů a MAG pouze 390 druhů.Je pozoruhodné, že REF se zřídka překrývaly s MAG nebo SAG na úrovni druhů a představovaly > 95 % z přibližně 1 000 genomů, které nebyly nalezeny ve zde studovaných metagenomických souborech otevřeného oceánu, a to především kvůli interakcím s jinými typy izolovaných reprezentativních mořských exemplářů (např. .nebo hostitel-přidružený).Aby byl široce dostupný vědecké komunitě, lze tento zdroj mořského genomu, který také zahrnuje neklasifikované fragmenty (např. z předpokládaných fágů, genomických ostrovů a fragmentů genomu, pro které nejsou k dispozici dostatečné údaje pro rekonstrukci MAG), porovnat s taxonomickými údaji. .Získejte přístup k anotacím spolu s funkcí genu a kontextovými parametry v databázi Ocean Microbiology Database (OMD; https://microbiomics.io/ocean/).
Poté jsme se vydali prozkoumat bohatství a novost biosyntetického potenciálu v mikrobiomech otevřeného oceánu.Za tímto účelem jsme nejprve použili antiSMASH pro všechny MAG, SAG a REF nalezené v 1038 mořských metagenomech (metodách), abychom předpověděli celkem 39 055 BGC.Poté jsme je seskupili do 6907 neredundantních GCF a 151 populací genových klastrů (GCC; doplňková tabulka 2 a metody), abychom zohlednili inherentní redundanci (tj. stejný BGC může být kódován ve více genomech) a metagenomická data Fragmentace koncentrovaných BGC.Neúplné BGC významně nezvýšily, pokud vůbec nějaké byly (doplňkové informace), počet GCF a GCC, v daném pořadí, obsahujících alespoň jednoho neporušeného člena BGC ve 44 % a 86 % případů.
Na úrovni GCC jsme našli širokou škálu předpokládaných RiPP a dalších přírodních produktů (obr. 2a).Mezi nimi například arylpolyeny, karotenoidy, ektoiny a siderofory patří ke GCC se širokou fylogenetickou distribucí a vysokou četností v oceánských metagenomech, což může naznačovat širokou adaptaci mikroorganismů na mořské prostředí, včetně odolnosti vůči reaktivním formám kyslíku, oxidační a osmotický stres..nebo vstřebávání železa (více informací).Tato funkční rozmanitost kontrastuje s nedávnou analýzou přibližně 1,2 milionu BGC mezi přibližně 190 000 genomy uloženými v databázi NCBI RefSeq (BiG-FAM/RefSeq, dále jen RefSeq)29, která ukázala, že neribozomální syntetázové peptidy (NRPS) a polyketidsyntáza (PKS) BGC (doplňkové informace).Našli jsme také 44 (29 %) GCC pouze vzdáleně souvisejících s jakýmkoliv RefSeq BGC (\(\bar{d}\)RefSeq > 0,4; obr. 2a a metody) a 53 (35 %) GCC pouze v MAG , což zdůrazňuje potenciál k detekci dříve nepopsaných chemikálií v OMD.Vzhledem k tomu, že každý z těchto GCC pravděpodobně představuje vysoce rozmanité biosyntetické funkce, dále jsme analyzovali data na úrovni GCF ve snaze poskytnout podrobnější seskupení BGC, u nichž se předpokládá, že budou kódovat podobné přírodní produkty29.Celkem 3861 (56 %) identifikovaných GCF se nepřekrývalo s RefSeq a > 97 % GCF nebylo přítomno v MIBiG, jedné z největších databází experimentálně ověřených BGC (obrázek 2b).I když není překvapivé objevit mnoho potenciálních nových cest v prostředích, která nejsou dobře reprezentována referenčním genomem, naše metoda dereplikace BGC na GCF před benchmarkingem se liší od předchozích zpráv 16 a umožňuje nám poskytnout nezaujaté posouzení novosti.Většina nové diverzity (3012 GCF nebo 78 %) odpovídá předpokládaným terpenům, RiPP nebo jiným přírodním produktům a většina (1815 GCF nebo 47 %) je kódována v neznámých typech kvůli jejich biosyntetickému potenciálu.Na rozdíl od klastrů PKS a NRPS je u těchto kompaktních BGC méně pravděpodobné, že budou fragmentovány během metagenomického sestavení 31 a umožňují časově a na zdroje náročnější funkční charakterizaci jejich produktů.
Celkem 39 055 BGC bylo seskupeno do 6 907 GCF a 151 GCC.a, reprezentace dat (interní externí).Hierarchické shlukování vzdáleností BGC založené na GCC, z nichž 53 je fixováno pouze MAG.GCC obsahuje BGC z různých taxonů (ln-transformovaná brána frekvence) a různých tříd BGC (velikost kruhu odpovídá jeho frekvenci).Pro každý GCC představuje vnější vrstva počet BGC, prevalenci (procento vzorků) a vzdálenost (minimální kosinusová vzdálenost BGC (min(dMIBiG))) od BiG-FAM k BGC.GCC s BGC úzce souvisejícími s experimentálně ověřenými BGC (MIBiG) jsou zvýrazněny šipkami.b Při porovnání GCF s předpokládanými (BiG-FAM) a experimentálně ověřenými (MIBiG) BGC bylo nalezeno 3861 nových (d–>0,2) GCF.Většina (78 %) z nich kóduje RiPP, terpeny a další domnělé přírodní produkty.c, všechny genomy v OMD nalezené v 1038 mořských metagenomech byly umístěny do základního stromu GTDB, aby se ukázalo fylogenetické pokrytí OMD.Klady bez jakýchkoli genomů v OMD jsou zobrazeny šedě.Počet BGC odpovídá největšímu počtu predikovaných BGC na genom v daném kladu.Pro přehlednost je posledních 15 % uzlů zhroucených.Šipky označují klady bohaté na BGC (>15 BGC), s výjimkou Mycobacterium, Gordonia (druhá po Rhodococcus) a Crocosphaera (druhá po Synechococcus).d, Neznámý c.Eremiobacterota vykazovala nejvyšší biosyntetickou diverzitu (Shannonův index založený na typu přírodního produktu).Každý pás představuje genom s největším počtem BGC v daném druhu.T1PKS, PKS typ I, T2/3PKS, PKS typ II a typ III.
Kromě bohatosti a novosti zkoumáme biogeografickou strukturu biosyntetického potenciálu mořského mikrobiomu.Seskupení vzorků podle průměrné metagenomické distribuce počtu kopií GCF (Metody) ukázalo, že společenstva s nízkou zeměpisnou šířkou, povrchová, prokaryoticky bohatá a na viry chudá společenství, většinou z povrchových nebo hlubších osluněných vod, byla bohatá na terpeny RiPP a BGC.Naproti tomu polární, hlubinná, na viry a částice bohatá společenstva byla spojena s vyšší abundancí NRPS a PKS BGC (rozšířená data, obr. 4 a další informace).Nakonec jsme zjistili, že dobře prostudovaná tropická a pelagická společenstva jsou nejslibnějšími zdroji nových terpenů (obrázek rozšířených dat).Nejvyšší potenciál pro PKS, RiPP a další přírodní produkty (obrázek 5a s rozšířenými údaji).
Abychom doplnili naši studii biosyntetického potenciálu mořských mikrobiomů, zaměřili jsme se na zmapování jejich fylogenetické distribuce a identifikaci nových kladů obohacených BGC.Za tímto účelem jsme umístili genomy mořských mikrobů do normalizovaného bakteriálního a archaálního fylogenetického stromu GTDB13 a překryli domnělé biosyntetické dráhy, které kódují (obr. 2c).Snadno jsme detekovali několik kladů obohacených o BGC (reprezentovaných více než 15 BGC) ve vzorcích mořské vody (metody), které jsou známé svým biosyntetickým potenciálem, jako jsou sinice (Synechococcus) a bakterie Proteus, jako je Tistrella32,33, nebo nedávno přitáhly pozornost pro své přírodní produkty.jako jsou Myxococcota (Sandaracinaceae), Rhodococcus a Planctomycetota34,35,36.Je zajímavé, že jsme v těchto kladech našli několik dříve neprozkoumaných linií.Například ty druhy s nejbohatším biosyntetickým potenciálem ve kmeni Planctomycetota a Myxococcota patřily k necharakterizovaným kandidátním řádům a rodům (doplňková tabulka 3).Dohromady to naznačuje, že OMD poskytuje přístup k dříve neznámým fylogenetickým informacím, včetně mikroorganismů, které mohou představovat nové cíle pro objevování enzymů a přírodních produktů.
Dále jsme charakterizovali klad obohacený o BGC nejen spočítáním maximálního počtu BGC kódovaných jeho členy, ale také hodnocením diverzity těchto BGC, což vysvětluje frekvenci různých typů přírodních kandidátních produktů (obr. 2c a metody )..Zjistili jsme, že biosynteticky nejrozmanitější druhy byly v této studii zastoupeny speciálně upravenými bakteriálními MAG.Tyto bakterie patří do nekultivovaného kmene Candidatus Eremiobacterota, který zůstává do značné míry neprozkoumaný kromě několika genomických studií37,38.Je pozoruhodné, že „ca.Rod Eremiobacterota byl analyzován pouze v suchozemském prostředí39 a není známo, že by zahrnoval nějaké členy obohacené o BGC.Zde jsme zrekonstruovali osm MAG stejného druhu (nukleotidová identita > 99 %) 23. Navrhujeme proto druhové jméno „Candidatus Eudoremicrobium malaspinii“, pojmenované podle nereidy (mořské nymfy), krásného daru v řecké mytologii a expedicích.'Ka.Podle fylogenetické anotace 13 nemá E. malaspinii žádné dříve známé příbuzné pod úrovní sekvence, a proto patří do nové bakteriální rodiny, kterou navrhujeme „Ca.E. malaspinii“ jako typový druh a „Ca.Eudormicrobiaceae“ jako oficiální název (doplňkové informace).Krátká metagenomická rekonstrukce 'Ca.Projekt genomu E. malaspinii byl validován velmi nízkým vstupem, metagenomickým sekvenováním s dlouhým čtením a cíleným sestavením jednoho vzorku (Metody) jako jednoho 9,63 Mb lineárního chromozomu s duplikací 75 kb.jako jediná zbývající nejasnost.
Abychom stanovili fylogenetický kontext tohoto druhu, hledali jsme 40 blízce příbuzných druhů v dalších metagenomických vzorcích obohacených o eukaryoty z expedice Tara Ocean prostřednictvím cílené rekonstrukce genomu.Stručně řečeno, propojili jsme metagenomické čtení s genomovými fragmenty spojenými s „Ca.E. malaspinii“ a předpokládali, že zvýšená míra náboru v tomto vzorku ukazuje na přítomnost dalších příbuzných (metod).V důsledku toho jsme našli 10 MAG, kombinaci 19 MAG reprezentujících pět druhů ve třech rodech v rámci nově definované čeledi (tj. „Ca. Eudormicrobiaceae“).Po ruční kontrole a kontrole kvality (rozšířená data, obr. 6 a další informace) jsme zjistili, že „Ca.Druhy Eudormicrobiaceae mají větší genomy (8 Mb) a bohatší biosyntetický potenciál (14 až 22 BGC na druh) než ostatní členové „Ca“.Clade Eremiobacterota (do 7 BGC) (obr. 3a–c).
a, Fylogenetické polohy pěti 'Ca.Druhy Eudormicrobiaceae vykazovaly bohatost BGC specifickou pro mořské linie identifikované v této studii.Fylogenetický strom zahrnuje všechny 'Ca.Pro evoluční pozadí (Metody) byly použity MAG Eremiobacterota a členové dalších kmenů (čísla genomů v závorkách) uvedené v GTDB (verze 89).Nejvzdálenější vrstvy představují klasifikace na úrovni čeledí („Ca. Eudormicrobiaceae“ a „Ca. Xenobiaceae“) a na úrovni tříd („Ca. Eremiobacteria“).Pět druhů popsaných v této studii je reprezentováno alfanumerickými kódy a navrženými binomickými názvy (doplňkové informace).b, dobře.Druhy Eudormicrobiaceae sdílejí sedm společných jader BGC.Absence BGC v kladu A2 byla způsobena neúplností reprezentativního MAG (doplňková tabulka 3).BGC jsou specifické pro „Ca.Amphithomicrobium“ a „Ca.Amphithomicrobium“ (klad A a B) nejsou zobrazeny.c, Všechny BGC kódované jako „Ca.Bylo zjištěno, že Eudoremicrobium taraoceanii je exprimováno v 623 metatranskriptomech získaných z oceánů Tary.Plná kolečka označují aktivní transkripci.Oranžové kroužky označují log2-transformované násobné změny pod a nad rychlostí exprese provozního genu (metody).d, křivky relativní abundance (metody) ukazující 'Ca.Druhy Eudormicrobiaceae jsou rozšířeny ve většině oceánských pánví a v celém vodním sloupci (od hladiny do hloubky minimálně 4000 m).Na základě těchto odhadů jsme zjistili, že 'Ca.E. malaspinii' tvoří až 6 % prokaryotických buněk v hlubokomořských pelagických společenstvech asociovaných s obilím.Druh jsme považovali za přítomný na lokalitě, pokud byl nalezen v jakémkoli zlomku velikosti dané hloubkové vrstvy.IO – Indický oceán, NAO – severní Atlantik, NPO – severní Pacifik, RS – Rudé moře, SAO – jižní Atlantik, SO – jižní oceán, SPO – jižní Pacifik.
Studium hojnosti a distribuce Ca.Eudormicrobiaceae, která, jak jsme zjistili, převládá ve většině oceánských pánví a také v celém vodním sloupci (obr. 3d).Lokálně tvoří 6 % mořské mikrobiální komunity, což z nich dělá důležitou součást globálního mořského mikrobiomu.Navíc jsme zjistili relativní obsah Ca.Druhy Eudormicrobiaceae a jejich hladiny exprese BGC byly nejvyšší v eukaryotické obohacené frakci (obr. 3c a rozšířená data, obr. 7), což ukazuje na možnou interakci s částicovou hmotou, včetně planktonu.Toto pozorování má určitou podobnost s 'Ca.Eudoremicrobium BGC, které produkují cytotoxické přírodní produkty známými cestami, mohou vykazovat predátorské chování (doplňkové informace a rozšířená data, obrázek 8), podobně jako jiní predátoři, kteří specificky produkují metabolity, jako je Myxococcus41.Objev Ca.Eudormicrobiaceae v méně dostupných (hluboký oceán) nebo eukaryotických spíše než prokaryotických vzorcích může vysvětlit, proč tyto bakterie a jejich neočekávaná diverzita BGC zůstávají nejasné v kontextu výzkumu přirozené potravy.
Nakonec jsme se snažili experimentálně ověřit příslib naší práce založené na mikrobiomu při objevování nových cest, enzymů a přírodních produktů.Mezi různými třídami BGC je známo, že dráha RiPP kóduje bohatou chemickou a funkční diverzitu v důsledku různých posttranslačních modifikací jádrového peptidu zralými enzymy42.Vybrali jsme tedy dva 'Ca.Eudoremicrobium' RiPP BGC (obrázky 3b a 4a-e) jsou založeny na stejném základě jako jakékoli známé BGC (\(\bar{d}\)MIBiG a \(\bar{d}\)RefSeq nad 0,2) .
a–c, In vitro heterologní exprese a in vitro enzymatické testy nového (\(\bar{d}\)RefSeq = 0,29) shluku biosyntézy RiPP specifické pro hlubokomořské druhy Ca.E. malaspinii' vedl k produkci difosforylovaných produktů.c, modifikace identifikované pomocí MS/MS s vysokým rozlišením (HR) (fragmentace označená ionty b a y v chemické struktuře) a NMR (rozšířená data, obr. 9).d, tento fosforylovaný peptid vykazuje nízkou mikromolární inhibici savčí neutrofilní elastázy, která se nenachází v kontrolním peptidu a dehydratujícím peptidu (chemickým odstraněním indukovaná dehydratace).Experiment byl opakován třikrát s podobnými výsledky.Například heterologní exprese druhého nového \(\bar{d}\)RefSeq = 0,33) klastru biosyntézy proteinu objasňuje funkci čtyř zralých enzymů, které modifikují peptid o 46 aminokyselinách.Zbytky se barví podle místa modifikace předpovězeného pomocí HR-MS/MS, izotopového značení a NMR analýzy (doplňkové informace).Čárkované zbarvení ukazuje, že k modifikaci dochází na jednom ze dvou zbytků.Obrázek je kompilací mnoha heterologních konstruktů, které ukazují aktivitu všech zralých enzymů na stejném jádru.h, Ilustrace NMR dat pro N-methylaci amidu hlavního řetězce.Úplné výsledky jsou uvedeny na Obr.10 s rozšířenými daty.i, Fylogenetická poloha enzymu zralého proteinového klastru FkbM mezi všemi doménami FkbM nalezenými v databázi MIBiG 2.0 odhaluje enzym této rodiny s aktivitou N-methyltransferázy (doplňkové informace).Jsou ukázány schematické diagramy BGC (a, e), struktury prekurzorových peptidů (b, f) a domnělé chemické struktury přírodních produktů (c, g).
První dráha RiPP (\(\bar{d}\)MIBiG = 0,41, \(\bar{d}\)RefSeq = 0,29) byla nalezena pouze u hlubokomořských druhů „Ca.E. malaspinii“ a kódy pro Peptid-prekurzor (obr. 4a, b).V tomto zralém enzymu jsme identifikovali jedinou funkční doménu homologní s dehydratační doménou lantipeptidsyntázy, která normálně katalyzuje fosforylaci a následné odstranění 43 (doplňkové informace).Proto předpokládáme, že modifikace prekurzorového peptidu zahrnuje takovou dvoukrokovou dehydrataci.Pomocí tandemové hmotnostní spektrometrie (MS/MS) a nukleární magnetické rezonanční spektroskopie (NMR) jsme však identifikovali polyfosforylovaný lineární peptid (obr. 4c).Ačkoli to bylo neočekávané, našli jsme několik linií důkazů na podporu toho, že je konečným produktem: dva různí heterologní hostitelé a žádná dehydratace v in vitro testech, identifikace klíčových zbytků mutovaných v místě katalytické dehydratace zralého enzymu.vše zrekonstruované „Ca“.Genom E. malaspinii (rozšířená data, obr. 9 a další informace) a konečně biologická aktivita fosforylovaného produktu, nikoli však chemicky syntetizované dehydratované formy (obr. 4d).Ve skutečnosti jsme zjistili, že vykazuje nízkou mikromolární proteázovou inhibiční aktivitu proti neutrofilní elastáze, srovnatelnou s jinými příbuznými přírodními produkty v koncentračním rozmezí (IC50 = 14,3 μM) 44, a to navzdory skutečnosti, že ekologická úloha musí být ještě objasněna.Na základě těchto výsledků navrhujeme pojmenovat dráhu „fosfeptin“.
Druhý případ je složitá dráha RiPP specifická pro 'Ca.Bylo předpovězeno, že rod Eudoremicrobium (\(\bar{d}\)MIBiG = 0,46, \(\bar{d}\)RefSeq = 0,33) kóduje přirozené proteinové produkty (obr. 4e).Tyto dráhy jsou zvláště biotechnologicky zajímavé kvůli očekávané hustotě a řadě neobvyklých chemických modifikací vytvořených enzymy kódovanými relativně krátkými BGC45.Zjistili jsme, že tento protein se liší od dříve charakterizovaných proteinů v tom, že postrádá jak hlavní NX5N motiv polyceramidů, tak lanthioninovou smyčku landornamidů46.Abychom překonali omezení běžných heterologních vzorců exprese, použili jsme je spolu s vlastním systémem Microvirgula aerodenitrificans k charakterizaci čtyř enzymů zralé dráhy (metod).Pomocí kombinace MS/MS, izotopového značení a NMR jsme detekovali tyto zralé enzymy ve 46-aminokyselinovém jádru peptidu (obr. 4f,g, rozšířená data, obr. 10–12 a další informace).Mezi zralými enzymy jsme charakterizovali první výskyt člena rodiny 47 FkbM O-methyltransferázy v dráze RiPP a neočekávaně jsme zjistili, že tento zralý enzym zavádí N-methylaci páteře (obr. 4h, i a další informace).Ačkoli je tato modifikace známá u přírodních produktů NRP48, enzymatická N-methylace amidových vazeb je složitá, ale biotechnologicky významná reakce49, která byla dosud v zájmu rodiny borosinů RiPP.Specifičnost 50,51.Identifikace této aktivity v jiných rodinách enzymů a RiPP může otevřít nové aplikace a rozšířit funkční diverzitu proteinů 52 a jejich chemickou diverzitu.Na základě zjištěných úprav a neobvyklé délky navrhované struktury produktu navrhujeme název cesty „pythonamid“.
Objev neočekávané enzymologie ve funkčně charakterizované rodině enzymů ilustruje příslib environmentální genomiky pro nové objevy a také ilustruje omezenou kapacitu pro funkční inferenci založenou pouze na sekvenční homologii.Spolu se zprávami o nekanonických bioaktivních polyfosforylovaných RiPP tedy naše výsledky demonstrují náročné na zdroje, ale kritickou hodnotu pro snahy syntetické biologie plně odhalit funkční bohatství, rozmanitost a neobvyklé struktury biochemických sloučenin.
Zde demonstrujeme rozsah biosyntetického potenciálu kódovaného mikroby a jejich genomický kontext v globálním mořském mikrobiomu, což usnadňuje budoucí výzkum tím, že výsledný zdroj zpřístupní vědecké komunitě (https://microbiomics.io/ocean/).Zjistili jsme, že mnoho z jeho fylogenetických a funkčních novinek lze získat pouze rekonstrukcí MAG a SAG, zejména v nedostatečně využívaných mikrobiálních komunitách, které by mohly vést budoucí úsilí o bioprospektování.I když se zde zaměříme na 'Ca.Eudormicrobiaceae“ jako linie zvláště biosynteticky „talentovaná“, mnoho z BGC předpovězených v neobjevené mikrobiotě pravděpodobně kóduje dříve nepopsané enzymologie, které poskytují sloučeniny s environmentálně a/nebo biotechnologicky významnými účinky.
Metagenomické datové soubory z hlavních oceánografických studií a studií časových řad s dostatečnou hloubkou sekvenování byly zahrnuty, aby se maximalizovalo pokrytí globálních mořských mikrobiálních společenství v oceánských pánvích, hlubokých vrstvách a v průběhu času.Tyto soubory dat (doplňková tabulka 1 a obrázek 1) zahrnují metagenomiku ze vzorků odebraných v oceánech Tara (obohacené viry, n=190; obohacené prokaryoty, n=180)12,22 a expedice BioGEOTRACES (n=480).Havajská oceánská časová řada (HOT, n = 68), bermudsko-atlantická časová řada (BATS, n = 62)21 a expedice Malaspina (n = 58)23.Sekvenační čtení ze všech metagenomických fragmentů byla filtrována na kvalitu pomocí BBMap (v.38.71) odstraněním sekvenačních adaptérů z čtení, odstraněním čtení mapovaných na sekvence kontroly kvality (genomy PhiX) a použitím trimq=14, maq=20 zahodí špatnou kvalitu čtení, maxns = 0 a minlength = 45. Následné analýzy byly provedeny nebo sloučeny s QC čteními, pokud bylo specifikováno (bbmerge.sh minoverlap=16).Hodnoty kontroly kvality byly normalizovány (cíl bbnorm.sh = 40, hloubka mysli = 0) před sestavením pomocí metaSPAdes (v.3.11.1 nebo v.3.12, pokud to bylo potřeba)53.Výsledné kontigy skafoldu (dále označované jako skafoldy) byly nakonec filtrovány podle délky (>1 kb).
1038 metagenomických vzorků bylo rozděleno do skupin a pro každou skupinu vzorků byly hodnoty metagenomické kontroly kvality všech vzorků přiřazeny k závorkám každého vzorku samostatně, což vedlo k následujícímu počtu skupinových čtení v párových závorkách: Tara Marine Viruses – Enriched (190×190), Prokaryotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) a Malaspina (58×58).Mapování bylo provedeno pomocí Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, který umožňuje přiřadit naměřené hodnoty sekundárním místům (pomocí příznaku -a).Zarovnání byla filtrována tak, aby byla alespoň 45 bází dlouhá, měla ≥97% identitu a rozsah ≥80% čtení.Výsledné soubory BAM byly zpracovány pomocí skriptu jgi_summarize_bam_contig_depths pro MetaBAT2 (v.2.12.1)55, aby bylo zajištěno pokrytí v rámci a mezi vzorky pro každou skupinu.Nakonec byly seskupeny závorky, aby se zvýšila citlivost individuálním spuštěním MetaBAT2 na všech vzorcích s –minContig 2000 a –maxEdges 500. MetaBAT2 používáme místo souborového boxeru, protože se v nezávislých testech ukázal jako nejúčinnější samostatný boxer.a 10 až 50krát rychlejší než ostatní běžně používané boxery57.K testování účinku korelací hojnosti náhodně vybraný dílčí vzorek metagenomiky (10 pro každý ze dvou datových souborů Tara Ocean, 10 pro BioGEOTRACES, 5 pro každou časovou řadu a 5 pro Malaspina) navíc použil pouze vzorky.Interní vzorky jsou seskupeny za účelem získání informací o pokrytí.(Dodatečné informace).
Do následné analýzy byly zahrnuty další (externí) genomy, konkrétně 830 ručně vybraných MAG z podmnožiny datového souboru Tara Oceans26, 5287 SAG z datového souboru GORG20 a data z databáze MAR (MarDB v. 4) z 1707 izolovaných REF a 682 SAG) 27. Pro soubor dat MarDB jsou genomy vybírány na základě dostupných metadat, pokud typ vzorku odpovídá následujícímu regulárnímu výrazu: '[S|s]single.?[C|c]ell|[C|c]ulture| [I|i] izolovaný“.
Kvalita každého metagenomického kontejneru a externích genomů byla hodnocena pomocí CheckM (v. 1.0.13) a Anvi'o's Lineage Workflow (v. 5.5.0)58,59.Pokud CheckM nebo Anvi'o hlásí ≥50% úplnost/úplnost a ≤10% kontaminaci/redundanci, uložte metagenomické buňky a externí genomy pro pozdější analýzu.Tato skóre byla poté kombinována do střední úplnosti (mcpl) a průměrné kontaminace (mctn) pro klasifikaci kvality genomu podle kritérií komunity60 následovně: vysoká kvalita: mcpl ≥ 90 % a mctn ≤ 5 %;dobrá kvalita: mcpl ≥ 70 %, mctn ≤ 10 %, střední kvalita: mcpl ≥ 50 % a mctn ≤ 10 %, poctivá kvalita: mcpl ≤ 90 % nebo mctn ≥ 10 %.Filtrované genomy byly poté korelovány se skóre kvality (Q a Q') následovně: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (variabilita kmene)/100 + 0,5 x log[N50].(implementováno v dRep61).
Aby se umožnila srovnávací analýza mezi různými zdroji dat a typy genomů (MAG, SAG a REF), bylo dereferencováno 34 799 genomů na základě průměrné nukleotidové identity celého genomu (ANI) pomocí dRep (v.2.5.4).Opakuje se)61 ​​s 95% prahovými hodnotami ANI28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) a geny markerů s jednou kopií pomocí SpecI63 poskytující shlukování genomu na úrovni druhu.Pro každý shluk dRep byl vybrán reprezentativní genom podle výše definovaného maximálního skóre kvality (Q'), které bylo považováno za reprezentativní pro daný druh.
K vyhodnocení rychlosti mapování byla použita BWA (v.0.7.17-r1188, -a) k mapování všech 1038 sad metagenomických čtení s 34 799 genomy obsaženými v OMD.Čtení řízená kvalitou byla mapována v režimu s jedním koncem a výsledná srovnání byla filtrována, aby se zachovala pouze srovnání délky ≥45 bp.a identita > 95 %.Poměr zobrazení pro každý vzorek je procento naměřených hodnot zbývajících po filtraci vydělené celkovým počtem odečtů kontroly kvality.Pomocí stejného přístupu byl každý z 1038 metagenomů redukován na 5 milionů inzertů (rozšířená data, obr. 1c) a porovnán s GORG SAG v OMD a ve všech GEM16.Množství MAG získaných z mořské vody v katalogu GEM16 bylo určeno pomocí klíčových dotazů na metagenomické zdroje, výběr vzorků mořské vody (např. na rozdíl od mořských sedimentů).Konkrétně vybereme „vodní“ jako „kategorie_ekosystému“, „mořské“ jako „typ_ekosystému“ a „biotop“ filtrujeme jako „hluboký oceán“, „mořský“, „mořský oceánský“, „pelagický mořský“, „mořská voda“ , „Oceán“, „Mořská voda“, „Povrchová mořská voda“, „Povrchová mořská voda“.Výsledkem bylo 5903 MAG (734 vysoce kvalitních) distribuovaných přes 1823 OTU (zobrazení zde).
Prokaryotické genomy byly taxonomicky anotovány pomocí GTDB-Tk (v.1.0.2)64 s výchozími parametry cílenými na GTDB r89 verze 13. Anvi'o byl použit k identifikaci eukaryotických genomů na základě predikce domény a paměti ≥50 % a redundance ≤ 10 %.Taxonomická anotace druhu je definována jako jeden z jeho reprezentativních genomů.S výjimkou eukaryot (148 MAG) byl každý genom nejprve funkčně anotován pomocí prokka (v.1.14.5)65, pojmenováním kompletních genů, definováním parametrů „archaea“ nebo „bakterie“ podle potřeby, což se uvádí také pro non- kódující geny.a oblasti CRISPR, mezi jinými genomickými rysy.Anotujte predikované geny identifikací univerzálních jednokopiových markerových genů (uscMG) pomocí fetchMG (v.1.2)66, přiřaďte ortologické skupiny a dotazujte se pomocí emapperu (v.2.0.1)67 na základě eggNOG (v.5.0)68.Databáze KEGG (zveřejněna 10. února 2020) 69. Poslední krok byl proveden porovnáním proteinů s databázi KEGG pomocí DIAMOND (v.0.9.30)70 s dotazem a pokrytím tématu ≥70 %.Výsledky byly dále filtrovány podle NCBI Prokaryotic Genome Annotation Pipeline71 na základě datového toku ≥ 50 % maximálního očekávaného datového toku (samotný odkaz).Genové sekvence byly také použity jako vstup pro identifikaci BGC v genomu pomocí antiSMASH (v.5.1.0)72 s výchozími parametry a různými klastrovými explozemi.Všechny genomy a anotace byly zkompilovány do OMD spolu s kontextovými metadaty dostupnými na webu (https://microbiomics.io/ocean/).
Podobně jako dříve popsané metody12,22 jsme použili CD-HIT (v.4.8.1) k seskupení >56,6 milionů genů kódujících protein z bakteriálních a archaálních genomů z OMD do 95% identity a kratších genů (90% pokrytí)73 až >17,7 milionů genových shluků.Nejdelší sekvence byla vybrána jako reprezentativní gen pro každý genový shluk.1038 metagenomů bylo poté porovnáno s > 17,7 miliony členů klastru BWA (-a) a výsledné soubory BAM byly filtrovány, aby se zachovala pouze zarovnání s ≥ 95 % procent identity a ≥ 45 zarovnáními bází.Délkově normalizovaná abundance genu byla vypočtena nejprve spočítáním insertů z nejlepšího jedinečného zarovnání a poté, pro fuzzy mapované inserty, přidáním zlomkových počtů k odpovídajícím cílovým genům úměrným jejich počtu jedinečných insertů.
Genomy z rozšířené OMD (s dalšími MAG z „Ca. Eudormicrobiaceae“, viz níže) byly přidány do databáze nástrojů metagenomické analýzy mOTUs74 (v.2.5.1) za účelem vytvoření rozšířené referenční databáze mOTU.Pouze šest jednokopiových genomů (23 528 genomů) přežilo z deseti uscMG.Rozšíření databáze vedlo k vytvoření 4 494 dalších shluků na úrovni druhů.1038 metagenomů bylo analyzováno pomocí výchozích parametrů mOTU (v.2).Celkem 989 genomů obsažených v 644 klastrech mOTU (95 % REF, 5 % SAG a 99,9 % patřících do MarDB) nebylo detekováno profilem mOTU.To odráží různé další zdroje mořské izolace genomů MarDB (většina nedetekovaných genomů je spojena s organismy izolovanými ze sedimentů, mořských hostitelů atd.).Abychom se v této studii nadále zaměřovali na prostředí otevřeného oceánu, vyloučili jsme je z následné analýzy, pokud nebyly detekovány nebo zahrnuty do rozšířené databáze mOTU vytvořené v této studii.
Všechny BGC z MAG, SAG a REF v OMD (viz výše) byly zkombinovány s BGC identifikovanými ve všech metagenomických skafoldech (antiSMASH v.5.0, výchozí parametry) a charakterizovány pomocí BiG-SLICE (v.1.1) (PFAM doména)75.Na základě těchto vlastností jsme vypočítali všechny kosinusové vzdálenosti mezi BGC a seskupili je (střední vazby) do GCF a GCC pomocí prahových hodnot vzdálenosti 0,2 a 0,8.Tyto prahy jsou adaptací prahů dříve používaných pomocí euklidovské vzdálenosti75 spolu s kosinusovou vzdáleností, což zmírňuje některé chyby v původní strategii shlukování BiG-SLICE (doplňkové informace).
BGC byly poté filtrovány, aby se zachovalo pouze ≥5 kb kódovaných na skafoldech, aby se snížilo riziko fragmentace, jak bylo popsáno dříve16, a aby se vyloučily MarDB REF a SAG, které se nenacházejí v 1038 metagenomech (viz výše).Výsledkem bylo celkem 39 055 BGC kódovaných genomem OMD, přičemž dalších 14 106 bylo identifikováno na metagenomických fragmentech (tj. nekombinovaných do MAG).Tyto „metagenomické“ BGC byly použity k odhadu podílu potenciálu biosyntézy mořského mikrobiomu nezachyceného v databázi (doplňkové informace).Každý BGC byl funkčně charakterizován podle prediktivních typů produktů definovaných kategoriemi anti-SMASH nebo hrubšími produkty definovanými v BiG-SCAPE76.Aby se předešlo zkreslení vzorkování při kvantifikaci (taxonomické a funkční složení GCC/GCF, vzdálenost GCF a GCC od referenčních databází a metagenomická abundance GCF), ponecháním pouze nejdelšího BGC na GCF pro každý druh, bylo dále deduplikováno 39 055 BGC, výsledkem bylo celkem 17 689 BGC.
Novost GCC a GCF byla posouzena na základě vzdálenosti mezi vypočítanou databází (RefSeq databáze v BiG-FAM)29 a experimentálně ověřenou (MIBIG 2.0)30 BGC.Pro každý ze 17 689 reprezentativních BGC jsme zvolili nejmenší kosinusovou vzdálenost k příslušné databázi.Tyto minimální vzdálenosti se pak zprůměrují (průměr) podle GCF nebo GCC, podle potřeby.GCF se považuje za nový, pokud je vzdálenost k databázi větší než 0,2, což odpovídá ideální separaci mezi (průměrným) GCF a referencí.Pro GCC volíme 0,4, což je dvojnásobek prahové hodnoty definované GCF, abychom zajistili dlouhodobý vztah s odkazy.
Metagenomická abundance BGC byla odhadnuta jako průměrná abundance jejích biosyntetických genů (jak bylo stanoveno anti-SMASH) dostupných z profilů na úrovni genů.Metagenomická abundance každého GCF nebo GCC byla poté vypočtena jako součet reprezentativních BGC (ze 17 689).Tyto mapy abundance byly následně normalizovány pro buněčné složení pomocí počtu mOTU na vzorek, což také odpovídalo úsilí o sekvenování (rozšířená data, obr. 1d).Prevalence GCF nebo GCC byla vypočtena jako procento vzorků s abundancí > 0.
Euklidovská vzdálenost mezi vzorky byla vypočtena z normalizovaného profilu GCF.Tyto vzdálenosti byly zmenšeny pomocí UMAP77 a výsledná vložení byla použita pro shlukování založené na hustotě bez dozoru pomocí HDBSCAN78.Optimální minimální počet bodů pro shluk (a tedy počet shluků) používaný HDBSCAN je určen maximalizací kumulativní pravděpodobnosti členství ve shluku.Identifikované shluky (a náhodně vyvážený podvzorek těchto shluků k zohlednění zkreslení v permutační multivariační analýze rozptylu (PERMANOVA)) byly testovány na významnost proti neredukovaným euklidovským vzdálenostem pomocí PERMANOVA.Průměrná velikost genomu vzorků byla vypočtena na základě relativního množství mOTU a odhadované velikosti genomu členů genomů.Konkrétně průměrná velikost genomu každé mOTU byla odhadnuta jako průměr velikostí genomu jejích členů korigovaných na úplnost (po filtraci) (například 75% kompletní genom o délce 3 Mb má upravenou velikost 4 Mb).pro střední genomy s integritou ≥70 %.Průměrná velikost genomu pro každý vzorek byla poté vypočtena jako součet velikostí genomu mOTU vážených relativním množstvím.
Filtrovaná sada genomem kódovaných BGC v OMD je zobrazena v bakteriálních a archaálních stromech GTDB (v rámcích ≥5 kb, s výjimkou REF a SAG MarDB nenalezených v 1038 metagenomech, viz výše) a jejich předpokládaných kategorií produktů na základě fylogenetické pozice genomu (viz výše).Nejprve jsme zredukovali data podle druhů, přičemž jsme jako reprezentativní použili genom s největším počtem BGC v tomto druhu.Pro vizualizaci byli zástupci dále rozděleni do stromových skupin a opět pro každý buněčný klad byl jako zástupce vybrán genom obsahující největší počet BGC.Druhy obohacené o BGC (alespoň jeden genom s >15 BGC) byly dále analyzovány výpočtem Shannonova indexu diverzity pro typy produktů kódované v těchto BGC.Pokud jsou všechny předpokládané typy produktů stejné, chemické hybridy a další komplexní BGC (jak předpovídá anti-SMAH) jsou považovány za patřící do stejného typu produktu, bez ohledu na jejich pořadí v klastru (např. fúze protein-bakteriocin a bakteriocin-proteoprotein tělo).hybridní).
Zbývající DNA (odhadem 6 ng) ze vzorku Malaspina MP1648, která odpovídá biologickému vzorku SAMN05421555 a odpovídá sadě metagenomického čtení Illumina SRR3962772 pro krátké čtení, zpracována podle sekvenačního protokolu PacBio s ultranízkým vstupem pro použití soupravy PacBio SMRTbell gdification. souprava (100-980-000) a souprava pro přípravu šablony SMRTbell Express 2.0 (100-938-900).Stručně řečeno, zbývající DNA byla rozřezána, opravena a purifikována (kuličky ProNex) pomocí Covaris (g-TUBE, 52104).Purifikovaná DNA je poté podrobena přípravě knihovny, amplifikaci, purifikaci (kuličky ProNex) a selekci velikosti (>6 kb, Blue Pippin) před konečným purifikačním krokem (kuličky ProNex) a sekvenováním na platformě Sequel II.
Rekonstrukce prvních dvou cca.Pro MAG Eremiobacterota jsme identifikovali šest dalších ANI > 99 % (ty jsou zahrnuty na obrázku 3), které byly původně filtrovány na základě skóre kontaminace (později identifikovány jako genové duplikace, viz níže).Našli jsme také zásobník označený „Ca“.Eremiobacterota“ z různých studií23 a použil je spolu s osmi MAG z naší studie jako referenci pro metagenomické čtení z 633 eukaryotických obohacených (>0,8 µm) vzorků pomocí BWA (v.0.7.17) Ref -r1188, – příznak) pro downsampling mapování (5 milionů přečtení).Na základě map specifických pro obohacení (filtrovaných podle 95% identity zarovnání a 80% pokrytí čtením) bylo vybráno 10 metagenomů (očekávané pokrytí ≥5×) pro sestavení a dalších 49 metagenomů (očekávané pokrytí ≥1×) pro obsahovou korelaci.Za použití stejných parametrů jako výše byly tyto vzorky binovány a bylo přidáno 10 dalších 'Ca'.MAG Eremiobacterota byla obnovena.Těchto 16 MAG (nepočítáme-li dva již v databázi) přináší celkový počet genomů v rozšířené OMD na 34 815.MAG jsou přiřazeny taxonomické hodnosti na základě jejich genomové podobnosti a pozice v GTDB.18 MAG bylo dereplikováno pomocí dRep do 5 druhů (intraspecifická ANI > 99 %) a 3 rodů (intragenerická ANI 85 % až 94 %) ve stejné rodině79.Zástupci druhů byli ručně vybráni na základě integrity, kontaminace a N50.Navrhovaná nomenklatura je uvedena v doplňkových informacích.
Posoudit integritu a kontaminaci 'Ca.MAG Eremiobacterota jsme hodnotili přítomnost uscMG, stejně jako liniově a doménově specifické sady markerových genů s jednou kopií používané CheckM a Anvi'o.Identifikace 2 duplikátů ze 40 uscMG byla potvrzena fylogenetickou rekonstrukcí (viz níže), aby se vyloučila jakákoli potenciální kontaminace (to odpovídá 5 % na základě těchto 40 markerových genů).Další studie pěti reprezentativních MAG 'Ca.Nízká hladina kontaminantů v těchto rekonstruovaných genomech byla potvrzena u druhů Eremiobacterota pomocí interaktivního rozhraní Anvi'o založeného na korelacích abundance a složení sekvencí (doplňkové informace)59.
Pro fylogenomickou analýzu jsme vybrali pět reprezentativních MAG „Ca“.Eudormicrobiaceae“, všechny druhy „Ca.Genom Eremiobacterota a členů dalších kmenů (včetně UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria a Planctomycetota) je dostupný od GTDB (r89)13.Všechny tyto genomy byly anotovány, jak bylo popsáno dříve pro extrakci genu markeru jedné kopie a anotaci BGC.Genomy GTDB byly konzervovány podle výše uvedených kritérií integrity a kontaminace.Fylogenetická analýza byla provedena pomocí pracovního postupu Anvi'o Phylogenetics59.Strom byl zkonstruován pomocí IQTREE (v.2.0.3) (výchozí možnosti a -bb 1000)80 na uspořádání 39 tandemových ribozomálních proteinů identifikovaných Anvi'o (MUSCLE, v.3.8.1551)81.Jeho pozice byly redukovány.k pokrytí alespoň 50 % genomu82 a Planctomycecota byla použita jako vnější skupina na základě topologie stromu GTDB.Jeden strom 40 uscMG byl vytvořen pomocí stejných nástrojů a parametrů.
K predikci běžných mikrobiálních znaků jsme použili Traitar (v.1.1.2) s výchozími parametry (fenotyp, z nukleotidů)83.Prozkoumali jsme potenciální predátorský životní styl založený na dříve vyvinutém predátorském indexu84, který závisí na obsahu genu kódujícího protein v genomu.Konkrétně používáme DIAMOND k porovnání proteinů v genomu s databází OrthoMCL (v.4)85 pomocí možností –více-citlivější –id 25 –dotaz-pokrytí 70 –předmět-pokrytí 70 –top 20 A spočítat geny odpovídající markerové geny pro predátory a nepredátory.Index je rozdíl mezi počtem dravých a nedravých označení.Jako další kontrolu jsme také analyzovali genom „Ca“.Faktor Entotheonella TSY118 je založen na jeho spojení s Ca.Eudoremicrobium (velká velikost genomu a biosyntetický potenciál).Dále jsme testovali potenciální vazby mezi predátorskými a nepredátorskými markerovými geny a biosyntetický potenciál Ca.Eudormicrobiaceae“ a zjistili, že ne více než jeden gen (z jakéhokoli typu markerového genu, tj. predátorský/nepredátorský gen) se překrývá s BGC, což naznačuje, že BGC nezaměňuje predační signály.Další genomická anotace míchaných replikonů byla provedena pomocí TXSSCAN (v.1.0.2), aby se specificky prozkoumal sekreční systém, pili a bičíky86.
Pět reprezentativních 'Ca' bylo zmapováno mapováním 623 metatranskriptomů z prokaryotických a eukaryotických obohacených frakcí oceánů Tara22,40,87 (pomocí BWA, v.0.7.17-r1188, -a flag).Genom Eudormicrobiaceae.Soubory BAM byly zpracovány pomocí FeatureCounts (v.2.0.1)88 po 80% pokrytí čtení a 95% filtrování identity (s možnostmi featureCounts –primární -O –fraction -t CDS,tRNA -F GTF -g ID -p ) Počítá počet inzertů na gen.Vytvořené mapy byly normalizovány na délku genu a množství markerového genu mOTU (délkově normalizovaný průměrný počet inzercí pro geny s počtem inzercí > 0) a log-transformovány na 22,74, aby se získala relativní exprese na buňku každé úrovně genu, což také vysvětluje variabilita od vzorku ke vzorku během sekvenování.Takové poměry umožňují srovnávací analýzu a zmírňují problémy se složením při použití údajů o relativním množství.Pro další analýzu byly zvažovány pouze vzorky s >5 z 10 mOTU markerových genů, aby bylo možné detekovat dostatečně velkou část genomu.
Normalizovaný transkriptomový profil 'Ca.E. taraoceanii byla podrobena redukci rozměrů pomocí UMAP a výsledná reprezentace byla použita pro nekontrolované shlukování pomocí HDBSCAN (viz výše) ke stanovení stavu exprese.PERMANOVA testuje významnost rozdílů mezi identifikovanými shluky v původním (nezmenšeném) prostoru vzdálenosti.Diferenciální exprese mezi těmito podmínkami byla testována napříč genomem (viz výše) a bylo identifikováno 201 KEGG drah v 6 funkčních skupinách, jmenovitě: BGC, sekreční systém a bičíkové geny z TXSSCAN, degradační enzymy (proteázy a peptidázy) a dravé a ne predátorské geny.predátorské indexové značky.Pro každý vzorek jsme vypočítali střední normalizovanou expresi pro každou třídu (všimněte si, že samotná exprese BGC se vypočítá jako střední exprese biosyntetických genů pro tuto BGC) a testovali jsme významnost napříč státy (Kruskal-Wallisův test upravený pro FDR).
Syntetické geny byly zakoupeny od GenScript a PCR primery byly zakoupeny od Microsynth.Pro amplifikaci DNA byla použita fúzní polymeráza od Thermo Fisher Scientific.Pro purifikaci DNA byly použity NucleoSpin plasmidy, NucleoSpin gel a PCR purification kit od Macherey-Nagel.Restrikční enzymy a T4 DNA ligáza byly zakoupeny od New England Biolabs.Chemikálie jiné než isopropyl-p-d-1-thiogalaktopyranosid (IPTG) (Biosynth) a 1,4-dithiothreitol (DTT, AppliChem) byly zakoupeny od Sigma-Aldrich a použity bez dalšího čištění.Antibiotika chloramfenikol (Cm), spektinomycin dihydrochlorid (Sm), ampicilin (Amp), gentamicin (Gt) a karbenicilin (Cbn) byla zakoupena od AppliChem.Složky média Bacto Tryptone a Bacto Yeast Extract byly zakoupeny od BD Biosciences.Trypsin pro sekvenování byl zakoupen od společnosti Promega.
Genové sekvence byly extrahovány z anti-SMASH predikovaného BGC 75.1.E. malaspinii (Doplňkové informace).
The genes embA (locus, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (locus, MALA_SAMN05422137_METAG-framework_127-gene_4), and embAM (including intergene regions) were sequenced as synthetic constructs in pUC57(AmpR) with and without codons optimized for expression in E když.Gen embA byl subklonován do prvního mnohočetného klonovacího místa (MCS1) pACYCDuet-1(CmR) a pCDFDuet-1(SmR) s místy štěpení BamHI a HindIII.Geny embM a embMopt (kodonově optimalizované) byly subklonovány do MCS1 pCDFDuet-1(SmR) pomocí BamHI a HindIII a umístěny do druhého vícenásobného klonovacího místa pCDFDuet-1(SmR) a pRSFDuet-1(KanR) (MCS2) s Ndel/ChoI.Kazeta embAM byla subklonována do pCDFDuetl(SmR) s místy štěpení BamHI a HindIII.Gen orf3/embI (lokus, MALA_SAMN05422137_METAG-scaffold_127-gene_3) byl zkonstruován pomocí překryvné extenzní PCR s použitím primerů EmbI_OE_F_NdeI a EmbI_OE_R_XhoI, štěpen Ndel/Xhol (Xhol, a ligován do stejného pCMC-DFEmbet) a ligován do stejného pChoI-1DEmbet doplňující stůl).6).Štěpení a ligace restrikčními enzymy byla provedena podle protokolu výrobce (New England Biolabs).

 


Čas odeslání: 14. března 2023