Informasjon

Metatranscriptomics Extraction

Metatranscriptomics Extraction



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Jeg prøver å utføre metatranscriptomics analyse av et renrom. DNA -innspillet er kjent for å være ganske lavt (<1pg). Til tross for dette, vil jeg fortsatt prøve det. Jeg tenker at det kan være best å utføre ekstraksjonsforsøk på forhånd hvor visse parametere manipuleres. Jeg kan deretter avgjøre ut fra disse ekstraksjonsforsøkene hvilke verdier for hvilke parametere som er best.

Som et eksempel leser jeg en fagfellevurdert artikkel kalt "Validering av picogram- og femtogram-input-DNA-biblioteker for mikroskala metagenomikk" der de brukte Illumina Nextera XT DNA-bibliotekspreparasjonssett på prøver med lav biomasse. To av parameterne de manipulerte var:

1) PCR -syklusnummer (Verdier = 12, 14, 16, 18, 20) 2) ATM -fortynning (Verdier = ufortynnet, 1: 5, 1:10, 1:20, 1:50)

Jeg håper å bruke samme type ekstraksjonsforsøk for å avgjøre hvilken kombinasjon av verdier fra disse to parameterne som er best for et rent rom. Mitt første spørsmål er: Hvordan kan jeg finne ut hvilken kombinasjon som er best (da det er 25 kombinasjoner)? Jeg har to ideer (men er åpen for andre):

1) Kontroller mengden av RNA -avledet 2) Kontroller noen kvalitetsmålinger på RNA

Som jeg håper å gjøre trillinger av hver av de 25 kombinasjonene, vil jeg ha 75 prøver. Jeg håper at jeg ikke trenger å gjøre sekvensering, da det er tidkrevende og muligens dyrt for å velge den beste kombinasjonen. Er det en måte å velge hvilken kombinasjon som fungerer best uten å måtte sekvensere?

Mitt andre spørsmål er: Er det noen andre parametere i denne arbeidsflyten som jeg også kan teste for hvis jeg ikke får anstendige resultater i disse renrommene med lav biomasse?

(Som du kan fortelle, har jeg ikke for mye direkte molekylærbiologisk erfaring, så vær så snill å korrigere eller stille spørsmål ved noe av innlegget mitt og/eller "dumme ned" svaret ditt). Takk for at du delte råd (for begge spørsmålene)!


  1. Vurder å gjøre triplikater av bare 4 kombinasjoner av syklus/fortynning: lav+lav, lav+høy, høy+lav, høy+høy. Enklere.

  2. Viktigst: bevis at du kan trekke ut DNA fra et rent rom. Hvis du trekker deg ut fra et ekte rent rom og ikke får noe resultat av PCR, er det kanskje fordi du ikke klarte å samle inn noe eller kanskje ingenting var der. Idé - spray en kjent mengde DNA inn i et rom som vil fungere som ditt rene rom. Deretter gjør du ekstraksjonsprotokollen. Du kan teste syklus- / fortynningsparametrene med sham clean room -ekstraksjonen og få disse variablene optimalisert for når du samler fra et ekte "vilt" rent rom du ikke dopet med DNA.


Metatranscriptomics som et verktøy for å identifisere sopparter og underarter i blandede lokalsamfunn - et bevis på konseptet under laboratorieforhold

High-throughput sequencing (HTS) muliggjør generering av store mengder genom-sekvensdata til en rimelig pris. Organismer i blandede mikrobielle samfunn kan nå sekvenseres og identifiseres på en kulturuavhengig måte, vanligvis ved bruk av amplikon-sekvensering av en DNA-strekkode. Bulk-RNA-seq (metatranscriptomics) har flere fordeler i forhold til DNA-basert amplikon-sekvensering: det er mindre utsatt for amplifikasjonsspenninger, det fanger bare levende organismer, og det gjør det mulig å bruke et større sett med gener for taksonomisk identifisering. Ved å bruke et modell -mock -samfunn som består av 17 soppisolater, evaluerte vi om metatranscriptomics nøyaktig kan identifisere sopparter og underarter i blandede lokalsamfunn. Totalt sett ble 72,9% av RNA -transkripsjonene klassifisert, hvorav de aller fleste (99,5%) ble korrekt identifisert på artnivå. Av de 15 artene som ble sekvensert, ble 13 hentet ut og identifisert riktig. Vi oppdaget også variasjon i belastningsnivå i Cryptococcus artskomplekser: 99,3% av utskrifter tildelt Cryptococcus ble klassifisert som en av de fire stammene som ble brukt i det falske samfunnet. Laboratoriekontaminanter og/eller feilklassifiseringer var forskjellige, men representerte bare 0,44% av transkripsjonene. Derfor viser disse resultatene at det er mulig å oppnå nøyaktig arts- og stamme-nivå soppidentifikasjon fra metatranscriptome data så lenge taxa identifisert ved lav overflod blir kastet for å unngå falske positiver fra kontaminering eller feilklassifiseringer. Denne studien belyser både fordelene og dagens utfordringer ved anvendelse av metatranscriptomics i klinisk mykologi og økologiske studier.


ORIGINAL FORSKNING artikkel

Yuhong Huang 1,2,3 †, Zhuolin Yi 2,3 †, Yanling Jin 2,3, Mengjun Huang 2,3, Kaize He 2,3, Dayu Liu 1, Huibo Luo 4, Dong Zhao 5, Hui He 6, Yang Fang 2,3 * og Hai Zhao 1,2,3 *
  • 1 Kjøttbehandlingsapplikasjon Nøkkellaboratorium i Sichuan-provinsen, College of Pharmacy and Biological Engineering, Chengdu University, Chengdu, Kina
  • 2 Environmental Microbiology Key Laboratory of Sichuan Province, Chengdu Institute of Biology, Chinese Academy of Sciences, Chengdu, Kina
  • 3 Key Laboratory of Environmental and Applied Microbiology, Chinese Academy of Sciences, Chengdu, Kina
  • 4 Liquor Making Bio-Technology and Application of Key Laboratory of Sichuan Province, Bioengineering College, Sichuan University of Science and Engineering, Zigong, Kina
  • 5 Wuliangye Group, Yibin, Kina
  • 6 Department of Liquor Making Engineering, Moutai College, Renhuai, Kina

Kinesisk brennevin er en av verdens mest kjente brennevin og er den største spritkategorien etter salg. Den unike og tradisjonelle solid-state gjæringsteknologien som brukes til å produsere kinesisk brennevin har vært i kontinuerlig bruk i flere tusen år. Det mangfoldige og dynamiske mikrobielle samfunnet i en brennevin starter er den viktigste bidragsyteren til brennevin. Imidlertid er lite kjent om den økologiske fordelingen og funksjonelle betydningen til disse fellesskapsmedlemmene. I denne studien ble metatranscriptomics brukt til å grundig utforske de aktive mikrobielle fellesskapsmedlemmene og viktige transkripsjoner med betydelige funksjoner i produksjonsprosessen for brennevin. Sopp ble funnet å være de mest utbredte og aktive medlemmer av samfunnet. Totalt 932 karbohydrataktive enzymer, inkludert høyt uttrykt hjelpeaktivitetsfamilie 9 og 10 proteiner, ble identifisert ved 62 ଌ under aerobe forhold. Noen potensielle termostabile enzymer ble identifisert ved 50, 62 og 25 ଌ (modent stadium). Økt innhold og overuttrykte sentrale enzymer involvert i glykolyse og stivelse, pyruvat og etanolmetabolisme ble påvist ved 50 og 62 ଌ. Nøkkelenzymene i sitratsyklusen ble oppregulert ved 62 ଌ, og deres store derivater er avgjørende for smaksgenerering. Her ble stoffskiftet og funksjonelle enzymer i de aktive mikrobielle samfunnene i NF-brennevinstarter studert, noe som kunne bane vei for å sette i gang forbedringer i brennevinskvalitet og for å oppdage mikrober som produserer nye enzymer eller produkter med høy verdi.


Dataopplasting

Hands_on Hands-on: Dataopplasting

  1. Lag en ny historie for denne opplæringen og gi den et eget navn

Tips: Opprette en ny historie

  1. Klikk på galaxy -gear -ikonet (Historiske alternativer) på toppen av historikkpanelet
  2. Velg alternativet Lag ny fra menyen

Tips: Gi nytt navn til en historie

  1. Klikk på Navnløs historie (eller det nåværende navnet på historien) (Klikk for å gi nytt navn til historien) øverst i historikkpanelet
  2. Skriv inn det nye navnet
  3. trykk enter

Import Verktøy: last opp1 T1A_forward og T1A_reverse fra Zenodo eller fra databiblioteket (spør læreren din)

Tips: Importerer via lenker

  • Kopier koblingen
  • Åpne Galaxy Upload Manager (galaxy -opplasting øverst til høyre i verktøypanelet)

  • Plukke ut Lim inn/hent data
  • Lim inn lenken i tekstfeltet

  • trykk Start

  • Lukk vinduet

  • Som standard bruker Galaxy nettadressen som navn, så gi filene et nytt navn.

Tips: Importere data fra et databibliotek

  • Gå inn til Delte data (toppanelet) da Databiblioteker

  • Finn riktig mappe (spør læreren din)

  • Velg de ønskede filene
  • Klikk på Til historie knappen øverst og velg som datasett fra rullegardinmenyen
  • I popup-vinduet velger du historien du vil importere filene til (eller oppretter en ny)
  • Klikk på Import

Som standard tar Galaxy lenken som navn, så gi dem nytt navn.

Gi nytt navn galaxy -blyant filene til T1A_forward og T1A_reverse

Tips: Gi nytt navn til et datasett

  • Klikk på galaksen -blyanten blyantikon for datasettet å redigere attributtene
  • I det sentrale panelet, endre Navn felt
  • Klikk på Lagre knapp

Kontroller at datatypen er fastqsanger (f.eks. ikke fastq). Hvis det ikke er det, må du endre datatypen til fastqsanger.

Tips: Endre datatypen

  • Klikk på galaksen -blyanten blyantikon for datasettet å redigere attributtene
  • I det sentrale panelet klikker du på galaksen -chart-select-data Datatyper kategorien øverst
  • Velg fastqsanger
  • Klikk på Endre datatype knapp

Metatranscriptomics: en tilnærming for å hente nye eukaryote gener fra forurensede og beslektede miljøer

Metatranscriptomics, en delmengde av metagenomics, gir verdifull informasjon om hele genuttrykksprofilering av komplekse mikrobielle samfunn i et økosystem. Metagenomiske studier fokuserer hovedsakelig på det genomiske innholdet og identifikasjonen av mikrober som er tilstede i et fellesskap, mens metatranscriptomics gir mangfoldet av de aktive genene i et slikt fellesskap, deres uttrykksprofil og hvordan disse nivåene endres på grunn av endringer i miljøforholdene. Metatranscriptomics har blitt brukt på forskjellige typer miljøer, fra studiet av menneskelige mikrobiomer, til de som finnes i planter, dyr, i jord og i akvatiske systemer. Metatranscriptomics, basert på utnyttelse av mRNA isolert fra miljøprøver, er en egnet tilnærming til å utvinne den eukaryote genpoolen for gener av bioteknologisk relevans. Det er også viktig å utvikle forskjellige bioinformatiske rørledninger for å analysere dataene hentet fra metatranscriptomic analyse. I denne gjennomgangen oppsummerer vi metatranscriptomics som brukes på jordmiljøer for å studere det funksjonelle mangfoldet, og diskuterer tilnærminger for å isolere genene som er involvert i nedbrytning av organisk materiale og gi toleranse for giftige metaller, metatranscriptomics rolle i mikrobiomforskning, ulike bioinformatikkrørledninger som brukes i dataanalyse og tekniske utfordringer for å få biologisk meningsfull innsikt i denne tilnærmingen.

Dette er en forhåndsvisning av abonnementsinnhold, tilgang via institusjonen din.


En robust metatranscriptomisk teknologi for befolkningsskalaundersøkelser av kosthold, tarmmikrobiom og menneskers helse

En funksjonell avlesning av tarmmikrobiomet er nødvendig for å muliggjøre presis kontroll av tarmmikrobiomets funksjoner, som støtter menneskers helse og forhindrer eller minimerer et bredt spekter av kroniske sykdommer. Krakkmetatranscriptomisk analyse gir et omfattende funksjonelt syn på tarmmikrobiomet, men til tross for at det er nyttig, har det sjelden blitt brukt i kliniske studier på grunn av dets kompleksitet, kostnad og bioinformatiske utfordringer. Denne metoden har også mottatt kritikk på grunn av potensiell variabilitet mellom prøvene, raske endringer og nedbrytning av RNA. Her beskriver vi en robust og automatisert avføring metatranscriptomisk metode, kalt Viomega, som ble spesielt utviklet for studier i populasjonsskala. Viomega inkluderer prøvesamling, bevaring av omgivelsestemperatur, total RNA -ekstraksjon, fysisk fjerning av ribosomale RNA (rRNA), utarbeidelse av retningsbestemte Illumina -biblioteker, Illumina -sekvensering, taksonomisk klassifisering basert på en database med & gt110.000 mikrobielle genomer og kvantitativt mikrobielt genuttrykk analyse ved hjelp av en database med

100 millioner mikrobielle gener. Vi brukte denne metoden på 10.000 humane avføringsprøver og utførte flere småskala studier for å demonstrere prøvestabilitet og konsistens. Oppsummert er Viomega en billig, høy gjennomstrømning, automatisert og nøyaktig prøve-til-resultat avføring metatranscriptomisk teknologiplattform for store studier og et bredt spekter av applikasjoner.

1. Introduksjon

Den menneskelige tarmen inneholder et stort antall kommensale mikroorganismer som utfører en lang rekke metabolske funksjoner. Metabolitter produsert av disse mikroorganismer kan ha dyptgående effekter på menneskelig fysiologi, med direkte koblinger til helse og sykdomsstatus [1–4]. Tarmdysbiose bidrar sannsynligvis til utvikling og progresjon av mange sykdommer og lidelser, for eksempel kardiovaskulær sykdom, hypertensjon, fedme, diabetes og autoimmune sykdommer [5–9]. Det er også sterke bevis på at tarmmikroorganismer direkte samhandler med nervesystemet og etablerer tarm-hjerne-aksen [10]. Tarm-hjerne-aksen har vist seg å modulere utviklingen av nevrodegenerative sykdommer som Alzheimers sykdom, Autism Spectrum Disorder (ASD) og Parkinsons sykdom [11–14].

Tarmmikrobiomet spiller en kritisk rolle i fysiologisk homeostase, noe som resulterer i økende vitenskapelig undersøkelse av omfanget av tarmmikrobiomet sin rolle i menneskers helse og sykdom. Mennesker har utviklet seg med mikrobiomet og har blitt avhengige av dets biokjemiske produksjon, for eksempel visse vitaminer og kortkjedede fettsyrer [15, 16]. Tarmmikrobiomet kan også produsere skadelige biokjemikalier som har vært implisert i ulike sykdomstilstander [15]. For å forstå forholdet mellom tarmmikrobiomet og menneskers helsetilstand fullt ut, må biokjemiske funksjoner til mikroorganismer identifiseres og kvantifiseres. Flere neste generasjons sekvenseringsbaserte metoder har blitt brukt for å analysere tarmmikrobiomet, hver med klare fordeler og ulemper. Den enkleste, minst kostbare og vanligste metoden er 16S rRNA -gensekvensering [17], som sekvenserer en liten del av det høyt konserverte prokaryote 16S ribosomale RNA -genet [18]. Denne metoden kan gi taksonomisk oppløsning til slektsnivået [19, 20], men den måler ikke de biokjemiske funksjonene til mikroorganismer [18] eller skiller levende fra døde organismer. I tillegg utelukker tradisjonell 16S rRNA -sekvensering noen bakterier, de fleste archaea og alle eukaryote organismer og virus [21], noe som resulterer i et begrenset syn på tarmmikrobiomets økosystem.

Metagenomisk (haglgevær-DNA) sekvensering gir oppløsning på stamnivå for alle DNA-baserte mikroorganismer [18] (den oppdager ikke RNA-virus eller RNA-bakteriofager). Imidlertid kan den bare identifisere potensiell biokjemiske funksjoner til mikrobiomet og kan verken identifisere eller kvantifisere de aktive biokjemiske veiene. Dette er en ulempe for å studere dysbioserelaterte sykdomstilstander, for eksempel inflammatorisk tarmsykdom (IBD), som har vist seg å ha en forskjell mellom metagenomiske potensielle veier og faktiske biokjemiske veier uttrykt i sykdom og kontrollpopulasjoner [22].

Metatranscriptomic analyse (metatranscriptomics, RNA-sekvensering og RNAseq) gir innsikt i de biokjemiske aktivitetene i tarmmikrobiomet ved å kvantifisere ekspresjonsnivåer for aktive mikrobielle gener, slik at det kan vurderes av pathway-aktiviteter, samtidig som den gir taksonomisk oppløsning på belastningsnivå for alle metabolsk aktive organismer og virus [23, 24]. Hittil har metatranscriptomiske analyser av avføringsprøver vært begrenset på grunn av kostnaden og kompleksiteten til både laboratorie- og bioinformatiske metoder [25]. Ved å fjerne mindre informativt rRNA kan mer verdifulle transkriptomdata genereres med mindre sekvenseringsdybde [24, 26], noe som resulterer i reduserte pr. Prøve-sekvenseringskostnader.

En automatisert teknologi er utviklet for metatranscriptomisk analyse av kliniske prøver fra mennesker, kalt Viomega. I denne studien ble Viomega brukt på 10.000 humane avføringsprøver for å få en bedre forståelse av belastningsnivå-taksonomier og mikrobielle funksjoner. Flere småskala studier ble utført for å kvantifisere metatranscriptomisk stabilitet i nedre tykktarm og måle variabiliteten mellom metatranscriptomiske analyser.

2. Materialer og metoder

2.1. Studiedeltakere, etikk og prøveinnsamling og transport

I denne studien brukte Viome data fra 10 000 deltakere. Alle studiedeltakere ga samtykke til å delta i studien, og alle studieprosedyrer ble godkjent av et føderalt akkreditert Institutional Review Board (IRB). Deltakerne ble rekruttert fra alle aldre, kjønn og etniske grupper.

Avføringsprøver ble samlet ved hjelp av Viome's Gut Intelligence -kit av hver studiedeltaker på sine egne boliger. Settet inkluderte et prøvetakingsrør med integrert skje, et proprietært RNA -konserveringsmiddel og sterile glassperler. En avføringstørrelsesprøve ble samlet og plassert inne i røret og rystet kraftig for å homogenisere prøven, og den ble utsatt for RNA-konserveringsmiddelet. Prøven ble deretter sendt ved romtemperatur ved bruk av en vanlig bud til Viome laboratorier for analyse. Leveringstidene varierte fra en til tolv dager. Hver deltaker fylte ut et spørreskjema med generell livsstils- og helseinformasjon.

2.2. Metatranscriptomic analyse av avføringsprøver

For metatranscriptomic analyse av 10.000 avføringsprøver, ble en proprietær prøve-til-resultat automatisert plattform kalt Viomega brukt. Krakkprøver ble lysert ved bruk av perleslag i et sterkt kjemisk denatureringsmiddel og deretter plassert på en automatisert væskebehandler, som utførte alle nedstrøms laboratoriemetoder. Prøver ble behandlet i grupper i en 96-brønns mikroplate, hver batch besto av nittifire humane avføringsprøver, en negativ prosesskontroll (NPC, vann) og en positiv prosesskontroll (PPC, tilpasset syntetisk RNA). RNA ble ekstrahert ved bruk av en proprietær metode. I korte trekk ble silisiumbelagte perler og en serie vasker brukt til å rense RNA etter lysering og RNA ble eluert i vann. DNA ble degradert ved bruk av RNase-fri DNase.

Flertallet av prokaryote ribosomale RNA (rRNA: 16S og 23S) ble fjernet ved bruk av en tilpasset subtraktiv hybridiseringsmetode. Biotinylerte DNA-prober med sekvenser som er komplementære til rRNA ble tilsatt totalt RNA, blandingen ble oppvarmet og avkjølt, og probe-rRNA-kompleksene ble fjernet ved bruk av magnetiske streptavidinkuler. De resterende RNA-ene ble konvertert til retningsbestemte sekvenseringsbiblioteker med unike dual-strekkodede adaptere og ultrarene reagenser. Biblioteker ble samlet og kvalitetskontrollert med dsDNA Qubit (Thermo Fisher Scientific) og Fragment Analyzer (Advanced Analytical). Bibliotekbassenger ble sekvensert på Illumina NextSeq- eller NovaSeq -instrumenter ved bruk av 300 sykkelsett.

Viomegas modul for bioinformatikk opererer på Amazon Web Services og inkluderer kvalitetskontroll, taksonomisk profilering og funksjonell analyse. Kvalitetskontrollverktøy trimmer og filtrerer rålesningene og kvantifiserer mengdene mellom prøve-til-prøve-kryssprat og bakgrunnskontaminering av mikrobielle taxa. Viomega genererer lesebaserte taksonomioppgaver ved hjelp av en flertrinnsprosess. Sekvenseringene er justert til en proprietær database med forhåndsberegnede genomiske signaturer på tre taksonomiske nivåer: stamme, art og slekt. De unike signaturene beregnes fra genomer i full lengde ved å fjerne korte undersekvenser av en definert lengde,

( - mer), delt blant mer enn ett genom og beholdt unike - mer som utgjør signaturen [27]. Viomega -taksonomidatabasen ble generert fra en stor RefSeq -database som inneholder mer enn 110 000 mikrobielle genomer. Etter at de første taksonomiske oppgavene ble generert, ble potensielle falske positiver fjernet ved hjelp av Auto-Blast-algoritmen som bruker en enda større database med organismer.

Identiteten og den relative aktiviteten til mikrobielle gener og enzymatiske funksjoner i avføringsprøvene ble vurdert ved hjelp av en proprietær algoritme. På et høyt nivå innebærer dette en flerlags tilnærming for å justere prøvelesene til det integrerte genkataloget (IGC) [28] bibliotek av gener for først å identifisere og deretter kvantifisere genene i prøven. Informative gener (dvs. ikke-rRNA) ble kvantifisert i enheter av transkripsjoner per million (TPM) for å tillate sammenligninger på tvers av prøver. Ved å bruke Kyoto Encyclopedia of Genes and Genomes (KEGG) [29] annoteringskartlegging av IGC -gener til KEGG -ortologier (KOer), ble enzymfunksjonene og aktiviteten kvantifisert i disse prøvene som den samlede TPM. KEGG -kartleggingen gir også mulighet for funksjonelle moduler og veianalyse.

2.3. Småskala studier

For validering av prøvelysen i Viomega -rørledningen ble følgende organismer dyrket i næringsbuljong ved 37 ° C og 450 rpm i en VWR -inkuberende minishaker: Bacillus subtilis Marburg-stamme (ATCC 6051-U), Corynebacterium stationis stamme NCTC 2399 (ATCC 6872), Citrobacter freundii stamme ATCC 13316, NCTC 9750 (ATCC 8090), og Serratia liquefaciens stamme CDC 1284-57 ATCC 12926 (ATCC 27592). I tillegg ble følgende organismer dyrket i gjærsoppbuljong ved 37 ° C og 450 o / min i en VWR inkuberende minishaker: Saccharomyces cerevisiae stamme S288C (ATCC 204508) og Candida dubliniensis stamme CBS 7987 (ATCC MYA-646).

For å illustrere nøyaktigheten av taksonomisk klassifisering på artnivået i Viomega-teknologien, ble produktet 10 Strain Even Mix Whole Cell Material (ATCC® MSA-2003 ™) benyttet. Som angitt av produsenten, består dette produktet av en jevn blanding av følgende organismer: Bacillus cereus (ATCC 10987), Bifidobacterium adolescentis (ATCC 15703), Clostridium beijerinckii (ATCC 35702), Deinococcus radiodurans (ATCC BAA816), Enterococcus faecalis (ATCC 47077), Escherichia coli (ATCC 700926), Lactobacillus gasseri (ATCC 33323), Rhodobacter sphaeroides (ATCC 17029), Staphylococcus epidermidis (ATCC 12228), og Streptococcus mutans (ATCC 700610).

3. Resultater og diskusjon

3.1. Validering av Viomega Technology
3.1.1. Prøve -analyse

Ujevn prøvelysering kan føre til store feil i enhver metode siden prøvesammensetning kan variere mye når det gjelder lett-å-lysere mikroorganismer (virus og Gram (-) bakterier) og vanskelige til svært vanskelige å lyse Gram (+) bakterier og gjær. Viomega benytter en kombinasjon av kjemiske (denaturerende) og fysiske (perleslag) prøvelyser, som har vist seg å ha den beste effektiviteten. For å teste denne metoden ble to stammer Gram (-) bakterier, to stammer Gram (+) bakterier og to gjærstammer dyrket til et optisk tetthetsområde på 0,4-0,8 AU. Like store mengder av hver organisme i tre eksemplarer gjennomgikk deretter kjemiske og fysiske prøvelyser, og totalt RNA ble ekstrahert fra hver prøve. Oppnådde RNA -utbytter var konsistente og viste ingen forspenning mot Gram (+) bakterier eller gjær (gjennomsnittlig utbytte:


Metatranscriptomic analyse av ektomykorrhizale røtter avslører gener assosiert med Piloderma–Pi oss symbiose: forbedret metodikk for vurdering av genuttrykk in situ

Ectomycorrhizal (EM) sopp danner symbiotiske assosiasjoner med planterøtter som regulerer næringsutveksling mellom skogplanter og jord. Miljømetagenomiske tilnærminger som bruker neste generasjons sekvensering viser stort løfte for å studere EM-symbioser, men metatranscriptomiske studier har blitt begrenset av de iboende vanskene forbundet med isolasjon og sekvensering av RNA fra mycorrhizae. Her bruker vi en optimalisert metode for kombinert DNA/RNA-ekstraksjon ved bruk av feltsamlede EM sopp-furu rotklynger, sammen med protokoller for taksonomisk identifisering av uttrykt ribosomalt RNA, og slutning av EM-funksjon basert på plante- og soppmetatranscriptomikk. Vi brukte transkriberte deler av ribosomale RNA -gener for å identifisere flere transkripsjonelt dominerende sopptaxa assosiert med loblolly furu, inkludert ENmphinema, Russula og Piloderma spp. En taxon, Piloderma croceum, har et offentlig tilgjengelig genom som tillot oss å identifisere mønstre av geninnhold og transkripsjonens overflod. Over 1500 rikelig uttrykt Piloderma gener ble påvist fra mykorrhizale røtter, inkludert gener for proteinmetabolisme, cellesignalering, elektrontransport, terpensyntese og andre ekstracellulære aktiviteter. I motsetning, Piloderma genet som koder for en ammoniakktransportør, viste størst transkripsjonsmengde i jordprøver. Vår metodikk fremhever potensialet til metatranscriptomics for å identifisere gener assosiert med symbiose og økosystemfunksjon ved hjelp av feltinnsamlede prøver.

Fig. S1. Plasseringen av innsamlingsstedene.

Fig. S2. Delvise ribosomale RNA-sekvenser med stor underenhet (D2-regionen, ∼ 180 bp) for de mest dominerende sopptaxaene som er påvist fra mykorrhizale rotklynger (fig. 3).

Fig. S3. Fylogenetisk plassering av LSU RNA -sekvenser for tre Piloderma spp. basert på ribosomal storenhet D2-region. Sekvensene ble justert mot taksonomisk identifiserte referansesekvenser av Piloderma spp. fra GenBank med ClustalW fylogenetiske analyser utført ved bruk av parsimoniumskriterium i PAUP 3.0. Bootstrap -treet (‘fast bootstrap’ med 300 replikater) viser plassering av tre Piloderma spp.

Fig. S4. Nukleotid- og peptidsekvenser av Piloderma effektorer: (A) PiCr1, (B) PiBas, (C) PiSs1 og (D) PiEsp. De antatte signalsekvensene er vist i peptidsekvensen (fet og understreket). I (A) er det symmetriske arrangementet av cystein (C) rester vist med fet skrift.

Fig. S5. Bånddiagrammer viste de forutsagte tertiære strukturer for (A) PiCr, (B) PiBas, (C) PiSs1 og (D) PiEsp. Helix (rosa) og arkstrukturer (gul) ble vist. N- og C -terminalen er merket. Proteintertiære strukturer ble spådd ved bruk av I-TASSER v 3.0 (Zhang 2008 Roy et al., 2010 Roy et al., 2012). C-score er en konfidenspoengsum for å estimere kvaliteten på forutsagte modeller av I-TASSER. Den beregnes ut fra betydningen av gjengemalljusteringer og konvergensparametrene til konstruksjonssimuleringene. C-score ligger i området fra –5 til 2, der en C-score med høyere verdi betyr en modell med høy selvtillit.

Fig. S6. Delbilder av visualisering for lesing av rotprøver Bowtie-kartlagt til en 28S rRNA-referanse (gi300394395, Piloderma fallax) ved hjelp av Integrative Genomics Viewer 2.2 × (Thorvaldsdóttir et al. 2013). Færre og variable sekvenser ble funnet i variabel region (D1 og D2) sammenlignet med de bevarte områdene på 28S. Den røde boksen indikerer regionen (∼ 180 bp) der avlesningene ble trukket ut for identifisering av sopptaxa i denne studien. Kartlagte stolper i blått indikerer at den utledede innsatsstørrelsen på referansegenet er mindre enn forventet gitt den faktiske innsatsstørrelsen rød er den utledede innsatsstørrelsen på referansegenet er større enn forventet gitt den faktiske innsatsstørrelsen.

Fig. S7. Forutsagt aminosyresekvens av PiAMT.

Tabell S1. Sammenligning av RNA -ekstraksjonsmetoder for furu røtter (EM) og nåler.

Tabell S2. Les og prosent av lese assosiert med sopp-, bakterie- og furutranskripsjoner i EM -rotklynger oppdaget av Illumina HiSeq.

Tabell S3. Taksonomisk sammensetning av EM rotklynger basert på (A) ITS DNA amplikon sekvenser (B) transkriberte ITS RNA sekvenser, og (C) ribosomal RNA (LSU D2 region). (A – C) De absolutte tallene (lesetellingene) og den relative verdien (% avlesninger) vises.

Tabell S4. Sterkt uttrykk for Piloderma -gengrupper i jord- og rotprøver.

Genfamiliene med % read & gt0.02 i minst en prøve ble valgt. Tabell S4A viste antall avlesninger av individuelle genfamilier hentet fra rot- og jordprøver. Tabell S4B viste listen Piloderma -protein -ID fra PilCr1 -databasen for hver gengruppe.

Tabell S5. Relativt uttrykk for Pinus taeda gener av mykorrhizale rotklynger. Deseq 1.14.0 -pakken (Anders og Huber, 2010) ble brukt for å normalisere lesningene som er kartlagt til Pinus taeda EST -database (Deseq & gt 100 cutoff). Simon Anders og Wolfgang Huber (2010): Differensial uttrykksanalyse for sekvensantall. Genombiologi 11: R106.

Vær oppmerksom på: Utgiveren er ikke ansvarlig for innholdet eller funksjonaliteten til støtteinformasjon fra forfatterne. Eventuelle spørsmål (annet enn manglende innhold) bør rettes til den tilsvarende forfatteren for artikkelen.


Anerkjennelser

Forfatterne er oppriktig takknemlige overfor Dr. C. Li og C. Fitzsimmons for å gi alle fenotypiske registreringer av storfekjøtt. Tusen takk til X. Sun og F. Cox for deres hjelp til DNA/RNA -isolering og sekvensering av bibliotekskonstruksjon. Vi takker alle medlemmer fra Dr. L. L. Guans gruppe for hjelpen med prøvetaking.

Finansiering

Dette arbeidet ble støttet økonomisk av Alberta Livestock and Meat Agency (Edmonton, Canada) under tilskuddsnummer 2013R029R og 2015P008R. I tillegg ble FL og LLG også støttet av henholdsvis Alberta Innovates-Technology Futures Graduate Student Scholarship og NSERC Discovery Grant. CJC ble finansiert av forskningsrådet for bioteknologi og biologisk vitenskap, Storbritannia (BBSRC): BB/E/W/10964A01 og BBS/OS/GC/000011B. TCAH ble finansiert gjennom New Zealand -fondet for Global Partnerships in Livestock Emissions Research (GPLER).

Tilgjengelighet av data og materialer

Rumen metagenome, total-RNA-basert metatranscriptome og mRNA-beriket metatranscritpome sekvenser ble deponert i NCBI Sequence Read Archive (SRA) med tiltredelsesnummer PRJNA448333.


Resultater

Samfunnssammensetning av protistiske supergrupper

Totalt ble 32 808 SSU rRNA -transkripsjoner av protister hentet fra 12 jordmetatransskriptomer (tabell 1). I alle tilfeller ga de biologiske replikatene av hvert sted en veldig lik fellesskapssammensetning (figur 1) og grupperes sammen i en klyngeanalyse (figur 2). Alle de fem protistiske supergruppene ifølge Adl et al. (2012) ble funnet på hvert sted (tabell 1 figur 1). SAR -gruppen, bestående av de tidligere uavhengige supergruppene Stramenopiler, ENlveolata og Rhizaria, dominerte de aktive samfunnene på alle steder med sekvenser av Rhizaria som var flest. Vi observerte en klar dikotomi i protistisk samfunnssammensetning (figur 2) med dominans av Alveolata i torvjord med sin høye fuktighet og høye innhold av organisk materiale, kontra dominans av Rhizaria og Amoebozoa i gressletter og skogsmasser, inkludert skogstrø (figur 1).

Samfunnssammensetning av protistiske supergrupper i de undersøkte jordene. For detaljert informasjon om jordparametere, se tabell 1.

Uvektet Pair Group Method (UPGMA) klyngeanalyse for å evaluere forskjeller mellom jordprotistsamfunn. For detaljert informasjon om jordkarakteristikker og forkortelser, se tabell 1.

Rhizaria besto nesten utelukkende av Cercozoa (figur 3a) med dominans av rRNA for de små flagellatene som tilhørte klassen Filosa-Sarcomonadea (tidligere kombinert i Cercomonadida) og begge, flaggede og amoebide Cercozoa i klassen Filosa-Imbricatea (tidligere Silicofilosea) . Foraminiferan SSU rRNA forekom i relativt konstante, om enn lave mengder i alle prøvene (figur 3a) bortsett fra torvstedet 'Knutsen', der de var mer utbredt og utgjorde 22% av alle Cercozoa. Alveolate SSU rRNAs var ganske varierende blant prøver og dominerte i torvjordene (figur 1) med phylum Ciliophora og dets viktigste ordrer Spirotrichea, Colpodea og Oligohymenophorea som var mest utbredt, mens den utelukkende parasittiske Apicomplexa fortsatt representerte opptil 11% av alle Alveolata ( Figur 3b). Den tredje gruppen i SAR, Stramenopiles, var mindre rikelig, med Oomycetes som representerte de dominerende stramenopilene i skogsjord (figur 3c), mens mange transkripsjoner av den fotosyntetiske Bacillariophyta var karakteristiske i de vannfylte torvjordene. Chrysophyceaen SSU rRNA ble funnet rikelig i gressletter og søppel, i likhet med transkripsjoner av Bicosoecida. Supergruppen Amoebozoa representerte opptil 30% av SSU rRNA, med høyeste mengder i prøvene på gressletter og skogsmonn (figur 1 og tabell 1). The other protist supergroups, that is, Excavata, Archaeplastida and Opisthokonta (excluding fungi and animals) were generally less abundant (Figure 1 and Table 1 see Supplementary Table 1 for more information).

Community composition within the SAR supergroup independently showing the community compositions within the individual clades of SAR, i.e., Rhizaria (en), Alveolata (b) and Stramenopiles (c). Shown are means of biological replicates. Labels and sites as described in Table 1 and Figures 1 and 2.

SSU rRNA transcripts of protist clades highly represented in cultivation-based approaches were analysed to evaluate whether these clades were also recovered in our metatranscriptomes. Among the clades targeted were flagellates of the supergroups SAR (Glissonomadida and Cercomonadida (Sarcomonadea Rhizaria), Chrysophyceae and Bicosoecida (Stramenopiles) and Excavata (Bodonidae and Euglenida), as well as amoebae in the supergroup Excavata (Heterolobosea). All clades were found at each location, with cercomonads being highly abundant in grassland and forest habitats. Glissomonads were abundant especially in grasslands (5% of all protists). Bodonids were also common (1.9% of all protists) whereas euglenids, chrysophytes, bicosoecids and heteroloboseans comprised only about 1% of all protist transcripts (Supplementary Table 1). Exhaustive analyses of the most abundant clades of amoebae are presented in the next section.

Community composition of amoebozoa

The supergroup Amoebozoa was of particular interest, as no comprehensive molecular taxonomic analysis of this protist supergroup in soil exists to date because of PCR-primer biases (Baldwin et al., 2013 Bates et al., 2013). For this purpose, we constructed a high-resolution reference database and taxonomy of Amoebozoa (see Table 2 and Materials and Methods for details). Using this taxonomic assignment approach, the rather short SSU rRNA sequence reads could reliably be classified at least to the order, often even to the genus level. Amoebozoa were highly diverse at each sampling site, with rRNAs assigned to four classes, that is, Tubulinea, Discosea, Variosea and Mycetozoa with major orders Euamoebida, Leptomyxida, Arcellinida and Centramoebida (Smirnov et al., 2011) (Figure 4). The community composition within Amoebozoa differed significantly between sites. For instance, sequences assigned to the dominant class Tubulinea made up between 27.4% and 69.2% in Solvatn peat and forest soils, respectively, and were inversely related to Discosea with 41.6–12.7% in Solvatn peat and forest soils. Similar to the patterns observed at the class level, the proportional distribution within classes differed between sites. Among Tubulinea, the dominant order Euamoebida reached highest relative abundances in grasslands and forest mineral soils, while testate amoebae of the order Arcellinida became more abundant in organic rich substrates of litter and peat soils, and Leptomyxida were characteristic of forest habitats. The remaining tubulinean orders Echinamoebida and Nolandida were generally rare. Among the class Discosea, SSU rRNAs assigned to the subclass Longamoebia were almost entirely (96.1%) composed of the order Centramoebida. Sequences of the discosean subclass Flabellinia were generally less abundant (7.0% oas) and mostly derived from the order Vannellida (50.1% of flabellinian SSU rRNAs). Sequences assigned to the subphylum Conosa could only reliably be assigned to the class level, as taxonomy and the phylogenetic affiliations, especially of protists in the class Variosea, are still largely unresolved (Adl et al., 2012). Variosea was the dominant conosan class in grassland, forest and the Solvatn peat soil, while Mycetozoa were more abundant in forest litter and Knutsen peat soil (Figure 4).

Community composition within the supergroup Amoebozoa in the investigated soils. Shown are means of biological replicates. Labels and sites as described in Table 1 and Figures 1 and 2.

Widespread were amoebozoan SSU rRNA sequences with high sequence identity to potential parasites. At all sites occurred diverse sequences related to facultative human pathogens of the genus Acanthamoeba ( ⩾ 97% sequence identity 1.1–4.4% oas) while sequences most closely resembling Balamuthia were discovered in low relative abundance (0.1–0.5% oas) in all except the grassland soils. Transcripts related to groups of non-Amoebozoan parasitic taxa were also found, such as sequences most closely resembling the human pathogen Naegleria fowleri (Heterolobosea in the supergroup Excavata ⩾ 97% sequence identity) in all four arctic peat samples. Further, opisthokonta Ichthyosporea (mainly animal parasites) were ubiquitously found (0.4–3.3% oas Supplementary Table 1) as well as predominantly plant-parasitic plasmodiophorans (up to 0.8% oas).

Widespread presence of foraminifera and choanoflagellida in soils

SSU rRNA transcripts of the typically marine groups Foraminifera and Choanoflagellida revealed their general presence and activity in all samples (Figure 5), and for the first time, allowed to estimate the relative abundance of these taxa in soils. They comprised between 0.1% and 3.5% of all protist SSU rRNAs.

SSU rRNA transcript abundance±s.d. of Foraminifera and Choanoflagellida in the soil metatranscriptomes. Labels and sites as described in Figure 2 and Table 1.

To enable better taxonomic assignment and phylogenetic placement of these enigmatic soil protist groups we, assembled larger SSU rRNA sequences from the short 454 reads. Three assembled SSU rRNA contigs of Foraminifera (742–890 bp length) were quite similar ( ⩾ 91%) to sequences obtained in a recent focused PCR-based molecular survey targeting soil Foraminifera (Lejzerowicz et al., 2010), but showed substantial sequence dissimilarity to described species (maximum SSU rRNA sequence identity of ≤76%). Several unassembled SSU rRNA sequences, however, closely matched sequences typically obtained from freshwater and marine environments, such as the genera Astrammina, Bathysiphon, Allogromia and diverse uncultured species (Supplementary Table 2).

Many Choanoflagellida-affiliated SSU rRNA sequences closely matched (with ⩾ 99% maximum identity) published sequences of uncultivated choanoflagellates (for example, with GenBank accession numbers HQ219439 (freshwater), EF024012 (soil), JF706236 and GQ330606 (peat soil)) while others reached similarities of >95% with uncultivated choanoflagellate sequences among typical freshwater and marine genera, such as Monosiga, Codonosiga, Salpingoeca, and more rarely with Lagenoeca, Stephanoeca, Didymoeca, Diaphanoeca, Desmarella og Acanthoeca. Five assembled long SSU rRNAs (763–1163 bp) had high sequence similarities of 96–99% to uncultivated freshwater choanoflagellates (Figure 6), but the closest hit to a formally described species was <92%.

Maximum likelihood tree of Choanoflagellida placing assembled long SSU rRNA contigs (red) with sequences of described and uncultivated choanoflagellates. Seventy-one sequences with 1232 unambiguously aligned positions were used the tree is unrooted values higher than 50 for maximum likelihood analyses (left) and 0.50 for Bayesian analyses (right) shown. Black circles indicate full support.


Forfatterinformasjon

Tilknytninger

Canadian Center for Computational Genomics, McGill University and Genome Quebec Innovation Center, Montréal, H3A 1A4, Canada

Department of Human Genetics, McGill University, Montreal, H3A 1B1, Canada

Institut de recherche en biologie végétale, University of Montreal, Montreal, QC, H1X 2B2, Canada

F. E. Pitre, J. Marleau, M. St-Arnaud, M. Labrecque, S. Joly & N. J. B. Brereton

Montreal Botanical Garden, Montreal, QC, H1X 2B2, Canada

F. E. Pitre, M. St-Arnaud, M. Labrecque & S. Joly

Aquatic and Crop Resource Development (ACRD), National Research Council Canada, Montréal, QC, H4P 2R2, Canada

Department of Agri-food and Environmental Science, University of Florence, Viale delle Idee, Sesto Fiorentino, FI, Italy

Institut National de la Recherche Scientifique, Centre INRS–Institut Armand-Frappier, Laval, QC, Canada

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Du kan også søke etter denne forfatteren i PubMed Google Scholar

Bidragene

EY, MSA, SJ, ML and FP conceived and designed the study. JM, WGN and AP performed the plant growth trials, sample and sequencing preparation. EG and NJBB analysed the data and drafted the manuscript. All authors commented on and approved the final manuscript.


Se videoen: Metatranscriptomics (August 2022).