A tengervízből származó mikrobiális közösségek vizsgálata kulcsfontosságú a tengerbiológiai kutatásokban. Ebben a cikkben részletesen bemutatjuk a Gulf of Maine térségében végzett tengervíz mintavétel és az azt követő egysejt genomikai elemzés lépéseit, beleértve a minták gyűjtését, tárolását, DNS amplifikációját, egyedi barcodingot, valamint a bioinformatikai feldolgozást.
1. Mintagyűjtés és tárolás Boothbay Harborban
2022. április 18-án Boothbay Harbor (Maine, 43.84° É, 69.64° K) partjainál 1 méter mélységből vettünk tengervíz mintát Niskin palack segítségével. A mintavételt követően azonnal több 1 ml-es almmintát cryovial csövekbe helyeztünk át, amelyekhez végső koncentrációban 5% glicerolt és 1× pH 8-as TRIS-EDTA pufferoldatot adtunk hozzá. Ezeket a mintákat −80 °C-on tároltuk, melyeket a továbbiakban „kryoprezervált” mintáknak nevezünk.
2. Minták kapszulázása és SPC-k előállítása
A kryoprezervált tengervízmintákból Single Particle Compartments (SPC-k) készültek az Atrandi Biosciences FLUX SPC generátorával (CHP-SPC1) és a hozzá tartozó reagens készlettel (CKP-G34). A Working Core Solution (WCS) és Working Shell Solution (WSS) oldatokat a gyártó utasításai szerint állítottuk elő, kivéve a dithiothreitol kizárását.
Minden egyes csatornában 37,5 µl hígított tengervizet kevertünk össze 50 µl Core Reagent-tel és 12,5 µl fotoiniciátorral. Az encapsuláció előtt az összes mintát átszűrtük 40 µm-es cellaszűrőn (Becton Dickinson), majd sterilizált, UV-sugárzott Sargasso-tengeri vízzel hígítottuk úgy, hogy az SPC-k foglaltsága 2–3% legyen. Ez azt jelenti, hogy az elfoglalt SPC-k 1–1,5%-a tartalmazott több DNS-partikulát.
Az encapsuláció után az emulziót 2 ml-es mikrocentrifuga csőbe helyeztük át, majd az olajfázist pipettával eltávolítottuk. Az SPC-ket az emulziót bontó oldattal izoláltuk ki, majd molekuláris tisztaságú vízben szuszpendáltuk.
3. Alkáli lízis és DNS amplifikáció SPC-kben
Az alkáli lízist és DNS amplifikációt a WGA-X protokoll szerint végeztük el. Az SPC-ket 0,4 M KOH, 10 mM EDTA és 100 mM dithiothreitol oldattal kezeltük 10 percig 20 °C-on, majd semlegesítettük és pufferoldatra cseréltük.
A WGA-X reakciók tartalmazták az Equiphi29 polimerázt (0,2 U/μl), reakcióbuffert, dNTP-ket (0,4 mM), dithiothreitolt (10 mM) és véletlenszerű heptamereket foszforotioát kötésekkel a végén (40 μM). Az amplifikációs lépés 45 °C-on zajlott egy órán át, majd inaktiváltuk 75 °C-on 15 percig.
Az amplifikált SPC-ket háromszor mostuk mosóoldattal, majd SYTO-9 festékkel jelöltük meg a DNS jelenlétének igazolására epifluoreszcens mikroszkóp alatt. Az egyes SPC-kben amplifikált DNS-t környezeti mikro-kompartment egyedi amplifikált genomoknak (emSAGs) nevezzük.
4. Kontrollminták: Escherichia coli kultúra feldolgozása
Az Escherichia coli K12 DH1 axenikus kultúráját autoklávozott LB közegben tenyésztettük éjszakára. A kultúra almmintáit ugyanolyan módon cryoprezerváltuk és dolgoztuk fel SPC-k előállítására és DNS amplifikációra. Az E. coli DNS-t tartalmazó SPC-ket ~1:10 arányban kevertük tengervízből származó emSAG-ekkel a munkafolyamat értékelése érdekében.
5. Negatív kontroll: UV-sugárzott deionizált víz
A negatív kontrollként használt UV-sugárzott deionizált vízmintából előállított SPC-k nem mutattak DNS amplifikációt, így kizártuk a laboratóriumi szennyeződés lehetőségét.
6. Kombinatív barcoding és könyvtárkészítés
A WGA termékek kombinatorikus barcodingját az Atrandi Biosciences Single-Microbe DNA Barcoding készletével végeztük el. Körülbelül 150 μl post-WGA-X SPC-t dolgoztunk fel (~6000 SPC), amelyeket DNS debranchinggel és vég-előkészítéssel A-végződésű kettős szálú DNS fragmentumokká alakítottunk.
A barcoding négy lépcsős ligációs split-and-pool folyamat során történt meg, amely összesen 331 776 egyedi barcode variánst eredményezett. A barcoded emSAG-eket felszabadítottuk az SPC-kből Release Reagent segítségével, majd Ampure XP mágneses gyöngyökkel tisztítottuk.
A következő generációs szekvenálási könyvtárakat NEB Next Ultra II FS DNA Library Prep Kit segítségével állítottuk elő Illumina platformra optimalizálva Unique Dual Indexing PCR primerekkel.
7. Szekvenálás és adatfeldolgozás
A könyvtárakat Illumina NextSeq 2000 platformon szekvenáltuk High Output P3 kit használatával (151 bp páros vég olvasatokkal). Az olvasatok demultiplexálása két lépcsőben történt: először bcl2fastq2 szoftverrel az Illumina indexek alapján; másodszor Pheniqs szoftverrel az Atrandi barcode-ok alapján.
A demultiplexálás során szigorú küszöbértékeket alkalmaztunk a hamis barcode kombinációk kizárására (≥4/1 millió olvasat), valamint minimális eltérés engedélyezésével (≤1 mismatch). Korábbi kézikönyvi hibát javítottunk ki az indexelő primerek kompatibilitásában, így >90%-os olvashatóságot értünk el cellabarcode-ok esetén.
8. Olvasatok minőségellenőrzése és vágása
Kétlépcsős vágást alkalmaztunk: elsőként Trim Galore! programmal eltávolítottuk az Atrandi barcode-okat; ezt követte Trimmomatic használata adapterek eltávolítására és minőség alapú vágásra. Csak páros olvasatok maradtak meg legalább 36 bp hosszúságban.
9. DNS-tartalmú részecskék kvantifikálása
- Áramlási citometria: Prokarióta sejtek száma a tengervízmintában: 1,84 × 106/ml; E. coli kultúrában: 3,50 × 108/ml.
- Vírus-szerű részecskék: Áramlási citometriával mért vírus-szerű részecskék száma: 1,75 × 107/ml.
- EMCG-alapú becslés: A nyers tengervíz térfogata egy átlagos SPC-ben ~1,06 pl; ebből számítva a DNS-tartalmú részecskék száma ~2,04 × 107/ml volt.
- Prokarióta sejtek becslése: ~1,93 × 106/ml; vírus-szerű részecskék becslése: ~1,79 × 107/ml.
- Tengervíz térfogata SPC-kben: A vizsgált SPC-k által lefedett tengervíz térfogata kb. 289 nl volt.
10. Fluoreszcencia-aktivált sejtszeparálás (FACS) és további feldolgozás
A prokarióta sejtek (cSAG-ok) és vírus-szerű részecskék (vSAG-ok) elkülönítését BD InFlux Mariner áramlási citométerrel végeztük SYTO-9 illetve SYBRGreen festékkel jelölve őket hideg inkubáció után.
A szeparálás során „single-1 drop” módot alkalmaztunk maximális tisztaság érdekében; a kiválasztott részecskéket egyenként helyeztük el mikroplate-ek jóljeibe TE pufferrel töltve −80 °C-on történő tárolásig.
Lízishez két fagyasztás–olvasztás ciklust alkalmaztunk KOH/EDTA/dithiothreitol lizoszómmal kiegészítve; ezt követte teljes genom amplifikáció WGA-X protokoll szerint HEPA-szűrt környezetben robotizált folyamatokkal minimalizálva a kontaminációt.
11. Genomikus könyvtárkészítés és szekvenálás cSAG-ok esetén
Nextera XT reagensekkel készítettünk könyvtárakat Illumina NextSeq platformra; tisztítási lépések QIAGEN oszlopos kit-ekkel történtek; méretválasztást BluePippin rendszerrel végeztünk (~500 ±50 bp célméret).
12. SAG-ek de novo összeállítása és minőségellenőrzése
A demultiplexált olvasatokat Trimmomatic segítségével vágtuk meg minőség szerint; eltávolítottuk az emberi genomhoz illeszkedő vagy reagens kontaminánsokat tartalmazó olvasatokat is.
Ezt követően digitális normalizálást végeztünk kmernorm programmal majd SPAdes assemblerrel állítottuk össze a genomokat gondosan beállított paraméterekkel. Csak legalább 2000 bp hosszúságú kontigokat tartottunk meg.
Minden SAG-et CheckM programmal értékeltünk genom teljesség szempontjából; taxonómiai besorolást GTDB-Tk segítségével végeztünk; valamint BLAST-alapú rRNA génazonosítást is elvégeztünk SILVA adatbázis alapján.
13. Barcoding pontosságának ellenőrzése E.coli spike-innel
A barcoding pontosságát E.coli spike-in kontrollal validáltuk: kevesebb mint 1% volt az emSAG-ek között az olyan esetek aránya ahol több SPC-ből származó DNS került összekeveredésre – ez megerősíti a magas hűséget mind laboratóriumi mind bioinformatikai lépésekben.
14. Genom annotáció és entitás besorolás
- Génazonosítás: Prodigal programmal hívtuk ki a géneket különböző genetikai kódok figyelembevételével;
- Családba sorolás: EggNOG adatbázissal HMM keresések alapján;
- Vírusdetektálás: VirSorter2 és DeepVirFinder eszközökkel;
- SAG besorolás: „celluláris”, „vírus-szerű” vagy „nem meghatározott” kategóriákba;
- Bakteriofág fertőzés kimutatása: legalább egy >10 kbp hosszúságú vírus kontig jelenléte cell-like SAG-ben;
- Kvalitásellenőrzés: CheckV programmal vírus jellegű SAG-ek esetén;
- Szekvencia taxonómia: INPHARED adatbázissal BLAST alapú összevetés;
- Klaszterezés: vContact2 segítségével genus vagy alfaj szintű besorolás vírusokra.
15. Vírus metagenomika – koncentrálás és szekvenálás
A tengervízmintából (~40 l) vírusok koncentrálását tangenciális áramlásos filtrációval végeztük (~30 000× koncentráció), majd ultrafiltráción keresztül tovább sűrítettük (~250 ml-ről ~1,5 ml-re). A DNS-t tisztítottuk Genomic DNA Clean and Concentrator készlettel.
Könyvtárkészítés Nextera XT reagensekkel történt Illumina NextSeq platformra optimalizálva; minőségellenőrzést Trimmomatic programmal végeztünk; emberi eredetű vagy alacsony komplexitású olvasatokat eltávolítottunk;
A metagenomikus olvasatokból metaSPAdes assemblerrel állítottunk össze kontigokat (>1000 bp), amelyeket VirSorter2-vel DeepVirFinder-rel és CheckV-vel vírus jelleg szerint értékeltünk.
16. Vírus fajok klaszterezése (vOTU), genom összevetések és olvasat leképezés
- Klaszterezést ≥95% ANI küszöb alapján végeztünk ≥85% lefedettség mellett;
- Páros összevetések BLASTn segítségével;
- MUMmer4 programmal vizualizáltunk genom összevetéseket;
- BWA mem-mel leképeztük metagenomikus olvasatokat genomokra ≥95% azonossági küszöbbel;
- A vOTU relatív abundanciáját olvasatszám/genom hossz arányával határoztuk meg;
- Pozíciós lefedettséget samtools depth parancs segítségével elemeztük.
17. Naomiviridae család elemzése – gén annotációk és filogenetika
Noahvirus arc és PM1 genomi annotációkat GenBankból töltöttük le; OrthoFinder-rel kluszterezve vizsgáltuk kulcsfontosságú géneket (citidin-deamináz, DNS polimeráz stb.). Emellett genoPlotR-rel ábrázoltuk génsorrendet R környezetben.
A hiányzó gének valószínűségét genom teljességi becslések alapján kalkuláltuk; DNA polimeráz diverzitást HMM profilokkal elemeztük IQ-TREE filogenetikai rekonstrukcióval támogatva ultrafast bootstrapokkal.
18. Ko-összeállítások létrehozása Naomiviridae emSAG-ekből
Minden tengeri emSAG kontigből közös de novo assembly készült Geneious Assembler-rel; két körkörös ko-összeállítás jött létre („Co-assembly A” és „Co-assembly B”), amelyek kizárólag VC1099 emSAG-ekből származtak – valószínűleg Naomiviridae genetikai anyagát képviselik.
Ezek funkcionális annotációját ugyanazzal az eljárással végeztük el mint emSAG-ek esetén; putatív gazdák meghatározását BLASTn összevetéssel végeztük korábbi tanulmányok celluláris SAG-jeivel.
19. Adatvizualizáció és statisztikai elemzés
- Pandas Python csomaggal kezeltük adatkereteket;
- dplyr, tidyverse R csomagokat használtunk adatmanipulációra;
- Kimutatásokat ggplot2-val készítettünk RStudio környezetben;
- Kendall korrelációs teszteket futtattunk cor.test függvénnyel;
- Páros t-próbákat stat_compare_means funkcióval végeztünk ggpubr csomagban.
Záró gondolatok
Ezen részletes módszertani leírás bemutatja a tengeri mikrobiómák vizsgálatához szükséges komplex laboratóriumi technikák teljes spektrumát – kezdve a mintavételtől egészen a bioinformatikai elemzésig –, amely alapot szolgáltathat további kutatásokhoz a tengerbiológia területén.