01月13 微生物分析平臺個(gè)性化分析更新
功能預測分析
基于樣品中的物種組成及豐度信息推測樣品中表型類(lèi)型和功能組成及差異。包含PICRUSt2功能預測、FAPROTAX功能預測、BugBase表型預測、Tax4Fun2功能預測和真菌FunGuild表型預測。
一. PICRUSt2功能預測
PICRUSt1軟件依賴(lài)于Greengene數據庫進(jìn)行物種比對、功能數據輸出。而Greengene數據庫在2013年之后就停止了更新,距今為止已有7年。隨著(zhù)時(shí)間的推移,大量微生物基因組數據測序獲得,而停止更新的Greengene數據庫限制了PICRUSt的功能預測范圍。對于近年來(lái)測序獲得微生物功能功能信息無(wú)法進(jìn)行預測,滿(mǎn)足不了當前的研究需求,為了補上這塊滿(mǎn)足科研工作者的需求,PICRUSt團隊于近期升級了軟件,正式公布了PICRUSt2。
1)將待預測的OTU代表序列置于軟件中已有的系統發(fā)育樹(shù)中,而不是直接對OTU序列進(jìn)行分類(lèi)學(xué)注釋?zhuān)?/p>
2)不再基于GreenGene 16S數據庫進(jìn)行功能預測,其用于預測的參考基因組數據庫相比先前也已擴大了10倍以上
參考文獻:Douglas G M, Maffei V J, Zaneveld J, et al. PICRUSt2: An improved and extensible approach for metagenome inference. bioRxiv, 2019.
功能組成分析:統計各樣品在不同分類(lèi)層級上的功能組成。
注:橫坐標為樣品名稱(chēng);縱坐標為功能相對豐度百分比。
功能差異分析:統計各樣品或者各組在不同分類(lèi)層級上的功能差異。
注:圖中不同顏色代表不同的樣品或分組。左圖所示為不同功能在兩個(gè)樣品或者兩組樣品中的豐度比例,中間所示為95%置信度區間內功能豐度的差異比例,最右邊的值為校正后p值。
二. FAPROTAX功能預測
FAPROTAX較適用于對環(huán)境樣本的生物地球化學(xué)循環(huán)過(guò)程(特別是碳、氫、氮、磷、硫等元素循環(huán))進(jìn)行功能注釋預測。FAPROTAX是根據已發(fā)表的文獻手動(dòng)構建的數據庫,它把原核微生物的分類(lèi)和代謝等功能對應起來(lái),目前收集自4600多個(gè)原核微生物的80多個(gè)功能分組7600多條功能注釋信息。
參考文獻:Louca S, Parfrey L W, Doebeli M. Decoupling function and taxonomy in the global ocean microbiome[J]. Science, 2016, 353(6305): 1272-1277.
三. BugBase表型預測
BugBase是一種預測復雜微生物組內功能途徑的生物水平覆蓋以及生物可解釋表型的方法。BugBase首先通過(guò)預測的16S拷貝數對OTU進(jìn)行歸一化,然后使用提供的預先計算的文件預測微生物表型。包括以下七方面:革蘭氏陽(yáng)性 (Gram Positive)、革蘭氏陰性 (Gram Negative)、生物膜形成 (Biofilm Forming)、致病潛力 (Pathogenic Potential)、移動(dòng)元件含量 (Mobile Element Containing)、氧的利用 (Oxygen Utilizing)、氧化脅迫耐受 (Oxidative Stress Tolerant)。
參考文獻:Ward T, Larson J, Meulemans J, Hillmann B, Lynch J, SidiropoulosD,Spear J, Caporaso G, Blekhman R, Knight R, Fink R, Knights D. 2017.BugBase predicts organism level microbiome phenotypes. bioRxiv.
四. Tax4Fun2功能預測
Tax4Fun全面升級為T(mén)ax4Fun2.評估微生物群落的功能和冗余度是環(huán)境微生物學(xué)的主要挑戰。Tax4Fun2可基于16S rRNA基因序列快速預測原核生物的功能譜和功能冗余。通過(guò)合并用戶(hù)定義的、特定于棲息地的基因組信息,可以顯著(zhù)提高預測功能圖譜的準確性。
優(yōu)點(diǎn):
(1)不再局限于僅SILVA的特定版本注釋的OTU豐度表,允許直接以OTU代表序列作為輸入,通過(guò)與指定參考數據庫的比對實(shí)現物種注釋。除了Tax4Fun2提供的已構建好的參考集(相比之前大幅擴大),也允許我們提供自定義的參考集,使用非常靈活。
(2)側重于原核數據,但也可以合并真核數據。
(3)提供了計算特定功能冗余的方法,對于預測特定功能在環(huán)境擾動(dòng)期間丟失的可能性至關(guān)重要。
(4)精度和穩定性顯著(zhù)提升。
參考文獻:Wemheuer F, Taylor J A, Daniel R, et al. Tax4Fun2: a R-based tool for the rapid prediction of habitat-specific functional profiles and functional redundancy based on 16S rRNA gene marker gene sequences. bioRxiv, 2018.
五. FunGuild表型預測
FUNGuild(Fungi Functional Guild)是一種可用于由生態(tài)協(xié)會(huì )分類(lèi)學(xué)解析真菌的工具,用簡(jiǎn)單而一致的方法將大型序列庫分類(lèi)為具有生態(tài)意義的類(lèi)別。根據營(yíng)養方式將真菌分為12類(lèi),然后構建了一個(gè)真菌分類(lèi)和功能分組(guild)之間的數據庫,通過(guò)這個(gè)數據庫你就可以對真菌進(jìn)行功能分類(lèi)。
病理營(yíng)養型(pathotroph):通過(guò)損害宿主細胞而獲取營(yíng)養(包括吞噬型真菌phagotrophs)。
共生營(yíng)養型(symbiotroph):通過(guò)與宿主細胞交換資源來(lái)獲取營(yíng)養。
腐生營(yíng)養型(saprotroph):通過(guò)降解死亡的宿主細胞來(lái)獲取營(yíng)養。包括動(dòng)物病原菌(animal pathogens)、叢枝菌根真菌(arbuscular mycorrhizal fungi)、外生菌根真菌(ectomycorrhizal fungi)、杜鵑花類(lèi)菌根真菌(ericoid mycorrhizal fungi)、葉內生真菌(foliar endophytes)、地衣寄生真菌(lichenicolous fungi)、地衣共生真菌(lichenized fungi)、菌寄生真菌(mycoparasites)、植物病原菌(plantpathogens)、未定義根內生真菌(undefined root endophytes)、未定義腐生真菌(undefined saprotrophs)和木質(zhì)腐生真菌(wood saprotrophs)。
參考文獻:Nguyen NH, Song Z, Bates ST, Branco, S, Tedersoo L, Menke J, Schilling JS, Kennedy PG. 2016. FUNGuild: an open annotation tool for parsing fungal community datasets by ecological guild. Fungal Ecology 20:241-248.
MicroPITA分析
在做完16S、18S或ITS等微生物多樣性研究后,我們常常還會(huì )想進(jìn)一步了解微生物群落的功能。通常情況下,會(huì )采用宏基因組、宏轉錄組或宏代謝組等方法深入分析,但相對于擴增子測序,宏基因組等測序手段的價(jià)格還是相對較高,因此需要從已測完的樣本中再挑選合適的樣本進(jìn)行宏基因組測序??衫胢icroPITA進(jìn)行樣品預測,挑選出合適的樣品。該分析是基于大量微生物多樣性的數據,根據不同指標篩選出代表性樣本,以便于開(kāi)展開(kāi)展后續研究。
類(lèi)型 | 方法 | 含義 | 樣本特點(diǎn) |
無(wú)監督方法 | diverse | 選擇α多樣性最高的樣本 | 生態(tài)多樣性高 |
features | 根據目標物種挑選樣本 | 針對特定物種 | |
extreme | 選擇β多樣性距離最遠的樣本 | 極端樣本 | |
representative | 最能反映整體距離差異的樣本 | 核心樣本 | |
有監督方法 | Distinct | 根據表型/分組特征,挑選組間β多樣性距離最大的樣本 | 依據表型/分組特征,選擇極端樣本 |
Discriminant | 根據表型/分組特征,挑選離分組中心最近的樣本 | 依據表型/分組特征,挑選核心樣本 |
參考文獻:Tickle TL, Segata N, Waldron L, Weingart U, Huttenhower C. Two-stage microbial community experimental design. ISME J. 2013 Dec;7(12):2330-9. doi: 10.1038/ismej.2013.139. Epub 2013 Aug 15. PMID: 23949665; PMCID: PMC3834858.
群落結構分析
微生物群落生態(tài)學(xué)的一個(gè)主要目標是了解構成跨時(shí)空物種豐度模式的過(guò)程。確定性和隨機性?xún)煞N類(lèi)型的過(guò)程會(huì )影響群落的聚集。確定性過(guò)程與生態(tài)選擇相關(guān),隨機過(guò)程包括不可預測的擾動(dòng)、概率性的散布和隨機的出生-死亡事件等,這些變化不是由環(huán)境決定的適應性結果。通過(guò)零模型量化群落的絕對系統發(fā)育距離與隨機系統發(fā)育距離的偏離度,偏離程度越大,群落受確定性因素的影響越大,偏離度越小,群落受隨機性因素的影響越大。通常使用βNTI(最近種間親緣關(guān)系指數)以評估不同時(shí)空尺度下隨機性和確定性過(guò)程對微生物群落組裝的影響。
其中,| βNTI |>2表示觀(guān)察到的兩個(gè)群落之間的更替主要由選擇控制,其中βNTI>+2與變量選擇一致,而βNTI<-2表示同質(zhì)選擇。因此,| βNTI |<2意味著(zhù)一組群落的更替受擴散限制、均勻化擴散或未消除過(guò)程的控制。為了理清這些過(guò)程,Raup-Crick矩陣(RCbray)基于群落的標準Bray-Curtis矩陣構建,提供有關(guān)所觀(guān)察到的流動(dòng)程度是否明顯偏離預期的信息。這個(gè)值等于觀(guān)測到的Bray-Curtis和零分布之間的偏差,范圍是-1到+1。| RCbray |<0.95可以解釋為終止過(guò)程的影響。反過(guò)來(lái),擴散限制加上漂移導致大于預期的周轉率(RCbray>+0.95),而RCbray<-0.95則表明群落組成的周轉率主要受均勻擴散控制。
參考文獻:Jizhong, Zhou, Daliang, et al. Stochastic Community Assembly: Does It Matter in Microbial Ecology[J]. Microbiology & Molecular Biology Reviews, 2017.