
07月19 公共數據整合分析場(chǎng)景篇-大豆公共數據應用案例
大豆研究套餐: 整個(gè)多個(gè)大豆RNA-seq公共數據,分析SWEET基因家族在大豆生殖組織與營(yíng)養組織間表達變化規律
文章思路
Patil G. ?et al. Soybean (Glycine max) SWEET gene family: insights through comparative genomics, transcriptome profiling and whole genome re-sequence analysis. BMC Genomics. 2015
1. 大豆中SWEET基因鑒定
SWEET基因家族在植物體內的糖運輸、免疫及生殖組織發(fā)育過(guò)程中發(fā)揮著(zhù)非常重要的作用。研究者使用擬南芥、水稻中的SWEET家族基因序列,通過(guò)BLAST比對,鑒定到了大豆中的52個(gè)SWEET基因。 該步驟可非常方便的調用部署于百邁客云平臺上的BLAST小工具來(lái)完成。
2. 大豆中SWEET基因與其它物種的序列比較分析
為了了解不同物種中SWEET家族基因的進(jìn)化關(guān)系,研究者對大豆中的SWEET家族基因與其他13個(gè)物種(包括水稻、擬南芥、玉米在內)中的SWEET基因構建系統進(jìn)化樹(shù)。 該步驟可調用部署于百邁客云的MEGA小工具來(lái)完成。
3. 大豆中SWEET基因上游調控轉錄因子分析
研究者提取了52個(gè)轉錄因子的啟動(dòng)子序列,預測了這些啟動(dòng)子序列中存在的motif序列,并在轉錄因子數據庫中注釋到了可與上述motif序列結合的轉錄因子,這些數據為之后研究SWEET基因轉錄調控網(wǎng)絡(luò )提供了數據基礎。 該步驟中的motif序列提取可調用部署于百邁客云的motif_prediction小工具來(lái)完成。
百邁客云motif_prediction小工具運行結果
4. 大豆中SWEET基因不同組織中表達量變化規律分析
1)下載大豆RNA-seq公共數據集: 數據集1 SRA數據庫編號:PRJNA140081. 包含14個(gè)樣本,其中11個(gè)樣本為生殖組織來(lái) 源(花、豆莢、種子),3個(gè)為營(yíng)養組織來(lái)源(葉、根、根瘤) 數據集2 GEO數據庫編號: GSE29163. 包含10個(gè)樣本,其中6個(gè)樣本為生殖組織來(lái)源(花、花芽、種子),4個(gè)樣本為營(yíng)養組織來(lái)源(根、莖、葉、幼苗) 該步驟可進(jìn)入BMKCloud_數據庫模塊按數據編號完成數據檢索及一鍵保存,保存后的數據可直接調用百邁云平臺的分析模塊BMKCloud_APP進(jìn)行后續分析。
2)對大豆所有基因進(jìn)行轉錄了水平定量,并從中篩選SWEET基因家族,分析該家族基因在大豆的生殖組織與營(yíng)養組織見(jiàn)的表達量變化規律。 該步驟可直接將上步保存于百邁客云的公共數據導入BMKCloud_APP模塊中的 “有參轉錄組分析平臺”進(jìn)行分析,運行后便可得到文章所需的結果。
分析結果:
1)GmSWEET21、GmSWEET24在所有樣本中均高表達
2)有23個(gè)SWEET基因在所有樣本轉錄水平非常低或者未檢測到,這些基因或許為假基因,或者需要再特殊組織特殊時(shí)期表達
3)其余的SWEET基因均在花或者種子等生殖相關(guān)組織中高表達,說(shuō)明SWEET基因在生殖相關(guān)組織發(fā)育過(guò)程中發(fā)揮重要作用,與之前的相關(guān)的研究結論一致。