咱們《生信技能樹(shù)》的B站有一個(gè)lncRNA數(shù)據(jù)分析實(shí)戰(zhàn),缺乏配套筆記,所以我們安排了100個(gè)lncRNA組裝案例文獻(xiàn)分享,以及這個(gè)流程會(huì)用到的100個(gè)軟件的實(shí)戰(zhàn)筆記教程!
標(biāo)題:The landscape of lncRNAs in Cydia pomonella provides insights into their signatures and potential roles in transcriptional regulation
標(biāo)題:蘋(píng)果小卷蛾中l(wèi)ncRNA的特征及l(fā)ncRNA在轉(zhuǎn)錄調(diào)節(jié)過(guò)程中的作用
雜志:BMC Genomics
通訊作者:Wei Fan,1 Fanghao Wan,1,2 Wanqiang 1
機(jī)構(gòu):1中國(guó)農(nóng)業(yè)科學(xué)院 深圳農(nóng)業(yè)基因組學(xué)研究所 深圳分院,廣東省嶺南現(xiàn)代農(nóng)業(yè)實(shí)驗(yàn)室,農(nóng)業(yè)部基因組分析實(shí)驗(yàn)室,深圳 ,2 中國(guó)農(nóng)業(yè)科學(xué)院 植物保護(hù)研究所 植物病蟲(chóng)害生物學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京
文章鏈接:doi: 10.1186/s12864-020-07313-3
發(fā)布時(shí)間:Published online 2021 Jan 5
摘要:蘋(píng)果小卷蛾(Cydia pomonella L.)是我國(guó)重要的入侵物種;然而,lncRNAs在這種昆蟲(chóng)中的功能影響尚不清楚。在這項(xiàng)研究中,基于公開(kāi)的RNA-seq數(shù)據(jù)集,構(gòu)建了一份蛾類(lèi)的lncRNAs圖譜。
共鑒定出9161個(gè)位點(diǎn)編碼的9875個(gè)lncRNA轉(zhuǎn)錄本。
正如預(yù)期的那樣,lncRNAs顯示出比蛋白編碼基因(PCGs)更短的轉(zhuǎn)錄本長(zhǎng)度,更低的GC含量和更低的表達(dá)水平。此外,與PCG相比,lncRNA更有可能表現(xiàn)出組織特異性的表達(dá)模式。此外,保守性分析表明,lncRNA序列在昆蟲(chóng)間的保守性很弱,但基于共線性可以識(shí)別出更多同源的lncRNAs,這表明共線性可能是一種更可靠的跨物種比較lncRNAs的方法。此外,lncRNAs與相鄰PCG的相關(guān)性分析表明,它們之間存在較強(qiáng)的相關(guān)性,表明這些lncRNAs在基因表達(dá)調(diào)控中具有潛在的順式作用。
該研究為lncRNAs的比較和功能研究提供了有價(jià)值的資源,這將有助于理解它們?cè)谵D(zhuǎn)錄調(diào)控中的機(jī)制作用。
關(guān)鍵詞:長(zhǎng)非編碼RNA,保守性,共線性,轉(zhuǎn)錄調(diào)控,蘋(píng)果小卷蛾
數(shù)據(jù):14個(gè)樣本(雌頭、雄頭、雌性中腸、雄性中腸、睪丸、卵巢、附腺) 各兩個(gè)生物重復(fù)的樣本;SRP083782(SRR4101328-SRR4101341)
2個(gè)沒(méi)有生物學(xué)重復(fù)的樣本(雄性和雌性觸角)SRP060413 (SRX1082030, SRX1082029)
5個(gè)不同發(fā)育期的樣本(2個(gè)胚胎期,幼蟲(chóng)期、蛹期、成蟲(chóng)期各1個(gè))SRP181710 (SRR8479435, SRR8479438,SRR8479439, SRR8479440, SRR8479441)
為了衡量每個(gè)基因的組織特異性水平,我們計(jì)算了JS散度分?jǐn)?shù),作為跨九個(gè)不同組織或五個(gè)發(fā)育階段的特異性指數(shù)。對(duì)于每組,我們計(jì)算所有重復(fù)的平均值,并計(jì)算JS得分。一般來(lái)說(shuō),JS評(píng)分范圍在0到1之間,值越大,表明基因的特異性越高。
為了避免受到表達(dá)量水平的干擾,編碼基因和LncRNA根據(jù)每個(gè)基因在9個(gè)樣本中的最大RPKM值被分為三組(低:RPKMmax<5.0;中等:5.0≤RPKMmax<50.0;PRKMmax≥5 0.0),并分別計(jì)算3組的JS評(píng)分。先前的一項(xiàng)基準(zhǔn)研究表明,tau指數(shù)是衡量基因表達(dá)的組織特異性的良好指標(biāo)。
To estimate the expression levels of PCGs and lncRNAs, HTSeq v0.10.0
與7個(gè)具有代表性的昆蟲(chóng)進(jìn)行比對(duì)。A. aegypti A. gambiae B. mori N. lugens P. xylostella A. mellifera D. melanogaster
Python pipeline https://github.com/Gabaldonlab/Synthenic-Families
比較了家蠶和蛾之間的lncRNA。
使用lncRNA上下游10kb的編碼基因的RPKM計(jì)算PCC。
GO q-values < 0.05
9875 個(gè)lncRNAs 9161 個(gè)位點(diǎn)。下圖A為鑒定 到的 lncRNA類(lèi)型。B是其他昆蟲(chóng)中l(wèi)ncRNA的鑒定情況,做了下比較。
在大多數(shù)物種中,基因間區(qū)的lncRNA占大多數(shù)。
睪丸、雌性觸角和附腺是表達(dá)最特異的lncRNAs的前三個(gè)組織。附腺和睪丸是特異性分?jǐn)?shù)最高的組織。相比之下,卵巢的特異性得分最低??偟膩?lái)說(shuō),,lncRNAs表現(xiàn)出比mRNAs更顯著的時(shí)空特異性表達(dá)模式。
lncRNA更加偏好雄性表達(dá)。這個(gè)差異分析比較容易復(fù)現(xiàn),基本上看我六年前的表達(dá)芯片的公共數(shù)據(jù)庫(kù)挖掘系列推文即可;
LncRNAs在昆蟲(chóng)物種間表現(xiàn)出很弱的序列保守性,特別是對(duì)于進(jìn)化距離較遠(yuǎn)的昆蟲(chóng)。
大量lncRNA的功能是未知的,但是它們主要是cis-regulators,所以可以根據(jù)它們臨近的蛋白編碼基因功能來(lái)近似推斷,然后表達(dá)量的相關(guān)性也可以類(lèi)推到。
根據(jù)位置關(guān)系推斷 使用bedtools等工具!
表達(dá)量的相關(guān)性, 比如雜志Cancer Medicine, 2020的文章《 Genome-wide DNA methylation analysis by MethylRad and the transcriptome profiles reveal the potential cancer-related lncRNAs in colon cancer》,在進(jìn)行結(jié)直腸癌相關(guān)lncRNA的功能富集分析,就是采用LncRN2Target v2.0和StarBase分析與15個(gè)lncRNA共表達(dá)的蛋白編碼基因,其中l(wèi)ncRNA HULC和ZNF667-AS1分別鑒定到28個(gè)、9個(gè)共表達(dá)的蛋白編碼基因!
大多數(shù)(6831,69.17%)的lncRNA具有相鄰的編碼基因。共有3199對(duì)LncRNA編碼基因(GP)的PCC絕對(duì)值>0.5,這些LncRNA代表了潛在的具有順式調(diào)控功能的候選基因。
大比例的lncRNAs與鄰近的PCG顯示出更強(qiáng)的相關(guān)性,并可能在基因表達(dá)的調(diào)控中發(fā)揮順式作用。
文末友情推薦
與十萬(wàn)人一起學(xué)生信,你值得擁有下面的學(xué)習(xí)班:
聯(lián)系客服