ssGSEA(single sample GSEA)主要針對單樣本無法做GSEA而提出的一種實(shí)現(xiàn)方法,原理上與GSEA是類似的。ssGSEA根據(jù)表達(dá)譜文件計算每個基因的rank值,再進(jìn)行后續(xù)的統(tǒng)計分析。通過這個方法,我們可以得到每個樣本的免疫細(xì)胞或者免疫功能,免疫通路的活性,然后根據(jù)免疫活性進(jìn)行分組。
ssGSEA量化免疫細(xì)胞浸潤**的一個優(yōu)點(diǎn)就是自己可以定制量化免疫浸潤細(xì)胞種類。目前公認(rèn)并且用的**多的免疫細(xì)胞marker就是2013年發(fā)表在Immunity上的SpatiotemporalDynamicsof IntratumoralImmuneCellsReveal the Immune Landscape in Human Cancer 所提供的免疫細(xì)胞marker genes(Table S1),能提取到24種免疫細(xì)胞信息。 參考國內(nèi)外數(shù)據(jù)資源,根據(jù)需求制定構(gòu)建方案。遼寧組學(xué)實(shí)驗(yàn)數(shù)據(jù)科學(xué)共同合作
GeneBodyProfile(對比不同的樣品在某一區(qū)域的信號特征,不**于ChIP-seq、DNase-seq、ATAC-seq數(shù)據(jù)):GeneBodyProfile表觀遺傳修飾和對基因表達(dá)、細(xì)胞發(fā)育等過程有著深遠(yuǎn)的影響,但相關(guān)的研究還未完善。通過對比不同的樣品在某一區(qū)域的信號特征,了解不同情況下該基因的表觀遺傳情況,幫助更好的了解其發(fā)***展過程。一般應(yīng)用場景:觀察相關(guān)基因轉(zhuǎn)錄起始位點(diǎn)(TSS)、轉(zhuǎn)錄終止位點(diǎn)(TTS)、genebody以及兩側(cè)信號特征;觀察某一功能區(qū)域(CpGi、TSS、TTS、peaksummits或enhancer區(qū))及其兩側(cè)信號特征。數(shù)據(jù)要求:ChIP-seq、DNase-seq或ATAC-seq數(shù)據(jù)。下游分析:基于展示的基因或功能情況1.補(bǔ)充展示部分的已有相關(guān)研究2.解釋展示部分對研究課題的意義。 重慶算法還原與開發(fā)數(shù)據(jù)科學(xué)方案基因富集分析是在一組基因中找到具有一定基因功能特征和生物過程的基因集的分析方法。
sankey
桑基圖(sankey)是一種數(shù)據(jù)流圖,每條邊**一條數(shù)據(jù)流,寬度**數(shù)據(jù)流的大小。一套數(shù)據(jù)集可能有多重屬性,每層屬性之間有交叉,就可以用這種圖來展示。一般應(yīng)用場景:分組與基因?yàn)槎鄬Χ嚓P(guān)系,展示高頻突變基因所處的分組;miRNA和靶基因的關(guān)系;人群按性別、年齡、家族史等特征分組,展示不同分組得**的規(guī)律。
數(shù)據(jù)要求:
多個分組及其關(guān)系,包括且不限于基因表達(dá)、突變。
下游分析:
1. 補(bǔ)充展示部分的已有相關(guān)研究
2. 解釋展示部分對研究課題的意義
術(shù)語解讀:
TME: Tumormicroenvironment
TMEscore: TMEsignature score(使用PCA算法計算得到,高意味著對病毒和干擾素免疫***和應(yīng)答敏感。)
PCA:Principal component analysis
CIBERSORT:Cell type identification by estimating relative subset of known RNA transcripts
CYT:Cytolytic activity
EMT:Epithelial-mesenchymal-transition
CR: Completeresponse
PR: Partialresponse
PD:Progressive disease
TMB: Tumormutational burden
數(shù)據(jù)要求:
各細(xì)胞之間的相關(guān)關(guān)系、pvalue、聚類/分類結(jié)果、跟預(yù)后的關(guān)系表。 蛋白組代謝組個性化分析。
bubbles(不同分組的基因表達(dá)或通路富集展示):Bubbles可以同時展示pvalue和表達(dá)量。例如展示motif的pvalue和motif對應(yīng)的轉(zhuǎn)錄因子的表達(dá)量,方便快速看出轉(zhuǎn)錄因子富集且高表達(dá)所在的group,預(yù)示著該分組對細(xì)胞狀態(tài)的改變(例如細(xì)胞分化、轉(zhuǎn)移、應(yīng)激)起關(guān)鍵調(diào)控作用;例如做基因功能富集分析時,展示富集的通路qvalue和基因數(shù)量或geneRatio。
基本原理:
Bubbles的實(shí)質(zhì)是分組數(shù)據(jù)下基因表達(dá)量或通路內(nèi)基因數(shù)量的可視化,同時可以展示pvalue。
數(shù)據(jù)要求:
表達(dá)矩陣,分組 與復(fù)旦大學(xué)問附屬醫(yī)院合作,開發(fā)人血液外泌體中RNA的數(shù)據(jù)庫。上海診療軟件開發(fā)數(shù)據(jù)科學(xué)歡迎咨詢
生存曲線分隔,在展示基因表達(dá)水平對生存期的影響時找到分組。遼寧組學(xué)實(shí)驗(yàn)數(shù)據(jù)科學(xué)共同合作
不同分組的全基因組拷貝數(shù)變化的比較:**初目的:不同分組的拷貝數(shù)變異在染色體水平和染色體臂水平的展示和比較。應(yīng)用:不同分組的全基因組拷貝數(shù)變化的比較,展示genome-wideDNAcopy-numberprofiles。不同染色體臂的變異與臨床表型息息相關(guān)。輸入數(shù)據(jù)格式:一個表征每個樣本的染色體變異(gain,balance,loss)的數(shù)值矩陣和樣本分組信息?;蛘呖截悢?shù)的原始結(jié)果,可處理成所需矩陣。參考文獻(xiàn):(2)::本文計算出病人的拷貝數(shù)變異情況后,按照之前病人的分組比較了不同分組的染色體變異的異同,找到特定的染色體變異模式。確定了各組的特征,如lmonosomy2inPFB2,monosomy8inPFB3,monosomy3inPFB1,andgainof1qinPFB1.。 遼寧組學(xué)實(shí)驗(yàn)數(shù)據(jù)科學(xué)共同合作