中心简介
中心科室
教师队伍
科研成果
技术转移
联系我们
English
 
首页» 科研动态»
 
本中心的免疫细胞基因表达数据库提供免费检索服务
发布日期:2015-03-19 浏览次数: 字号:[ ]

一、免疫细胞基因共表达数据库:ImmuCo 

网址:http://immuco.bjmu.edu.cn

 众所周知,蛋白质之间的相互作用、信号传递或共同参与的代谢过程无不以这些蛋白质之间的同时表达为前提。在mRNA水平,基因表达之间的线性相关性(包括正相关和负相关)往往提示基因之间存在某种功能上的联系,如共同参与同一信号通路或生理过程,蛋白质之间的相互作用,也可能是共同受制于第三者潜在的因素调控。所以,基因之间表达的相关性分析可为基因的功能、调节及相互影响从而为基因的功能研究提供非常有价值的线索。

ImmuCoImmune Co-expression and Correlation的缩写)是本中心构建的免疫细胞基因共表达相关性数据库,可为相关研究人员提供人、小鼠多种不同类型的免疫细胞(包括一些疾病状态下的免疫细胞)中任意两个基因之间共表达模式及相关性分析,有助于研究者发现潜在的、有价值的生物学信息。ImmuCo支持基因符号或别称(gene symbol or alias)、基因IDEntrez Gene ID)以及基因探针(probe set ID查询,提供超过2万个人、小鼠基因间的两两配对查询,提供超过8.6 × 108个(人)以及7.4 × 108个(小鼠)探针组合查询。ImmuCo的原始数据来源于8926张人以及3682张小鼠的基因芯片,通过质控和均一化处理后供基因共表达分析。通过ImmuCo可以实现如下功能:

1、人、小鼠基因之间的共表达以及相关性分析。基因表达的相互关系通过散点图来表示。ImmuCo既呈现正相关关系,也可反映负相关关系,例如ImmuCo轻易地反映出IL-4IL-13CD4+ T细胞中的表达呈强正相关(事实上其均为Th2型细胞因子),而FOXP3CD127的表达则负相关(随着FOXP3的表达升高,CD127的表达降低;CD127Treg的阴性标志分子)。通过Pearson相关系数反映相关性的程度。鉴于基因的共同表达并不意味着基因间存在显著的线性关联,ImmuCo同时提供了共存率(co-existence rate)以反映基因间在不同状态的免疫细胞中表达的共存关系(两者都表达,都不表达或其一表达)。对所检索的基因及免疫细胞,ImmuCo同时提供了最相关的20个探针组及其基因信息。

2、基因表达谱分析。ImmuCo能够非常直观地呈现基因在各种不同状态(实验处理、个体、病理状态等)时的表达情况及表达水平的差异。针对所查询数据提供了下载链接,用户可以轻易追溯到在何种状态基因极显著性的高表达或低表达。通过多次查询,可以获得不同基因的表达数据以进行深度分析。

3、探针质量及转录变异体等分析。一个基因往往对应多不同的探针组(probe set),反映不同的转录本或同一转录本不同的位置,也存在探针设计缺陷的可能。ImmuCo通过散点图中横纵坐标的表达值可以反映同一基因不同转录变异体的表达水平,以及探针是否存在质量方面的缺陷。

 

注意:

1)由于是基因共表达关系查询,所以需要同时输入任意两个基因的信息。如果只输入一个基因的信息,则另一个基因也可以采用默认方式。

2)用户根据下载的基因表达信号值可以在EXCEL自动生成类似的散点图,从而轻易追溯到各点对应的样本信息(可以通过GSM开头的样本编号进入Gene Expression Omnibus 数据库查询),包括可能的奇异点。

3)当一个基因有多个不同的探针组时,如果用户无法选择何种探针时,也可以参考ImmuSort数据库(http://immusort.bjmu.edu.cn/http://immu.tipsci.com/Account/)提供的各探针组强度来决定。

4)建议用户使用Internet Explorer 8.0及以上版本进行浏览。

5)更多信息请参见如下论文或ImmuCo网站的FAQ的帮助信息。

 

参考文献:

Wang P(王平章), Qi H, Song S, Li S, Huang N, Han W, Ma D. ImmuCo: a database of gene co-expression in immune cells. Nucleic Acids Res. 2015 Jan 28;43(Database issue):D1133-9.

 

 

二、免疫细胞基因表达及电子分选数据库:ImmuSort

网址:http://immusort.bjmu.edu.cn/ 或http://immu.tipsci.com/Account/

生物医学领域中由于一些高通量技术(如基因芯片、高通量测序等)的快速发展,导致DNARNA水平为主体的海量数据快速积累,同一种类的细胞或组织在不同状态下(实验处理、个体、病理状态等)的数据量也在迅速增长,而免疫相关的数据占了将近1/4。对这些生物学大数据进行综合和利用,对于以信息学为指导的基因功能挖掘与研究具有重要意义。基因的表达具有高度动态的特点,易受实验条件、个体、疾病状态等各种因素影响。尽管当前已有形形色色的基因表达数据库,但是由于组织和细胞来源极为有限,通常从组织或细胞出发得到有限的基因表达信息。

ImmuSort采用了一种新的数据呈现策略(即RBE曲线),能够适应海量数据增长的需要。ImmuSort另一显著特点是可以由基因的表达强度追溯到相应的细胞状态或实验条件,这一点可以弥补传统的数据库的不足,我们称之为电子分选(electronic sorting)。ImmuSort以细胞特异性的方式,将任一检索基因在成百上千种实验条件下表达水平及变化规律一览无余,并快速建立起基因表达与实验条件之间的关系,尤其是可以追寻基因在何种状态下倾向于高或低水平表达,这对于其生理功能的揭示更具有重要意义。

此外,ImmuSort首次采用一种基因可塑性评分(gene plasticity score,GPL score)的定量分析,结合marker评估评分(marker evaluation score,MES),对人、小鼠的编码基因在众多免疫细胞中作为marker分子的特性进行了量化描述,这对于寻找免疫细胞中高、低表达,以及适合作为阳性或阴性marker分子具有重要的指导意义。

ImmuSort的原始数据来源于10422张人及3929张小鼠的基因芯片,同ImmuCo数据库一样,其支持基因符号或别称(gene symbol or alias)或基因IDEntrez Gene ID),以及基因探针(probe set ID)查询,提供超过2万个人、小鼠基因,以及超过4万个探针组ID查询。通过ImmuSort可以实现如下功能:

1、基因表达谱分析。ImmuSort通过RBE(rank-based gene expression curve)曲线来呈现基因表达谱。ImmuSort数据库中将每张基因芯片的基因表达信号强度转换为rank score,其采用100分制即每张芯片中的基因(在探针组水平进行操作,下同)都会有一个rank score;然后根据一系列的基因芯片统计每个基因在每个rank score的百分率。所以,在RBE曲线中,横坐标表示rank score,纵坐标表示频率。通过RBE曲线,可以比较同一基因在不同免疫细胞,或不同的基因在同一免疫细胞中的表达变化情况。考虑到视觉效果,在ImmuSort当前版本中,RBE曲线不允许超过5条。ImmuSort提供的下载功能可以将均一化分析的基因表达数据下载到本地进行深度分析。此外,ImmuSort采用average rank score(ARS)用于描述基因表达的平均强度。

2、基因可塑性分析。基因可塑性是用于描述在一系列实验条件下基因表达水平发生改变的程度。ImmuSort采用可塑性评估得分(GPL score)对RBE曲线中基因在各种实验条件下表达强度发生变异的程度进行量化描述,其数值越大,表示伴随各种实验条件下基因表达水平发生改变的能力也就越大。在RBE曲线中,峰越宽泛表示基因的表达水平发生变异的程度越大,可塑性评估得分也就越高;相反,峰越窄则表示基因表达水平发生变异的程度越小,可塑性评估得分也就越低。在RBE曲线中,峰越往右,说明倾向于高表达;越往左,说明倾向于低表达。

3、Marker分子评估。Marker一词意味着同质性和稳定性,而可塑性则意味着异质性和变异。作为marker基因,不仅要求在各种实验条件下有相对稳性的表达,而且还需要与其他不各种实验条件下的细胞类别相区别。ImmuSort采用两个不同评分体系对基因的marker特性进行量化评估,即GPL score和MES;前者反映同一细胞内的变异,后者反映不同细胞类别之间的变异。MES的绝对数值越大,表示与其他类别的细胞之间差异越大,其为正值提示适合作为阳性marker,为负值则提示适合作为阴性marker。所以,当ARS越大,GPL score越小,MES越大时,越适合作为阳性marker;而ARS越小,GPL score越小,MES越小(绝对数值越大)时,越适合作为阴性marker。事实上,ARS和GPL score存在内在的联系(待发表)。

4、鉴于细胞或疾病状态下细胞特异性的基因或转录本。ImmuSort会依据样本的大小及时新增和调整免疫细胞分组的类别,这些类别可以根据细胞的组织来源、世系、发育成熟度或marker分子等来分类,也可以依据疾病状态或其他特定的实验条件来区分。同时,由于有了一套评估系统,使得鉴定细胞或疾病状态下细胞特异性的基因或转录本成为可能。

5、同一基因不同转录变异体表达谱的比较。一个基因往往对应多不同的探针组(probe set),反映不同的转录本或同一转录本不同的位置,也存在探针设计缺陷的可能。当同一基因不同的探针组的RBE曲线能够明显区分时,提示对应转录本在表达强度方面存在显著区别,也可能在探针质量方面存在问题。ImmuSort同时提供了探针质量评估的工具。

6、探针质量评估(略)。

7、电子分选。ImmuSort提供的特色功能之一是根据基因的表达强度去追溯与之对应的细胞实验条件。针对每个rank score,找出全部该rank score下的实验条件。

8、数据下载功能。ImmuSort提供了数据下载功能,下载的数据可以供深度数据挖掘和分析。所有的芯片数据都可以追溯到其原始记录。

ImmuCo及ImmuSort的数据集将及时更新,并逐渐拓展到非免疫细胞;同时,我们拟对其功能做进一步完善。欢迎国内外同道使用并提出宝贵意见。

       参考文献:

     Wang P (王平章), Yang Y, Han W, Ma D. ImmuSort, a database on gene plasticity and electronic sorting for immune cells. Sci Rep. 2015 May 19;5:10370. doi: 10.1038/srep10370.

 




打印本页 关闭窗口

版权所有:北京大学人类疾病基因研究中心      地址:北京市海淀区学院路38号 邮编:100191    电话: 010-82802846