基因芯片 差异表达
基因芯片 差异表达
数据分析,芯片实验可对基因的表达进行度量,并最终用数学
和统计学的方法找出隐藏在基因表达数据下的生物信息,对基
因功能和生物学特性进行推测[1]。基因芯片实验技术日益成
熟,由其产生的基因表达数据不断扩大,尤其在近十几年内更
以指数形式增长,科学家们越来越重视探索和开发用以分析这
些数据的方法和工具。目前已有众多的方法用于大规模的基
因表达的数据挖掘,比如统计分析、聚类分析、自组织映射、时
间序列分析、神经网络、遗传算法等[2,3]。
本文将对基因芯片试验数据现有的基础分析方法做一个
相对综合的概括,并介绍一些新的分析方法。
1 表达数据的获取和标准化
杂交反应后的芯片通过芯片扫描仪,将荧光信号转化成可
计算的数字信息。在图像处理之后,有必要对每一个信道的相
对荧光强度进行标准化。标记物的差异、荧光标记检测效能的
差异以及样品RNA的原始浓度的差异所带来的系统误差,都
将在标准化中得到校正[4]。现有的