您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > affy-marray
生物学验证和解释芯片实验实验设计图像处理数据归一化生物问题假设检验差异基因分类分析数据分析聚类分析失败通过数据处理:两种不同的芯片,不同的处理流程质量控制表达谱芯片数据的分析流程微阵列数据预处理微阵列数据预处理类软件包简介包名称功能简介affy提供了一组分析工具和交互环境,用于分析和注释探针水平的数据,这些数据是应用Affymetrix公司制造的寡核苷酸芯片的产生的affycomp提供了一组图形化工具,用来评价、分析Affy芯片数据的算法性能affydata这是一组Affy芯片数据,可用于举例说明Affy芯片数据的分析方法affypdnn采用探针依赖最近邻法(PDNN)处理Affy芯片数据,计算基因表达数据affyPLM用于分析Affy芯片数据的探针水平线性模型gcrma结合探针序列信息的背景校正和基因表达数据计算包makecdfenv根据Affy芯片描述文件创建相应的CDF环境annaffy面向Affy芯片marray用于双色荧光(cDNA)微阵列数据分析的工具包matchprobes用于微阵列探针序列的分析工具vsn用于微阵列数据的变异稳定和校准转换的包DNA微阵列•寡核苷酸微阵列-affymetrix公司-affypackage•cDNA微阵列-斯坦福大学-marraypackageAffy包简介affy芯片上每一条探针的荧光强度的检测数据称为探针水平的数据,对这些数据需要进行背景校正、归一化、PM探针值校正等处理,然后得到基因表达数据。Affy包提供了一系列的分析算法来实现这个分析过程,并提供了一组绘图函数,对芯片数据和分析结果进行可视化分析。更多信息可访问Affymetrix官网:。Affy包的使用•affy包用于分析affy芯片的探针水平数据,并计算样本的基因表达数据。•对于实验得到的芯片扫描图像,首先进行图像分割、探针点定位等分析。•cel文件:每个探针的荧光强度测量数据保存在后缀为.cel的文本文件中,一次试验得到一个cel文件。•cdf和txt文件:芯片描述文件(cdf文件)和实验描述文件(txt文件),用于分析和注释数据。•Affy包将针对探针水平数据的分析包括背景校正、数据归一化、PM校正和汇总探针集数据、计算基因表达数据等过程进行分装以方便用户使用。•实际应用中,要处理探针水平的数据,最快捷的方式是创建一个目录,把所有的实验数据文件复制到该目录下面,然后将该目录设置成R语言的工作目录setwd(),可用以下R语句实现。•library(affy)#加载affy包•data-ReadAffy()#读取工作目录中所有包含探针水平的数据的cel文件•eset-rma(data)#使用函数rma计算得到基因表达数据•write.exprs(eset,file=exprsdata.txt)#结果保存于“exprsdata.txt”优点:能快速处理探针水平数据得到基因表达数据。不足:没有对原始数据的质量进行评价,也没有针对具体的数据选择最佳的分析方法,也许会导致不合理的分析结果。Affy芯片数据的具体分析流程•1.读取实验数据及相关的实验描述和芯片信息•2.质量控制(画图观察)•3.归一化探针水平的数据并计算基因表达数据•4.将分析结果保存到文件中,可以是特定字符分隔的文本文件,也可以是excelAffy的类1.AffyBatch描述用于表示affy芯片数据的类,可以包含具有相同cdf的一批样本数据,是类exprset的扩展。通过函数read.affybatch和readaffy可以创建类的对象。slotscdfname:character类对象,表示芯片对应的cdf文件名称nrow:numeric类对象,表示芯片的物理行数ncol:numuric类对象,表示芯片的物理列数exprs:matrix类对象,基因表达数据的矩阵,每行表示一个探针集(基因),每列表示一个样本Se.exprs:matrix类对象,与exprs相同大小的矩阵,表示每个基因表达数据的标准差phenoData:phenoData类对象,表示样本信息,列表示变量,行表示样本Annotation:character类对象,表示注释信息Description:MIAME类对象,表示实验描述信息Notes:character类对象,表示备注信息方法对各slots的赋值和方位,以及对数据的作图和分析2.probeset描述表示来自一个或多个样本的探针集的PM和MM探针数据slotsId:character类对象,表示探针集IDPm:matrix类对象,包含PM探针的数据,行表示探针,列表示样本Mm:matrix类对象,包含mm探针的数据,行表示探针,列表示样本方法获取样本名称、列名、汇总探针集数据的算法Affy的一些基本函数•1.数据的获取和转换•Read.affybatch、ReadAffy读取cel文件保存的芯片数据,创建AffyBatch类对象。•read.probematrix读取CEL文件中的数据并保存到矩阵对象中。•just.rma、justRMA读取cel文件,并使用RMA方法计算基因表达数据。•cdfFromBioc,cdfFromData,cdfFromLibPath,cdfFromEnvironment的功能都是从不同的来源获取CDF文件并产生CDF环境。•cleancdfname功能是将Affymetrix的CDF文件名称转化为注释包和Bioconductor中使用的名称,用小写字母表示且只包括字母和数字。•xy2indices,indices2xy可以转换探针的索引值和x-y坐标。•merge.AffyBatch合并两个AffyBatch类的对象为一个对象。2.数据分析方法•ComputeExprSet处理探针水平的数据,计算基因表达数据,返回exprSet类的对象。•expresso处理探针水平的数据,计算基因表达数据。•rma,justRMA使用RMA(robustmulti-arrayaverage)方法计算基因表达数据。基因表达数据以log2形式给出。•mas5函数使用Affymetrix’s5.0方法计算基因表达数据。3.作图•barplot.ProbeSet以条状图的方式显示探针集中各探针数据的分布•Mbox,Maplot,ma.plot可以创建M或者M-A的盒图。•plot.ProbeSet对一组探针数据作图。•plotDensity,plotDensity.AffyBatch对非参数化的探针水平数据的估计值作图,估计值保存在矩阵的每列中。•PlotLocation可以在已有的cel图像中做出定位标记以标记出探针在芯片中的物理位置。•mva.pairs可以产生M-A图形矩阵,M-A图在矩阵的上三角,Ms的IQR显示在下三角。不同方法得到的基因表达数据的皮尔森相关系数的计算marray包简介•marray包用于cDNA微阵列数据的诊断性作图和归一化处理,是Biocoductor中的重要组成部分。•主要功能包括三部分:cDNA微阵列数据的读取,通过简单的作图来评价数据质量,对数据进行归一化处理。•marray包中有swirl数据,可以在举例时使用。swirl数据是斑马鱼实验的一部分数据。marray包的基本用法1.微阵列数据和相关信息的读取。2.质量控制3.微阵列数据的归一化处理,marray包中推荐使用探针针尖组loess归一化方法。4.诊断性作图,可视化微阵列数据marray的类1.marrayInfo描述用于保存靶样本与一批微阵列杂交的信息及微阵列上的探针信息等slotsmaLabels:character类对象,微阵列上的探针点描述向量或者微阵列编号向量maInfo:data.frame类对象,如果用marrayInfo类的对象描述与微阵列杂交的靶样本,则maInfo的行对应于微阵列,列对应于不同的杂交实验描述,如cy3,cy5样本的名称,微阵列的名称标签等。maNotes:character类对象,关于靶样本或者对点样探针的注释方法包括对slots的赋值和访问,显示对象内容等。2.marrayLayout描述用于保存双色cDNA微阵列的重要布局参数slotsmaNgr:numeric类对象,栅格矩阵的行数maNgc:numeric类对象,栅格矩阵的行数maNsr:numeric类对象,点矩阵的行数maNscnumeric类对象,点矩阵的列数maNspots:numeric类对象,微阵列上的点的总数。等于前4者的乘积。maSub:logical类对象,指示当前考虑哪些探针点,被选择的标记为TRUE。否则反之maPlate:factor类对象,记录微阵列探针点序列的多孔板来源maControls:factor类对象,记录微阵列上探针点的控制探针状况maNotes:character类对象,关于微阵列布局的任何注解,如打印环境。方法包括对slots的赋值和访问,显示对象内容等。3.marrayRaw描述描述一批cDNA微阵列实验归一化之前的荧光强度数据slotsmaRf:matrix类对象,红通道前景值,行对应于探针,列对应于微阵列maGf:matrix类对象,绿通道前景值,行对应于探针,列对应于微阵列maRb:matrix类对象,红通道背景值,行对应于探针,列对应于微阵列maGb:matrix类对象,绿通道背景值,行对应于探针,列对应于微阵列maW:matrix类对象,每一个探针点的质量权重,行对应于探针,列对应于微阵列maLayout:marrayLayout类对象,DNA微阵列的布局参数maGnames:marrayInfo类对象,探针的描述信息maTargets:marrayInfo类对象,与微阵列杂交的靶样本的描述信息maNotes:character类对象,关于微阵列实验的任何注解,如杂交环境或扫描环境方法包括对slots的赋值和访问,计算M,A,LG,LR的值,显示对象内容等。4.marrayNorm描述描述一批cDNA微阵列实验的归一化后的数据slotsmaA:matrix类对象,A值(以2为底的对数化强度值的平均值),行对应于探针,列对应于微阵列maM:matrix类对象,M值(以2为底的比率对数值),行对应于探针,列对应于微阵列maMloc:matrix类对象,位置归一化值,行对应于探针,列对应于微阵列maMscale:matrix类对象,尺度归一化值,行对应于探针,列对应于微阵列maW:matrix类对象,每一个探针点的质量权重,行对应于探针,列对应于微阵列maLayout:marrayLayout类对象,cDNA微阵列的布局参数maGnames:marrayInfo类对象,探针的描述信息。maTargets:marrayInfo类对象,与微阵列杂交的靶样本的描述信息maNotes:character类对象,关于微阵列实验的任何注解,如杂交环境或扫描环境maNormCall:call类对象,微阵列归一化调用的函数方法包括对slots的赋值和访问,计算M,A,LG,LR的值,显示对象内容等。marray的基本函数•1.获取数据•read.marrayInfo从文件中读取信息,并将靶样本和杂交实验的信息或者探针序列信息保存在marrayInfo类的对象中。•read.Galfile函数读取包含基因信息的标准Gal文件。•read.marrayLayout为从文件中读取微阵列的布局参数。•read.marrayRaw读取cDNA微阵列数据。•findID函数从基因名称或ID值中检索geneID。2.微阵列数据的归一化•maNorm调用函数maNormMain对微阵列数据marrayRaw进行简单的位置和尺度归一化,返回类marrayNorm类的对象。•maNormmain函数用于cDNA微阵列数据的位置和尺度归一化。•maNormScale是一个简化的封装函数,调用归一化函数maNormMain,使得用户可以从一组基本的尺度归一化
本文标题:affy-marray
链接地址:https://www.777doc.com/doc-2896466 .html