基本信息
编辑推荐
(1) 将JMP中的DOE实验设计作为书中一章,重点介绍各种实验设计方法的应用与不同,并补充了DOE中缺少的正交设计方法的应用;(2) 书中讲解的每种统计分析方法实例分析都运用SAS与JMP两款软件进行分析并比较两种软件统计输出内容的异同及使用方法上的优劣,方便读者比较和借鉴;(3) 书中重点介绍了SAS软件在多因素且存在交互作用的方差分析上的优势及结论判断依据,同时介绍协变量在协方差分析中的重要作用;(4) 在优选回归模型中重点介绍运用SAS软件所提供的多种回归方法进行多变量筛选、多变量的共线性诊断、优选*回归模型的判断准则。
内容简介
数学书籍
本书主要介绍JMP的DOE试验设计和SAS与JMP两个软件包的多元统计分析方法。全书重点在于用实例讲解运用SAS与JMP两个软件包中的各种统计分析方法,并详细解释输出结果的统计学意义,比较两个软件相同统计方法的优劣与输出内容的异同,方便学习者从多角度应用,能够举一反三,学会选用科学合理的技能判断并获取科学的、有价值的统计分析结果,提高效率。
全书共9章,第1章介绍SAS与JMP软件基本操作;第2章和第3章介绍常用描述统计量、数据分布、正态性检验、t检验与非参数检验等概念;第4章重点讲解JMP的DOE实验设计,包括: 定制设计、筛选设计、完全析因设计、响应面设计、田口设计,补充介绍正交设计;第5章结合第4章实验设计,注重从多角度讲解方差分析应用;第6章重点介绍回归分析的多变量筛选、曲线直线化回归、共线性诊断、非线性回归、Logistic回归及相关分析;第7~9章介绍聚类分析、主成分分析和因子分析。
本书可作为高校研究生、本科生的统计学教材,尤其适合非数理统计专业的研究人员作为数据分析的参考资料。
目录
第1章SAS及JMP系统概述1
1.1SAS及JMP系统简介1
1.2JMP系统界面操作2
1.2.1JMP安装、启动与退出2
1.2.2JMP系统设置及中英文切换2
1.2.3JMP与SAS数据文件管理4
1.2.4JMP功能简介7
1.3SAS系统概述及界面操作指南9
1.3.1SAS的启动与退出10
1.3.2修改SAS系统的SASV8.CFG11
1.3.3SAS系统主要窗口简介12
1.4SAS数据集及SAS的文件管理15
1.4.1SAS数据集、逻辑库及程序文件15
1.4.2建立并调用SAS数据集17
1.4.3导出SAS数据集为Excel文件22
1.4.4数据集排序24
1.5SAS的数据步与过程步简介24
1.5.1SAS程序书写规范和运行方法25
1.5.2利用DATA步对已有数据集扩增新变量26
书摘
本章学习目标
学习并掌握方差分析概念,进行方差分析的基本条件。
学习并掌握利用SAS和JMP进行单因素方差分析的方法,理解输出统计量的意义及判断依据。
学习并掌握利用SAS进行多因素方差分析的方法,理解方差分析输出统计量的意义及判断依据。
学习并掌握利用SAS进行协方差分析的方法,理解协方差分析输出统计量的意义及判断依据。
5.1方差分析简介[4/5]5.1.1方差分析基本概念方差分析是数理统计学中常用的数据分析方法之一,它是分析实验数据各因素各水平对某事物某指标的影响是否有显著差异的一种统计分析方法。根据实验考虑的因素个数及是否有协变量参与作用,可分为单因素、双因素、多因素方差分析及协方差分析。在方差分析中,经常把实验数据的总方差分解为由所考察因素引起的主因素方差、因素间的交互作用引起的交互因素方差和随机因素引起的随机误差方差。当影响因素是定性变量(一般称为分组变量或效应变量),观测结果是定量变量(一般称为结果变量或响应变量)时,常用的数据处理方法是: 假设响应变量均数或均值相等,从而检验响应变量受因素影响的效果是否有显著差异。
若只有一个效应变量(也称因素或因子),而且其水平数K=2,则称为单因素2水平方差分析,*常用t检验进行两两均值比较以检验对响应变量影响的效果是否产生显著差异。SAS系统的TTEST过程即可完全满足此类数据分析的需要。若实验中考虑单因素多水平,K>3,或考虑两个或两个以上因素且多水平时(k≥2),则称多因素多水平方差分析,通常用多重比较的F检验。SAS系统的ANOVA和GLM过程可完全满足多因素多水平的多重比较的需要。
F检验又叫方差齐性检验。从两个研究总体中随机抽取两组样本,要对这两组样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性,就要用F检验。F检验就是检验两组样本的方差是否有显著性差异,以确定它们的精密度是否存在差异,也就是确定两组数据之间是否存在系统误差。当不存在系统误差时,可进行t检验。正态性和方差齐性是进行方差分析的两个基本条件。
当不能满足方差齐性的条件时,至今尚未找到十分满意的处理方法,仅能采用非参数检验法进行简单分析。尽管如此,由于方差分析适用的范围比较广泛,所以,它在假设检验中起到了举足轻重的作用。因此,弄清方差分析的基本思想,有助于读者尽快学会如何用方差分析法处理各种实验设计方案下的实验数据。
方差分析的基本思想: 当实验数据满足正态性和方差相等(也称方差同质性)的假设条件时,把全部数据关于总均数的离差平方和分解成几部分,每一部分表示某一影响因素或诸影响因素之间的交互作用所产生的效应。将各部分均方(即方差)与误差均方相比较,依据F统计量做出统计推断,得到统计结论。
1. 单因素试验的方差分析
考虑一个因素A取a个水平,分析这a个不同水平对所考察的指标Y的影响,即在实验中只有A一种因素取a个水平变化,而其他因素控制不变,这样的实验叫单因素实验,所进行的方差分析叫单因素实验的方差分析。
零假设: H0: μ1=μ2=…=μa
备择假设: Ha: μi≠μj,至少有一对这样的i,j
在Ai水平下的样本均值为: i.=1ni∑nij=1xij样本数据的总平均值为: =1n∑ai=1∑nij=1xij总离差平方和为: SST=∑ai=1∑nij=1(xij-)2总离差平方和可分解为: SST=∑ai=1∑nij=1(xi.-)2+∑ai=1∑nij=1(xij-i.)2+2∑ai=1∑nij=1(i.-)(xij-i.)其中,上式中的*后一项为0。
若记: 因素A的离差平方和为: SSA=∑ai=1∑nij=1(i.-)2误差项的离差平方和为: SSe=∑ai=1∑nij=1(xij-i.)2则有: SST=SSA+SSe(总变差=组间差异+组内差异)。
SST是全部实验数据与总平均值之间的差异,称为总变差。SSA表示在Ai水平下的样本均值与总平均值之间的差异,叫因素A效应的离差平方和,也称组间差异。SSe表示在Ai水平下的样本值与该水平的样本均值之间的差异,它是由随机误差引起的,叫误差平方和,又称组内差异。
SST的自由度为n-1。因为SSA与SSe相互独立,SSA的自由度fA为a-1(a为水平数),SSe的自由度fe为n-a。fT=fA+feF=SSAfASSefe2. 双因素无交互作用的方差分析
客观现实中的事物很复杂,影响某项指标的因素往往有很多,这些因素互相联系,互相依存,互相对立,问题也变得复杂多样。当只考虑两个因素的作用,且两因素间无交互作用时,我们进行组间变差和组内变差(即误差)的变差分析,叫双因素无交互作用实验方差分析。