生物统计学和以计算机为基础的使用SAS分析健康数据——Biostatistic and
Computer-based Analysis of Health Data using SAS
作者:Christophe Lalanne 、Mounir Mesbah
出版社: ISTE Press
索书号:Q-332/L194a/2017/Y
ISBN:9781785481116
藏书地点:武大外教中心
生物统计学是生物数学中最早形成的一大分支,它是在用统计学的原理和方法研究生物学的客观现象及问题的过程中形成的,生物学中的问题又促使生物统计学中大部分基本方法进一步发展。生物统计学是应用统计学的分支,它将统计方法应用到医学及生物学领域,在此,数理统计学和应用统计学有些重叠,例如在某些实例中,某个已有的标准统计方法不大适用就必须加以修正,在这种情形下,生物统计学就涉及如何去发展新的方法。生物统计学的内容包括试验设计和统计分析。试验设计是指应用数理统计的原理与方法,制订试验方案,选择试验材料,合理分组,降低试验误差,使我们可以利用较少的人力、物力和时间,获得丰富而可靠的数据资料。统计分析是指应用数理统计的原理与方法对数据资料进行分析与推断,认识客观事物的本质和规律性,使我们对所研究的资料得出合理的结论二由于事物都是相互联系的,统计不能孤立地研究各种现象,而必须通过一定数量的观察,从这些观察结果中研究事物问的相互关系。揭示出事物客观存在的规律性,统计分析与试验设计是不可分割的两部分。试验设计须以统计分析的原理和方法为基础.而正确设计的试验又为统计分析提供了丰富、可靠的信息,两者紧密结合推断出合理的结论,不断地推动应用生物科学研究的发展。
SAS (Statistical Analysis System)是一个模块化、集成化的大型应用软件系统。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。SAS系统基本上可以分为四大部分:SAS数据库部分;SAS分析核心;SAS开发呈现工具;SAS对分布处理模式的支持及其数据仓库设计。SAS系统主要完成以数据为中心的四大任务:数据访问;数据管理(sas 的数据管理功能并不很出色,而是数据分析能力强大所以常常用微软的产品管理数据,再导成sas数据格式.要注意与其他软件的配套使用);数据呈现;数据分析。当前(2016年)软件最高版本为SAS9.4。其中Base SAS模块是SAS系统的核心。其它各模块均在Base SAS提供的环境中运行。用户可选择需要的模块与Base SAS一起构成一个用户化的SAS系统。
SAS把数据存取,管理,分析和展现有机地融为一体。主要特点如下有:1)功能强大,统计方法齐,全,新。SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。例如方差分析中的多重比较,提供了包括LSD,DUNCAN,TUKEY测验在内的10余种方法;回归分析提供了9种自变量选择的方法(如STEPWISE,BACKWARD,FORWARD,RSQUARE等)。回归模型中可以选择是否包括截距,还可以事先指定一些包括在模型中的自变量字组(SUBSET)等。对于中间计算结果,可以全部输出,不输出或选择输出,也可存储到文件中供后续分析过程调用。2)使用简便,操作灵活。SAS以一个通用的数据(DATA)步产生数据集,尔后以不同的过程调用完成各种数据分析。其编程语句简洁,短小,通常只需很小的几句语句即可完成一些复杂的运算,得到满意的结果。结果输出以简明的英文给出提示,统计术语规范易懂,具有初步英语和统计基础即可。使用者只要告诉SAS“做什么”,而不必告诉其“怎么做”。同时SAS的设计,使得任何SAS能够“猜”出的东西用户都不必告诉它(即无需设定),并且能自动修正一些小的错误(例如将DATA语句的DATA拼写成DATE,SAS将假设为DATA继续运行,仅在LOG中给出注释说明)。对运行时的错误它尽可能地给出错误原因及改正方法。因而SAS将统计的科学,严谨和准确与便于使用者有机地结合起来,极大地方便了使用者。3)提供联机帮助功能。使用过程中按下功能键F1,可随时获得帮助信息,得到简明的操作指导。
在统计学中,线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。(这反过来又应当由多个相关的因变量预测的多元线性回归区别,而不是一个单一的标量变量。)在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。最常用的线性回归建模是给定X值的y的条件均值是X的仿射函数。不太一般的情况,线性回归模型可以是一个中位数或一些其他的给定X的条件下y的条件分布的分位数作为X的线性函数表示。像所有形式的回归分析一样,线性回归也把焦点放在给定X值的y的条件概率分布,而不是X和y的联合概率分布(多元分析领域)。线性回归是回归分析中第一种经过严格研究并在实际应用中广泛使用的类型。这是因为线性依赖于其未知参数的模型比非线性依赖于其位置参数的模型更容易拟合,而且产生的估计的统计特性也更容易确定。
线性回归模型经常用最小二乘逼近来拟合,但他们也可能用别的方法来拟合,比如用最小化“拟合缺陷”在一些其他规范里(比如最小绝对误差回归),或者在桥回归中最小化最小二乘损失函数的惩罚.相反,最小二乘逼近可以用来拟合那些非线性的模型.因此,尽管“最小二乘法”和“线性模型”是紧密相连的,但他们是不能划等号的。
《生物统计学和以计算机为基础的使用SAS分析健康数据》一书于2017年由ISTE Press出版,作者是Christophe Lalanne 、Mounir Mesbah。
《生物统计学和以计算机为基础的使用SAS分析健康数据》一书是一本介绍生物统计学的专业书籍,内容包括:语言因素、简单描述图统计、关联测量法,平均数或比例的比较、相互关系,线性回归、逻辑抑制、存活曲线以及cox回归线。
《生物统计学和以计算机为基础的使用SAS分析健康数据》一书作为生物统计学专业研究读物,观点新颖独到,内容饱满详实、语言浅显易懂,除此之外,还包括一些其他的特点:
1、本书不仅仅是介绍生物统计学的相关知识,而且将其与实际数据分析联系起来,让读者更加直观清晰的了解和学习生物统计学的知识。
2、索引文献丰富,证明了这本书的知识性,真实性。而且,这些索引文献绝大部分都是最新研究,这就是这本书与世界最新研究同步,让读者全面了解该领域的前沿进展。
3、本书还具有很强的专业性,本书展示了最前沿的生物统计专业的知识。
4、在本书的最后,将出现的专业词汇都罗列出来,并予以注解,大大方便了大家对阅读过程中对统计学研究的专业术语的认知。
总的说来,《生物统计学和以计算机为基础的使用SAS分析健康数据》一书为想要了解统计学的人员提供了清晰的导读路径,作为生物学领域的一本前沿研究图书,是一本值得为想要涉足该领域的人员推荐的专业书籍。
本书目录
章节1 语言因素
章节2 简单描述图统计
章节3 关联测量法,平均数或比例的比较
章节4 相互关系,线性回归
章节5 逻辑抑制
章节6 存活曲线,cox回归线