通过Perl,R,SQL解决生物信息学问题
----- Buliding bioinformatics solutions:with
Perl,R,SQL
作者: Conrad Bessant,Darren Oakley,Ian
Shadforth
出版:
OUP Oxford; 2
索书号: Q811.4/B557(2)/2014/Y
ISBN: 9780199658565
Perl是一种高级、通用、直译式、动态的程序语言。最初设计者拉里·沃尔(Larry Wall)为了让在UNIX上进行报表处理的工作变得更方便,决定开发一个通用的脚本语言,而在1987年12月18日发表。Perl借取了C、sed、awk、shell脚本以及很多其他编程语言的特性。其中最重要的特性是他内部集成了正则表达式的功能,以及巨大的第三方代码库CPAN。目前拉里·沃尔已经开发Perl 6,来作为Perl的后继;不过,Perl 6语言的语法有很多转变,所以Perl 6被视为Perl家族中的另一个语言。
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R是应用最广泛的开源统计和生物数据分析和可视化的编程环境。借鉴格雷格Hartvigsen教学生物统计学和生物系统建模具有丰富的经验,这本书为生命科学的实验室学习R的学生提供了使用的参考价值。为了强调R和R工作软件在生物数据的组织,计算和可视化的重要性,Hartvigsen指导读者通过输入数据的流程R,R处理数据,并使用R使用直方图来可视化数据,箱线图,barplots、散点图、和其他常见的图表类型。他为正常覆盖测试数据,定义和识别异常值,并处理非正态数据。为学生介绍了常见的-和两个示例测试以及一个和双向方差分析(方差分析),相关,线性和非线性回归分析。这本书中还包括一个先进的部分程序和一章引入算法,并使用R编程的艺术。
SQL语言,是结构化查询语言(Structured
Query Language)的简称。SQL语言是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统;同时也是数据库脚本文件的扩展名。SQL语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统可以使用相同的结构化查询语言作为数据输入与管理的接口。SQL语言语句可以嵌套,这使他具有极大的灵活性和强大的功能。
《通过Perl,R,SQL解决生物信息学问题》一书是由Conrad
Bessant,Darren Oakley,Ian Shadforth三个作者共同编著,于2014年OUP Oxford出版社出版。康拉德Bessant玛丽女王的生物信息学教授,伦敦大学。他是活跃在教学和研究,参与了许多软件开发项目领域的蛋白质组学和代谢组学。达伦·奥克利是自然出版集团的软件开发人员(NPG)。在核计划组他参与了众多项目改善核计划组文章相关的元数据。他现在的角色是首席开发人员NPG下一代网络发布平台。伊恩·Shadforth主任阿勒尔公司——综合健康和生物信息的一个公司。
《通过Perl,R,SQL解决生物信息学问题》一书的主要内容分成6个章节,主要内容是1.简介,从数据到知识:生物信息学的目标、使用这本书、生物信息学的应用原则、建立生物信息学的解决方法、可见的生物信息学资源、一些计算方法。2. 使用SQL建立生物数据库:一般数据库类型、数据库设计的联系、MySQL服务器的安装和运行、MySQL的选择、使用SQL数据库、MySQL工作台:命令选择、总结。3. Perl程序的开始:Perl的下载和安装、Perl的基本语法和逻辑、参考文献、子程序和模型、调控表达、文件处理和目录操作、错误处理、从网上检索文件、使用Perl DBI发现数据库之间的联系、利用现有的工具、面对对象的程序、总结。4. 使用R语言分析数据可视化:介绍R语言、多元数据分析、R包装、整合Perl和R、R选择、总结。5. 开发网站资源:网站服务、介绍HTML、使用Perl语言网站编程、先进的网站技术和语言、网站数据可视化、总结。6. 生物信息学的软件工程:单元检验、版本控制、建立文件夹、使用中心软件设计、Perl选择。
《通过Perl,R,SQL解决生物信息学问题》一书主要讲述了三种计算机语言,用于解决生物信息学的数据分析问题。将计算机学科与生物学科联系起来的一本专业书籍,适合从事生物信息研究的同学以及研究人员参考阅读。
本书目录:
前言
1.简介
1.1. 从数据到知识:生物信息学的目标
1.2. 使用这本书
1.3. 生物信息学的应用原则
1.4. 建立生物信息学的解决方法
1.5. 可见的生物信息学资源
1.6. 一些计算方法
2. 使用SQL建立生物数据库
2.1. 一般数据库类型
2.2. 数据库设计的联系
2.3. MySQL服务器的安装和运行
2.4. MySQL的选择
2.5. 使用SQL数据库
2.6. MySQL工作台:命令选择
2.7. 总结
3. Perl程序的开始
3.1. Perl的下载和安装
3.2. Perl的基本语法和逻辑
3.3. 参考文献
3.4. 子程序和模型
3.5. 调控表达
3.6. 文件处理和目录操作
3.7. 错误处理
3.8. 从网上检索文件
3.9. 使用Perl DBI发现数据库之间的联系
3.10. 利用现有的工具
3.11. 面对对象的程序
3.12. 总结
4. 使用R语言分析数据可视化
4.1. 介绍R语言
4.2. 多元数据分析
4.3. R包装
4.4. 整合Perl和R
4.5. R选择
4.6. 总结
5. 开发网站资源
5.1. 网站服务
5.2. 介绍HTML
5.3. 使用Perl语言网站编程
5.4. 先进的网站技术和语言
5.5. 网站数据可视化
5.6. 总结
6. 生物信息学的软件工程
6.1. 单元检验
6.2. 版本控制
6.3. 建立文件夹
6.4. 使用中心软件设计
6.5. Perl选择
索引
(武汉大学生命科学学院研究生 张英)