Bioinformatics
The
impact of accurate quantification on proteomic and genetic analysis and
research
生物信息学
精确定量对蛋白质组学和遗传学分析和研究的影响
编 者:Yu
Liu
出 版 社:Apple
Academic Press
索 书 号:Q811.4/B615d/2014/Y
藏书地点:武大外教中心
生物信息学是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:⑴新算法和统计学方法研究;⑵各类数据的分析和解释;⑶研制有效利用和管理数据新工具。生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。1990年代以来,伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。对生物信息学工作者提出了严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。这个难题已困扰理论生物学家达半个多世纪,如今找到问题答案要求正变得日益迫切。诺贝尔奖获得者W. Gilbert在1991年曾经指出:“传统生物学解决问题的方式是实验的。现在,基于全部基因都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设”。生物信息学的主要研究方向:基因组学
- 蛋白质组学
- 系统生物学
- 比较基因组学,1989年在美国举办生物化学系统论与生物数学的计算机模型国际会议,生物信息学发展到了计算生物学、计算系统生物学的时代。生物信息学产业的高级阶段体现于此,人类从此进入了以生物信息学为中心的后基因组时代。结合生物信息学的新药创新工程即是这一阶段的典型应用。
本书共由四部分十三章内容组成。第一部分的主题是转录组测序。第一章阐述的是转录组测序数据统计分析的实验室科学家指导,包括产生高质量的reads是取决于最初的RNA的质量、利用与转录组测序数据兼容的统计工具、转录组测序数据优化的流程等。第二章对利用下一代测序集合非唯一插入内容进行了描述,包括记号和概念、插入的整合、优化等。第三章介绍的是RSEM,它是一种对于有或无参考基因组的转录组测序的转录本精确定量的方法,相关的工作、方法的实施、参考序列的准备等内容都涵盖其中。本书第二部分的主旨是微芯片。第四章对用于估计由原位共聚焦成像引入基因表达数据误差的回归系统进行了阐述,包括算法、成像和数据获取、软件工具等多个方面。第五章介绍的是SPACE,它是一种利用微芯片预测和定量剪切异构体的一种算法,综合数据集、真实数据集、转录本数目的预测等内容都涵盖其中。第六章对鉴定差异共表达的基因及基因对的基于联锁的定量方法进行了描述,包括在构建基因共表达网络中新的半阈值策略、差异共表达轮廓方法、差异共表达富集方法等多个方面。第七章对利用有针对性的变量重要性测量的基因数据表达的维度降低进行了详细的描述。第三部分的主题是GWAS。第八章阐述的是欧洲的强森综合征和中毒性表皮坏死综合征的基因组范围的整合研究,包括病例、控制组、表现型数据的质量控制和主要成分分析等。第九章对利用重叠池测序进行的常见的基因分型和稀有变异进行了介绍,利用重叠池和估算进行的基因分型、癌症融合基因检测等。作者在第十章讨论的是利用贝叶斯网络评分标准研究遗传上位性,上位性、GWAS、贝叶斯网络等内容都涵盖其中。第十一章描述的是vWF和FVШ血浆水平的全基因组研究的综合分析,包括全局策略、基因分型、统计分析等。第四部分的主题是蛋白质组学。第十二章对带有标签的定量质谱蛋白质组学实验的统计方法进行了描述,包括概述、统计实验设计、数据的质量和标准化等。第十三章介绍的是MRCQuant,它是在TOF仪器上一个准确的液相色谱质谱连用的相对同位素定量的算法,MRCQuant算法、参考模板的产生、定量、基于本地MRC信号的定量等内容都涵盖其中。
生物信息学不仅仅是生物学知识的简单整理和数学、物理学、信息科学等学科知识的简单应用。海量数据和复杂的背景导致机器学习、统计数据分析和系统描述等方法需要在生物信息学所面临的背景之中迅速发展。本书作者通过四部分十三章内容,对生物信息学中精确定量对蛋白质组学和遗传学分析和研究的影响进行了详细的阐述,内容涵盖了转录组测序、微芯片、GWAS、蛋白质组学等多个方面。本书内容针对性比较强,比较适合从事生物信息学、蛋白质组学相关研究的科研人员和学生阅读参考。
本书目录
第一部分 转录组测序
第一章
转录组测序数据统计分析的实验室科学家指导
第二章
利用下一代测序集合非唯一插入内容
第三章
RSEM:对于有或无参考基因组的转录组测序的转录本精确定量
第二部分 微芯片
第四章
用于估计由原位共聚焦成像引入基因表达数据误差的回归系统
第五章
SPACE:利用微芯片预测和定量剪切异构体的一种算法
第六章
鉴定差异共表达的基因及基因对的基于联锁的定量方法
第七章
利用有针对性的变量重要性测量的基因数据表达的维度降低
第三部分 GWAS
第八章
欧洲的强森综合征和中毒性表皮坏死综合征的基因组范围的整合研究
第九章
利用重叠池测序进行的常见的基因分型和稀有变异
第十章
利用贝叶斯网络评分标准研究遗传上位性
第十一章 vWF和FVШ血浆水平的全基因组研究的综合分析
第四部分 蛋白质组学
第十二章 带有标签的定量质谱蛋白质组学实验的统计方法
第十三章 MRCQuant:在TOF仪器上一个准确的液相色谱质谱连用的相对同位素定量的算法
作者注解
索引
(郑银珍)