Numerical
methods in bioinformatics
An
introduction
生物信息学中的计算方法
入门
编 者:Jiasong Wang
Ming Yan
出 版 社:Science
Press
索 书 号:Q811.4/W246/2013/Y
藏书地点:武大外教中心
生物数学已经成为一门比较完整并且相对独立的学科。生物数学由数学与生物学结合而成,并在广泛的应用中建立和完善自己的理论体系,发展出了许多适应于生物学特点的独特数学方法。20世纪初至21世纪,生物科学的发展突出表现在生物科学和数学的结合上。在此过程中,形成了如今生物数学研究中的许多热点研究领域生物统计学、数量遗传学、数学生态学、生物信息学、分子进化和发育、系统生物学、计算生物学、群体遗传学、生物动力学等。生物数学是近现代应用数学中有着最大进展和发展潜力的领域,数学的几乎所有分支都己经 渗透到了生物学中,并产生了许多对理论数学不具有普适性,但却很适合于研究生物学问题的专门技巧与方法。生物在其成长过程中的变化状态有些是连续的,也有些是离散的,如生物繁殖、细胞分裂等。数学分析问世后,特别是极限的理论完备后,在一定的条件下可以将生物学
中某些离散的现象理解为是几乎处处连续的,当然也考虑其中可能存在的不连续点,不过那些不连续点只是可数多个,由这可数多个不连续点所构成的集合的测度为零。数学发展到今天,已经可以处理确定性的非线性生物模型及随机性的线性生物模型,并且在处理随机的非线性模型方面也取得了一些进步。此外,近现代数学使生物学中的离散现象和突变现象能够用离散数学与图论解释,从而突破了数学分析等主要传统数学分支只能有效处理连续性生物学现象的限制。当今几乎所有的生物数学应用工作都会产生大量的数据,必须通过计算机才能实现对这么多数据进行有效处理的可能。计算机等信息技术的快速发展使数学能够更加广泛
应用于生物学,并产生了许多新的生物数学分支如生物信息学。最近几十年,随着基因组学的发展,生物学家越来越体会到数学的重要性。高性能计算机的介入使脱氧核糖核酸即序列测定技术快速发展。拓扑学,特别是其中的纽结理论为解开双螺旋结构之谜提供了一把钥匙,并因此解释了和蛋白质这两类最重要的生物大分子选择螺旋作为其空间结构基础的数学原因。而数理统计应用于遗传学概率论应用于人口统计和种群理论微分方程应用于各种生物数学模型的建立布尔代数应用于神经网络描述等,这一切已构成了“生物数学”的丰富内容。
本书共由十二章组成。第一章对一些生物学概念进行了阐述,包括细胞、遗传物质、蛋白质和氨基酸、染色体等。第二章描述的是DNA序列的图形化表示,3D图形展示、2D图形展示、没有简并的2D图形展示等内容都涵盖其中。第三章的主题是DNA序列的数字表示,包括DNA序列的4D和3D数字展示、DNA序列的2D数字展示、复杂的数字展示、基于DNA序列的物理、化学和结构性质的数字展示。作者在第四章对蛋白质的数字表示进行了详细的描述,氨基酸序列的1D数字和图形表示、氨基酸序列的2D数字和图形表示、蛋白质的3D数字表示、氨基酸的10D表示等内容都涵盖其中。第五章介绍的是实用正交变换,包括离散傅里叶变换的特征和算法、小波分析等。第六章对通过核苷酸分布鉴定蛋白质编码区(外显子)进行了描述,包括在DNA序列中寻找蛋白质编码区、区分外显子和内含子序列的实验等。第七章的主题是通过正交变换比较蛋白质,通过离散傅里叶变换进行的蛋白质比较、通过离散的小波变换的蛋白质比较等内容都涵盖其中。第八章阐述的是矢量表示在生物分子分析中的应用,包括利用特征向量分析DNA序列、蛋白质图谱及其应用等。第九章的主题是大量实验数据的统计分析,处理生物芯片数据的方法、脂类组学数据的统计分析等内容都涵盖其中。第十章对生物芯片分析中奇异值的应用进行了详细的介绍。第十一章描述的是基因表达的动态分析模型,包括基因表达的微分方程模型、线性修正的微分模型、基于奇异值分解的动态模型等多个方面。第十二章的主题是缺少芯片的数据输入,包括Ad
Hoc算法、基于SVD的缺失数据输入、本地最小二乘法输入等。
一方面,数学推动了生物学的发展,使生物学从经验科学上升为理论科学,由定性科学转变为定量科学另一方面,人们在利用数学研究生物现象与生物问题的过程中,也得到一些新的数学定理,并给数学工作者提出了许多新课题,从而推动了数学理论的发展。本书作者共通过十二章内容,对DNA序列的图形化表示、数字表示、蛋白质的数字表示、实用正交变换、矢量表示在生物分子分析中的应用等多个方面。本书针对性较强,比较适合从事生物信息学、生物数学相关研究的科研人员和学生阅读思考。
本书目录
前言
第一章
一些生物学概念
第二章
DNA序列的图形化表示
第三章
DNA序列的数字表示
第四章
蛋白质的数字表示
第五章
实用正交变换
第六章
通过核苷酸分布鉴定蛋白质编码区(外显子)
第七章
通过正交变换比较蛋白质
第八章
矢量表示在生物分子分析中的应用
第九章
大量实验数据的统计分析
第十章
生物芯片分析中奇异值的应用
第十一章 基因表达的动力学分析模型
第十二章 缺少芯片的数据输入
参考书目
(郑银珍)