智能生物信息学
——An Introduction
to Protein Informatics
作 者:Edward Keedwell,Ajit Narayanan
出 版:Wilke
索 书 号:Q811.4/K26/2005/Y
I S B N :9780470021750
藏书地点:武大外教中心
生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:(1)新算法和统计学方法研究;(2)各类数据的分析和解释;(3)研制有效利用和管理数据新工具。
但是生物信息学是基于分子生物学与多种学科交叉而成的新学科,现有的形势仍表现为各种学科的简单堆砌,相互之间的联系并不是特别的紧密。在处理大规模数据方面,没有行之有效的一般性方法;而对于大规模数据内在的生成机制也没有完全明了,这使得生物信息学的研究短期内很难有突破性的结果。那么,要得到真正的解决,最终不能从计算机科学得到,真正地解决可能还是得从生物学自身,从数学上的新思路来获得本质性的动力。
而《智能生物信息学》提供了一个独特的洞察生物信息学的复杂问题以及构成“智能生物信息学”的创新解决方案。生物信息学为医学和生物学领域的一些最重要的进展做出了贡献。在这个激动人心的新课题的最前沿,人们称之为人工智能技术,它的灵感来自于解决其面临的问题的方式。《智能生物信息学》是关于生物学、生物信息学或计算机科学的基本知识,并且针对感兴趣的读者而不论其学科。生物学、生物信息学和搜索与优化的复杂性的三章介绍使读者具备必要的知识,每个章节都致力于生物信息学中的智能技术。
本书的作者是Edward Keedwell和Ajit Narayanan。他们都是来自英国艾克赛特大学计算机科学数学功能学院的教授。在计算机和数学领域进行长期的教学和研究,在这些领域的高水平杂志上发表过多篇具有重大价值的文章,同时培养了许多该领域的研究人才,在计算机和数学方面具有一定权威。
《智能生物信息学》一书一共分为是一个章节。虽然作者是计算机和数学领域的专家,但是他们在生物学上也有一定的研究。所以在书本的第一章,首先介绍的生物学的基本知识。包括基本单元架构、脱氧核糖核酸的结构、人类基因组的历史、蛋白和细胞调控等。随后的章节开始介绍信息学在生物学上的应用,即生物信息学。其中包括人工智能和计算机科学概论、概率计算、蛋白质二级结构折叠计算方式、遗传算法、生物信息学的应用等多个方面。
这本书还包含许多在互联网上、学术期刊和其他网站上提供的软件和信息的链接,使其成为“智能生物信息学家”不可或缺的参考。《智能生物信息学》将是生物信息学和基因组学的所有研究生和研究人员、以及对这些学科感兴趣的计算机科学家,以及所有具有大数据集的自然科学家分析数据的重要参考书籍。除此之外,本书还具有以下几个特点:
1、具有权威性和时效性。《智能生物信息学》一书在内容上十分广泛,语言描述简洁,本书的编者是计算机科学、生物学、数学领域长期的教学和研究学者,因此书本具有较大的权威性。同时,由于关于生物学的内容更新换代很快,很多内容可能仅限于编书的当时,随着时代的发展有了更多的补充,因此,本书内容具有时效性。
2、层次鲜明,脉络清晰。《智能生物信息学》一书编写过程以不同章节分开,一共分为十一个章节,清楚地将生物信息学涉及的技术分条分类地展现出来,并且介绍了生物信息学目前的研究成果和相关技术的使用方法和步骤。
3、图文并茂,便于理解。该书在介绍信息技术的使用时,配有蛋白结构图和生物信息技术流程图,图文并茂使整本书更具有可读性、趣味性。
4、编排紧凑。该书在每一章开头都以提要和简介引入本章要讲的主要内容作为这一章的提纲挈领,并在章节末尾处对内容进行总结,并给出了关键词的解释,帮助读者对书中内容和概念进行归纳梳理,并自主进行扩展阅读。
总的来说,《智能生物信息学》内容详实、语言生动,所包含的分析和方法都非常突出生物信息学这一深奥学科,在作者的讲解下,生物信息学变得简单易懂。同时提供了多样的学习经验,适合大学生、研究生和希望获得生物信息学领域的基础知识的研究人员。
前言
致谢
第1部分:引言
1.介绍分子生物学的基础知识
1.1基本单元架构
1.2脱氧核糖核酸(DNA)的结构、含量和规模
1.3人类基因组的历史
1.4基因和蛋白质
1.5目前的知识和“中心教条”
1.6为什么蛋白质很重要
1.7基因和细胞调控
1.8细胞调节出错时
1.9什么是生物信息学
1.10章节概述
1.11参考文献
2.生物信息学中的问题和挑战介绍
2.1介绍
2.2基因组
2.3转录组
2.4蛋白质组学
2.5干扰技术、病毒和免疫系统
2.6章节概述
2.7参考文献
3.人工智能和计算机科学概论
3.1搜索介绍
3.2搜索算法
3.3Healthistic搜索方法
3.4最佳搜索策略
3.5搜索技术问题
3.6搜索的复杂性
3.7在生物信息学中使用图表
3.8语法、语言和自动机
3.9问题的类别
3.10章节概述
3.11参考文献
第2部分:现有技术
4.概率方法
4.1概率介绍
4.2贝叶斯定理
4.3贝叶斯网络
4.4马尔科夫网络
4.5参考文献
5.最近的邻居和聚类方法
5.1介绍
5.2最近邻法
5.3二级结构蛋白折叠预测的最近邻法
5.4类聚
5.5先进的聚类技术
5.6应用指南
5.7章节概述
5.8参考文献
6.识别(决策)树
6.1方法
6.2增加标准
6.3过度修剪和修剪
6.4应用指南
6.5生物信息学应用
6.6背景
6.7章节概述
6.8参考文献
7.神经网络。
7.1方法
7.2应用指南
7.3生物信息学应用
7.4背景
7.5章节概述
7.6参考文献
8.遗传算法
8.1单目标遗传算法-方法。
8.2单目标遗传算法-例子。
8.3多目标遗传算法-方法。
8.4应用指南
8.5遗传算法-生物信息学应用
8.6章节概述
8.7参考文献
第3部分:未来技术
9.遗传编程
9.1方法
9.2应用指南
9.3生物信息学应用
9.4背景
9.5章节概述
9.6参考文献
10.细胞自动机
10.1方法
10.2应用指南
10.3生物信息学应用
10.4背景
10.5章节概述
10.6参考文献
11.混合方法。
11.1方法
11.2用于分析基因表达数据的神经遗传算法
11.3生物化学溶剂化的遗传算法和k最近邻杂种
11.4确定流行病学中基因-基因相互作用的遗传规划神经网络
11.5应用指南
11.6总结
11.7章节概述
参考文献
索引
(武汉大学生命科学学院研究生 王鑫)