- ISBN:9787030553355
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:其他
- 页数:308
- 出版时间:2022-03-01
- 条形码:9787030553355 ; 978-7-03-055335-5
本书特色
该书是为大学生和研究生编写的入门书,也是为研究人员编写的参考手册,内容涵盖面广,材料组织精当,密切联系学科前沿,叙述讲解清楚,逻辑性和实用性并重
内容简介
本书共分11章,**章绪论部分全面概述生物信息学发展、任务和主要研究内容等;第2-6章为基本内容,涉及生物信息学资源、序列分析、序列比对和系统发生分析;第7章为延伸篇,涉及统计学习与推理;*后8-11章为近期新发展,涉及各种组学和系统生物学等内容。
目录
序
前言
第1章生物信息学引论 1
1.1 引言 1
1.2 生物信息学的产生与发展 3
1.3 生物信息学的主要研究内容 7
1.4 生物信息学教育与学习 14
问题与练习 15
第2章 生物学基础 16
2.1 蛋白质的结构和功能 16
2.2 遗传信息的载体—— DNA 18
2.3 分子生物学中心法则 19
2.4 基因组 24
2.5 基因表达调控 25
2.6 DNA测序技术 28
问题与练习 40
第3章 统计学习与推理 41
3.1 统计学习与推理基础 41
3.2 统计理论 43
3.3 分类算法 48
问题与练习 63
第4章 生物信息学资源 64
4.1 引言 64
4.2 基因组信息资源 67
4.3 蛋白质信息 76
4.4 生物大分子结构数据库 87
4.5 其他生物学数据库 90
问题与练习 93
第5章 序列分析与序列比对 95
5.1 核酸序列分析 95
5.2 表达序列标签分析 100
5.3 蛋白质序列分析 104
5.4 生物数据综合分析工具 110
5.5 序列比对的基本概念 115
5.6 双序列比对 122
5.7 多重序列比对 126
问题与练习 134
第6章 分子系统发生分析 135
6.1 系统发生与系统发生树 135
6.2 分子进化模型与序列分歧度计算 139
6.3 分子系统发生树的构建 143
6.4 系统发生树的可靠性 151
6.5 分子系统发育分析软件及应用 152
问题与练习 155
第7章 基因组信息学 157
7.1 引言 157
7.2 人类基因组计划和基因组信息学 158
7.3 基因组结构特点 163
7.4 基因组序列分析 167
7.5 基因识别方法 169
7.6 调控元件识别 177
7.7 功能基因组学 181
问题与练习 187
第8章 生物芯片 189
8.1 生物芯片简介 189
8.2 生物芯片的种类 190
8.3 基因芯片的基本原理和基本流程 191
8.4 生物芯片的应用 194
8.5 基因芯片数据预处理 195
8.6 芯片数据分析 199
问题与练习 202
第9章 转录组信息学 203
9.1 表达序列标签技术 204
9.2 基因表达系列分析技术 204
9.3 大规模平行测序技术 206
9.4 RNA-seq测序及测序数据的预处理 207
9.5 RNA-seq测序数据的分析 216
问题与练习 222
第10章 蛋白质组信息学 223
10.1 引言 223
10.2 蛋白质组学常用的实验方法 224
10.3 蛋白质 -蛋白质相互作用 230
10.4 蛋白质翻译后修饰的鉴定 235
10.5 蛋白质组学的应用 243
问题与练习 247
第11章 系统生物学 248
11.1 引言 248
11.2 系统生物学的基本概念 248
11.3 系统生物学的基本技术与方法 252
11.7 信号转导通路 277
11.4 网络构建基础 254
11.8 蛋白质 -蛋白质相互作用网络 283
11.5 基因表达调控网络 273
问题与练习 286
11.6 代谢网络 275
参考文献 288
节选
**章 生物信息学引论 本章提要:本章旨在介绍生物信息学的基本概念,指出生物信息学的研究目标和任务、研究意义。简要回顾了生物信息学的产生和发展历史,较为详细地介绍了目前阶段其主要研究内容。 生命科学在 20世纪得到了快速发展,在还原论思想的引导下,生理学、细胞生物学、分子遗传学、分子生物学等学科的发展使人们从器官、组织、细胞及生物大分子等各个层次认识了生命的物质基础。生物与其他物质有本质的区别,生物并非只是物质的简单堆积,生物体的生长发育是生命信息控制之下的复杂而有序的过程。如果说物理学是研究物质和能量的学科,那么生命科学就是研究生命物质基础上的信息的学科。21世纪是生命科学的时代,也是信息时代。随着人类基因组计划的实施,有关核酸、蛋白质的序列和结构及生物分子相互作用等数据呈指数增长。面对巨大而复杂的数据,运用计算机管理数据、控制误差、加速分析过程势在必行。目前,我们对生命的奥秘还不甚了解,对生命信息的组织、传递和表达还知之甚少。既然这些都涉及信息的组织、传递和表达,我们就可以用信息科学的方法和技术来尝试认识和分析生命信息。在这样的背景下,生物信息学作为一门学科应运而生并且得到了迅速发展。 1.1 引言 传统的生物学是一门实验科学,生物学研究依赖于对实验数据的处理和分析。生物学也是一门发现科学,通过实验发现新的现象、新的生物学规律,经过分析、归纳和总结,提炼出新的生物学知识。传统的还原论生物学研究方法在20世纪取得了重大成就,特别是分子生物学的出现。在21世纪的头几年生物学发生了重大的变化,传统的生物学研究模式受到了极大的挑战。随着基因组计划的不断延伸,各类“组学”技术迅速发展,生物数据的积累速度不断加快。因此,对生物数据的科学分析方法和实用分析工具提出了更新、更高的要求。在这个过程中,需要对实验数据进行处理并及时开展理论分析,在此基础上解释实验现象,认识导致实验现象发生的本质,在“整合”“系统”等全新理念下探索固有的生物学规律,进而了解和掌握生命的物质基础和本质。 1.1.1 生物信息学基本概念 无论从理论上来讲还是从实际情况来看,生物信息学的实质就是利用数理知识、信息和计算机科学及技术来研究生物学信息的组织、传递和表达规律等问题。生物信息学的诞生是由生物学对大量数据处理和分析的需求而引发的,是历史的必然。作为一门交叉学科,生物信息学的发展依赖于计算机科学技术和生物技术的发展,而生物信息学的研究成果又促进了生物学特别是分子生物学的发展。 生物信息学(bioinformatics)这个名词有许多不同的定义。基于生物信息学与分子生物学的密切关系,狭义的生物信息学专指应用信息技术储存和分析分子序列及其相关数据,也被称为分子生物信息学。 广义的生物信息学是指以核酸、蛋白质等生物大分子为主要研究对象,以信息、数理、计算机科学为主要研究手段,以计算机网络为主要研究环境,以计算机软件为主要研究工具,对序列数据进行存储、管理、注释、加工,对各种数据库进行查询、搜索、比较、分析,构建各种类型的专用数据库信息系统,研究开发面向生物学家的新一代计算机软件;并利用数理统计、模式识别、动态规划、密码解读、语意解析、信令传递、神经网络、遗传算法、隐马尔可夫模型及网络构建等各种方法,对序列、结构、基因表达、分子相互作用等数据进行定性和定量分析,基于“综合论”思想和“系统生物学”框架,获取基因编码、基因调控、序列-结构-网络-功能关系等理性知识,阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和时空联系,探索生命起源、生物进化、生命本质等重大理论问题,*终建立“生物学周期表”。 与生物信息学相关的概念还有计算分子生物学(computational molecular biology),计算分子生物学常常被看作生物信息学的同义词。两者确实十分相近,尤其是它们都将分子生物学数据分析作为主要研究内容。但一般认为,计算分子生物学主要研究分析方法,开发分析工具,促进生物分子数据的分析。计算分子生物学更侧重于发展理论模型和计算方法,应用领域则不如生物信息学覆盖面广。与生物信息学相近的另一个名词是生物计算,生物计算主要是用计算机技术分析和处理生物学数据。 总的来说,生物信息学中许多分支学科源于生物学的不同分支学科与信息科学的结合。例如,计算分子生物学和计算神经生物学(computational neurobiology)等,从名称上即可大致反映其内容。不同的研究单位和研究者一般依自己工作的重点来使用这些分支学科的名称,或采用类似的名称,如日本国立遗传研究所(NIG)著名的“信息生物学中心(Center for Information Biology)”。此外,一批生物信息学的姊妹学科也已形成,如医学信息学(medical informatics)、化学信息学(chemical informatics)等。 1.1.2 生物信息学的研究目标和任务 揭示生物分子数据隐含的生物学信息是其长远目标和根本任务。生物分子数据之间存在着复杂的联系,这些数据中蕴涵着丰富的生物学知识和生物学规律。生物信息学的发展将揭示生物分子信息的本质,使人类彻底了解、掌握遗传信息的编码、传递及表达,从而加快人类了解自身的进程。 目前生物信息学的主要任务是研究生物分子数据的获取、存储和查询,发展数据分析方法。主要包括3个方面。 **个方面是收集和管理生物分子数据,使生物学研究人员能够方便地使用这些数据,并为信息分析和数据挖掘打下基础。生物分子数据来自于生物学实验,应用信息学技术收集和管理这些数据,将各种数据以一定的表示形式存放在计算机中,建立数据库系统,并提供数据查询、搜索和数据通信工具。 第二个方面是进行数据处理和分析。通过数据分析,发现数据之间的关系,认识数据的本质,进而上升为生物学知识。并在此基础上,解释与生物分子信息复制、传递和表达有关的生物过程,解释在生物过程中出现的信息变化与疾病的关系,帮助发现新的药物作用目标,设计新的药物分子,为进一步的研究和应用打下基础。早期生物信息学的主要研究对象是DNA和蛋白质,近些年研究人员逐渐关注生物分子相互作用及其网络表现的性质。在DNA分析方面,着重分析DNA序列中的基因信息及基因表达调控信息,分析基因表达数据,分析基因之间的相互作用关系,比较不同种属的基因组,研究基因组中非编码区域的生物学功能。在蛋白质分析方面,着重分析蛋白质序列与蛋白质结构及功能之间的关系,预测蛋白质的结构和功能,研究蛋白质的进化关系。在生物分子相互作用网络方面主要研究分子相互作用数据库构建,生物系统的网络建模,网络的动力学行为等。 生物信息学研究的第三个方面是开发分析工具和实用软件,解决具体的问题,为具体的生物信息学应用服务。例如,开发生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具、基因或通路富集分析、各种组学数据分析软件、网络构建和生物仿真的数学描述等。 生物分子数据类型的不断增多及数据量的不断膨胀促进了生物信息学的研究与应用。生物信息学的研究成果不断涌现,各种生物信息源如雨后春笋,层出不穷,而各种生物信息分析算法和工具也日益更新。 掌握互联网上各种生物信息学数据库及相关软件的使用技术已成为生物学和医学研究人员的迫切需要。尤其是分子生物学的三大核心数据库 GenBank核酸序列数据库、 UniProt蛋白质序列数据库和 PDB生物大分子结构数据库,不但是全世界分子生物学和医学研究人员获取生物分子序列、结构和其他信息的基本来源,而且是发表序列或结构测定结果的重要媒体。围绕这三大核心数据库还有众多面向各种特定应用的衍生数据库和分析软件,这些数据库分别从不同角度、以不同方式对各类生物信息学数据进行归纳、总结和注释,而各种分析软件为挖掘这些数据提供了有力的工具。 1.1.3 生物信息学的研究意义 生物信息学研究是从理论上认识生物本质的必要途径:通过生物信息学研究和探索,可以更为全面和深刻地认识生物科学中的本质问题,了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。基因序列到蛋白质序列的三联密码关系是众所周知的,也是非常简单、非常确定的。然而,基因调控序列与基因表达之间的关系、蛋白质序列与蛋白质结构之间的关系则是未知的,特别是在系统生物学框架下生物过程建模、仿真等也一定是非常复杂的。破译和阐明生物信息的本质将使人类对生物界的认识跨越一个新台阶。 生物信息学的出现将改变生物学的研究方式:传统的生物学是一门实验科学,分子生物学实验往往是集中精力研究一个基因、一条代谢路径,手工分析完全能够胜任。然而,随着分子生物学技术的发展,已经出现一些高通量的实验方法,如基因芯片、各种组学技术等,利用基因芯片一次可以获取上千个基因的表达数据,转录组测序更是产生大量与基因表达和 RNA加工有关的信息。生物学已经从一次只分析一个生物分子的时代跳跃到同时分析成千上万个生物分子的时代。对于高通量的实验结果,必须利用计算机进行自动分析。因而,在高通量实验技术出现的时代,生物信息学必然要介入生物学研究和实验。 再者,从生物分子数据本身来看,各种数据之间存在着密切的关系,如DNA序列与蛋白质序列、基因突变与疾病等,这些关系反映了生物学的规律。但是,这些关系可能是非常复杂的,是未知的,是简单的多元统计方法难以分析的。对于这些复杂的关系,必须运用现代信息学的方法去分析研究。因而,随着分子生物学研究的深入,必然需要生物信息学。 另外,现在全世界每天都会产生大量的包括核酸序列、蛋白质序列和生物分子相互作用等数据,不可能用实验的方法去详细研究每一条数据,必须*先进行信息处理和分析,去粗取精,去伪存真。通过预处理,发现有用的线索。在此基础上有针对性地设计分子生物学实验。因而,生物信息学在指导实验、精心设计实验方面将会发挥重要的作用。特别在系统生物学框架下,没有理论指导的实验几乎很难完成。 生物信息学研究在医学上也有重要意义。通过生物信息学分析,可以了解基因与疾病的关系,了解疾病产生的机制,为疾病的诊断和治疗提供依据。研究生物分子结构与功能的关系将是研制新药的基础,可以帮助确定新药作用的目标和方式,从而为设计新药提供依据,揭示人类及重要动植物种类的基因信息,继而开展生物大分子结构模拟和药物设计。在单核苷酸多态性(single nucleotide polymorphism,SNP)研究的基础上开发针对个体或某一群体的药物“个性化医疗”、加快生物学研究向临床应用的“转化医学”、在多种类型疾病相关数据基础上制订诊断、治疗和预后方案的“精准医学”被社会各界普遍寄予厚望。 1.2 生物信息学的产生与发展 1.2.1 生物信息学的发展历史 生物信息学的发展大致经历了3个阶段。 1.前基因组时代(20世纪90年代以前) 早在 20世纪50年代,生物信息学就已经开始孕育。1956年在美国田纳西州的加特林堡*次召开了“生物学中的信息理论研讨会”。20世纪60年代是生物信息学形成雏形的阶段,一些计算生物学家开始进行相关研究,做了许多生物数据收集和分析方面的工作。在这个时期,生物大分子携带信息成为分子生物学的重要理论,生物分子信息在概念上将计算生物学和计算机科学联系起来。大量的生物分子序列成为丰富的信息源,科学家开始应用计算方法分析这些信息。相关或者同源蛋白质序列之间的相似性*先引起了人们的注意。 1962年,Zucherkandl和 Pauling研究序列变化与进化之间的关系,开创了一个新的领域——分子进化。随后,通过序列比较确定序列的功能及序列分类关系成为序列分析的主要工作。 1964年,蛋白质结构预测的研究由 Davies的工作开始。 1967年,Dayhof
-
勒维特之星-大发现系列丛书
¥4.0¥16.0 -
喜马拉雅山珍稀鸟类图鉴
¥27.2¥68.0 -
昆虫的生存之道
¥12.2¥38.0 -
昆虫采集制作及主要目科简易识别手册
¥15.0¥50.0 -
古文诗词中的地球与环境事件
¥8.7¥28.0 -
声音简史
¥21.3¥52.0 -
不匹配的一对:动物王国的性别文化
¥16.7¥42.8 -
物理学之美-插图珍藏版
¥20.7¥69.0 -
现代物理学的概念和理论
¥18.4¥68.0 -
技术史入门
¥14.4¥48.0 -
几何原本
¥35.6¥93.6 -
改变世界的发现
¥15.4¥48.0 -
图说相对论(32开平装)
¥13.8¥46.0 -
数学的魅力;初等数学概念演绎
¥7.7¥22.0 -
星空探奇
¥14.0¥39.0 -
宇宙与人
¥10.5¥35.0 -
数学专题讲座
¥13.3¥29.0 -
袁隆平口述自传
¥19.9¥51.0 -
为了人人晓得相对论
¥3.9¥13.5 -
一代神话:哥本哈根学派
¥8.1¥15.5