- ISBN:9787030278319
- 装帧:一般胶版纸
- 册数:暂无
- 重量:暂无
- 开本:16开
- 页数:222
- 出版时间:2010-06-01
- 条形码:9787030278319 ; 978-7-03-027831-9
内容简介
《生物信息学分析实践》内容主要包括生物信息学简介、三太数据库检索、引物设计及测序结果分析、核酸序列分析、蛋白质序列分析、蛋白质空间结构预测、系统发育分析、RNA分析、参考文献管理。《生物信息学分析实践》的一大特色在于丰富的实例和图表,使读者可以很直观地了解和掌握《生物信息学分析实践》的内容。
目录
序
前言
**章 生物信息学简介 1
1.1 生物信息学基础 1
1.1.1 什么是生物信息学 1
1.1.2 生物信息学的形成与发展 2
1.1.3 生物信息学的研究内容 4
1.2 生物信息学应用 6
1.2.1 生物信息学的热点领域 6
1.2.2 信息技术与生物信息学 8
第二章 数据库检索 11
2.1 综合性数据库NCBI 11
2.1.1 NCBI简介 11
2.1.2 NCBI数据库介绍 12
2.1.3 Entrez简介 14
2.1.4 Entrez检索实例 15
2.2 综合性数据库EMBLGEBI 19
2.2.1 EBI简介 19
2.2.2 EBI数据库简介 20
2.2.3 SRS简介 21
2.2.4 SRS检索实例 22
2.2.5 BioMart简介 23
2.2.6 BioMart检索实例 23
2.3 UCSC基因组浏览器 27
2.3.1 UCSC基因组浏览器简介 27
2.3.2 UCSC基因组浏览器检索实例 28
第三章 引物设计及测序结果分析 30
3.1 引物设计 30
3.1.1 概述 30
3.1.2 常规PCR引物设计实例分析 36
3.1.3 简并引物设计 53
3.2 测序结果分析 60
3.3 序列拼接实例分析 61
第四章 核酸序列分析 75
4.1 常规分析 75
4.1.1 核酸序列的检索 75
4.1.2 核酸序列组分分析 75
4.1.3 序列变换 77
4.1.4 限制性酶切分析 78
4.2 比对分析 82
4.2.1 BLAST比对 82
4.2.2 双序列比对 87
4.2.3 多序列比对 89
4.3 基因结构识别 93
4.3.1 ORF识别及其可靠性验证 93
4.3.2 启动子及转录因子结合位点分析 97
4.3.3 重复序列分析 99
4.3.4 CpGisland 101
4.3.5 3′UTR区 102
第五章 蛋白质序列分析 105
5.1 蛋白质序列的基本性质分析 105
5.1.1 理化性质分析 105
5.1.2 疏水性分析 107
5.1.3 跨膜区分析 110
5.1.4 信号肽预测 112
5.1.5 Coil区分析 116
5.1.6 亚细胞定位 118
5.2 结构域分析及motif搜索 120
5.2.1 结构域分析 120
5.2.2 motif搜索 123
5.3 空间结构预测 126
5.3.1 蛋白质二级结构预测 126
5.3.2 蛋白质三级结构预测 129
5.3.3 蛋白质结构预测方法评价 138
5.4 抗原表位预测分析 139
5.4.1 B淋巴细胞抗原表位预测分析 140
5.4.2 T淋巴细胞抗原表位预测分析 145
第六章 分子进化与系统发育分析 149
6.1 进化的分子基础 149
6.1.1 进化树与分子系统学 149
6.1.2 相似性与同源性 151
6.1.3 分子进化 151
6.2 系统发育分析 151
6.2.1 DNA和氨基酸序列的进化演变 153
6.2.2 系统发育树的种类 153
6.2.3 用于系统发育分析的分子标记选择 154
6.2.4 常用的构树方法及其甄选 156
6.2.5 系统发育分析常用软件 159
6.3 系统发育分析的检验 165
6.3.1 系统发育分析方法可靠性的评价 165
6.3.2 系统树的误差分析及消除方法 166
6.4 系统树的评估 168
6.5 系统发育分析实例 168
6.5.1 使用MEGA软件重建NJ树 172
6.5.2 使用PAUP软件重建NJ树 174
6.5.3 使用MEGA软件重建MP树 175
6.5.4 使用PAUP软件重建MP树 176
6.5.5 使用PAUP软件重建ML树 177
6.5.6 贝叶斯树 177
第七章 RNA分析 181
7.1 RNA简介 181
7.1.1 RNA的结构 182
7.1.2 RNA的功能 182
7.1.3 RNA研究进展与展望 184
7.2 RNA二级结构 184
7.2.1 RNA的二级结构概述 184
7.2.2 RNA二级结构的预测方法 186
7.2.3 RNA结构预测实例分析 188
7.3 高效siRNA的设计 191
7.3.1 RNAi的作用机制 192
7.3.2 siRNA的设计原则 193
7.3.3 影响RNAi的其他因素 193
7.3.4 siRNA的设计步骤 194
7.3.5 siRNA的合成 194
7.3.6 siRNA干涉效果的评判 195
7.3.7 siRNA相关数据库介绍 195
7.3.8 siRNA设计实例分析 196
7.4 microRNA分析 198
7.4.1 microRNA作用机制概述 198
7.4.2 miRNA功能与研究方法 200
7.4.3 miRNA生物信息学分析 201
7.4.4 miRNA及其靶基因预测的实例分析 206
主要参考文献及网址 211
附录 218
附录1 常用生物学数据库 218
附录2 各种主要的RNA二级结构预测软件比较 219
附录3 名词解释 221
彩图
节选
**章 生物信息学简介 1.1 生物信息学基础 1.1.1 什么是生物信息学 “生物信息学”是英文单词“bioinformatics”的中文译名。从字面上可以看出,它是一门与生物学和信息学两大热门学科都密切相关的学科。什么是生物信息学呢?我们还是从这一词语的来源谈起。bioinformatics —词是由美国学者林华安博士(H.A.Lim)在1987年首创的。他*初使用的是“compbio”这一单词,随后更改为“bioinformatique”。不久,他又进一-步将其更改为 bio-informatics (或 bio/informat-cs),又因名称中的“”或“/”符号容易导致当时的电子邮件系统问题,故将其去除,于是今天我们所看到的“bioinformatics”就正式诞生了,林华安博士也因此赢得了“生物信息学之父”的美誉(蒋彦等,2003)。 众所周知,生物信息学是一门崭新的、正如火如荼发展的交叉学科,它吸引了越来越多的来自生物学、医学、数学以及信息科学背景的专家学者投入到生物信息学的研究当中去。但是由于不同领域科学家兴趣的侧重点不同,对生物信息学的定义往往具有局限性,犹如盲人摸象(图1-1)。关于生物信息学的定义,到目前为止,国内外众说纷纭,没有形成统一的、普遍公认的标准。美国国家基因组研究中心认为,生物信息学是一门生物学、数学和计算机相互交叉融合而产生的新兴学科;美国佐治亚理工大学认为,生物信息学是采用数学、统计学和计算机等方法分析生物学、生物化学和生物物理学数据的一门综合学科;美国密苏里大学认为,生物信息学是获取、存储和处理生物学信息的一门科学与技术;美国加利福尼亚大学洛杉矶分校则认为,生物信息学是对生物学信息和生物学系统内在结构的研究,它运用数学和计算机科学的分析理论和实用工具将分散的生物学数据联系起来。笔者根据自己对生物信息学的认识,综合多方面内容,从广义和狭义两个方面对什么是生物信息学做了相关的解释。 图1-1 不同领域科学家对生物信息学的认识 1.广义的生物信息学 广义的生物信息学是指从事对基因组研究相关的生物信息的获取、加工、储存、分配、分析和解释。它包括了两层含义,一个是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据。具体地说,生物信息学是以DNA和蛋白质序列等生物信息分析作为源头,破译隐藏在序列信息中的语义规律,阐明海量生物信息的信息实质,在此基础上归纳、整理与遗传语义信息释放及调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化和进化的规律。广义的生物信息学涉及生命的信息交换和传递的各个层次,如核酸、蛋白质、细胞、组织、器官、系统和生物体等。 2.狭义的生物信息学 狭义的生物信息学是指综合应用信息科学、数学的理论、方法和技术,管理、分析和利用生物分子数据的科学,即分子生物信息学(molecular bioinformatics)。*初的生物信息学以基因组DNA序列信息挖掘为出发点,通过收集、组织、管理基因组 DNA序列数据,以期获得隐藏在基因组序列之中丰富的生物学知识,从更深层次认识未知的生物世界。然而,随着技术的不断进步,生物分子数据巳经不仅仅限于基因组序列数据,微阵列、基因本体(gene ontology,GO)注释、分子图谱、结构数据等其他数据的积累也在快速增加,这些数据同样具有丰富的内涵。科学地利用生物分子数据及其分析结果,可以大大提高研究和开发的科学性及效率。但是,如何发展应用数理统计、模式识别、动态规划、神经网络、遗传算法及隐马尔科夫模型等挖掘海量数据中可以阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律的方法,仍是生物学家所面临的一个严峻挑战,生物信息学也正是在这种挑战中不断发展起来的交叉学科。 1.1.2 生物信息学的形成与发展 生物信息学是建立在分子生物学基础上的。因此,要了解生物信息学的发展就必须先对分子生物学的发展有一个简单的了解。1866年孟德尔(G.j.Mendel)根据实验结果提出了基因是以实物存在的假设。1871年Mesher从死的白细胞核中分离出脱氧核糖核酸。1944年阿佛莱(O.T.Avery)、麦克李沃(C M.Mac Leod)和麦克卡(M.McCarty)三人通过试验证明DNA是生物的遗传物质以前,人们仍然认为染色体蛋白质携带基因,而DNA则被认为是一个小角色。1944年Chargaff发现了著名的 Chargaff规律,即DNA中鸟嘌呤的量与胞嘧啶的量总是相等,腺嘌呤与胸腺嘧啶的量总是相等。与此同时,Wilkins与Franklin用X射线衍射技术测定了 DNA纤维的结构(图1-2)。1953年James Watson和Francis Crick通过大量研究后在Nature杂志上发表论文,提出了 DNA的双螺旋三维结构.他们的理论奠定了分子生物学的基础.DNA 双螺旋模型已经预示出了 DNA复制的规则。1956年Kornberg从大肠杆菌中分离出了 DNA聚合酶I (DNA polymerase I ),这种酶能使 dNTP 连接成 DNA。Meselson 和 Stahl 于1958年证明了 DNA半保留复制。Crick于1954年提出了遗传信息传递的规律,根据当时有限的资料, 他把中心法则(central dogma)的公式表述为“DNA—RNA—蛋白质”,虽然现在的中心法则已经得到新的修正,但Click提出的中心法则对后来分子生物学和生物信息学的发展都起到了极其重要的指导作用。1966年,Nirenberg和Khorana 破译了全部遗传密码字典的64个密码子,限制性内切酶的发现和重组DNA的克隆(clone)奠定了基因工程的技术基础。正是由于分子生物学的研究对生命科学的发展有巨大的推动作用,生物信息学的出现也就成了一种必然。 1.生物信息学的萌生 生物信息学的产生与发展仅有十几年的时间,bioinformatics这一名词在1991年左右才在文献中出现,而且大多出现在电子出版物中。事实上,生物信息学已经存在了几十年,可以说是一门有“较长历史”的学科,早在计算机初创的1956年就已经在美国田纳西州的盖特林堡召幵过首次“生物学中的信息理论讨论会”,这应该算作生物信息学的雏形,只不过*初人们把生物信息学称为基因组信息学。 20世纪80年代末,随着人类基因组计划的启动,生物实验和衍生数据的大量储存,促使这一新兴交叉学科形成。但由于当时技术的局限性,这一学科并没有得到重视和发展。在沉寂了20余年后,才依赖计算机科学、工程学和应用数学的迅猛发展得以飞速发展。随着互联网的发展和普及,基于Internet的庞大信息网络无疑对信息学的发展起了巨大的推动作用,也为生物信息学这一全新领域的萌芽和发展奠定了坚实的基础。当世界各地的科学家幵始认识到计算机的重要性并着手尝试利用计算机来组织、储备和分析生物学的观测资料时,生物信息学就已经萌芽了。然而,那些科学家当时也许并没有意识到生物信息学已经在他们手里诞生了。 2.生物信息学数据库 与生命科学其他学科的发展不同的是,生物信息学的高速发展并不是主要依赖于理论上的重大突破,从实验中获得的大量数据以及基于这些数据建立的生物信息数据库在一定程度上是生物信息学发展的动力。美国洛斯阿拉莫斯国家实验室于1979年建立起 GenBank数据库;1982年欧洲分子生物学实验室的核酸序列数据库(European Molecular Biology Laboratory, EMBL)幵始提供服务;日本也于1984年着手建立国家*的Nucleic Acids Research杂志在每年**期中会详细介绍各种*新生物信息学数据库。在2000年1月1日出版的28卷**期中共介绍了115种通用和专用的数据库。到2009年,这一数据已达到1170,增长了10多倍。本书后面的章节将详细介绍有关数据库的使用方法,附录1中列出的是一些比较常用的在线生物学数据库,供读者参考。 图1-2 DNA的X射线衍射照片 图1-3 GenBank数据增长 1.1.3 生物信息学的研究内容 生物信息学在短短十几年间,已经发展成多个研究方向,国际上公认的生物信息学研究内容大致包括以下几个方面。 1.生物信息的收集、存储、管理与提供 生物信息的收集、存储、管理与提供主要是指建立国际基本生物信息库及相关的评估与检测系统,从而提供与生物学研究相关的在线服务。目前,大部分的生物学数据库 核酸序列数据库(DNA data bank of Japan,DDBJ),并于1987年幵始提供服务。1999年,在美国国立卫生研究院(NIH)建议下,美国又相继建立了20个生物计算中心,专门从事生物信息学相关研究和人才培养。目前,美国已经成为世界上生物信息学研究实力*强的国家之一。GenBank由NIH提供维护,并与DDBJ和EMBL —起,成为国际核苷酸序列数据库的主要成员。 GenBank数据库的碱基总量大约每13~15个月翻一番,如图1-3所示。截至2009年8月,登录的序列总量已经达到108431692条,DNA碱基对(base pairs)已经达到106533156756条。生物学数据的积累并不仅仅表现在DNA序列方面,与其同步的还有蛋白质一级结构,即氨基酸序列的增长。此外,还有其他大量数据库资源已经面向大众。 是由一些国家支持的非赢利性机构和一些知名大学的研究院所专门提供,也有部分是商业性质的数据库(如MDL)。分子生物信息数据库种类繁多,一般而言,这些数据库可以分为一级数据库和二级数据库。一级数据库的数据都直接来源于实验获得的原始数据,只经过简单的归类整理和注释。因此,一级数据库具有容量大、更新速度快、用户面广等特点,运行维护也需要具有高性能的计算机硬件和专门的数据库管理系统(Database Management System,DBMS)作支撑。例如,欧洲生物信息学研究所维护EMBL使用的是Oracle,而基因组数据库GDB的管理、运行则基于Sybase数据库系统。较为流行的数据库管理软件有Oracle、Sybase、 Informix和Microsoft SQLServer等。比较重要的一级核酸数据库有GenBank、EMBL和DDBJ等;蛋白质序列数据库有Swiss-Prot蛋白质序列数据库(Swiss-Prot Protein Sequence Database)、蛋白质信息资源(Protein Information Re-souce,PIR)等;蛋白质结构库有PDB (Protein Data Bank)等,序列数据库来自序列测定,结构数据库来自X射线衍射和核磁共振结构测定。二级数据库是在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学信息的进一步整理。二级数据库也称专门数据库、专业数据库与专用数据库。虽然二级数据库的种类繁多,但其容量小,可以不用大型商业数据库软件支撑。 2.基因组序列信息的提取和分析 利用国际FST数据库(dbEST)和各实验室自己测定的FST,通过电子克隆的方法发现新基因和新的单核苷酸多态性(single nucleotide polymorphism,SNP)位点以及各种功能位点;基因组中非编码区的信息结构分析,提出理论模型,阐明该区域的重要生物学功能;进行模式生物完整基因组的信息结构分析和比较研究;利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与DNA折叠的关系,以及基因组信息与生物进化关系等生物学的重大问题。
-
断代(八品)
¥15.5¥42.0 -
家居设计解剖书
¥29.3¥39.0 -
当代中国政府与政治(新编21世纪公共管理系列教材)
¥30.2¥48.0 -
中医基础理论
¥50.7¥59.0 -
习近平新时代中国特色社会主义思想概论
¥18.2¥26.0 -
编辑审稿实务教程
¥35.1¥45.0 -
社会学概论(第二版)
¥33.0¥55.0 -
古代汉语(第四册)
¥13.3¥35.0 -
当代教育心理学(第3版)(本科教材)
¥23.8¥66.0 -
落洼物语
¥8.4¥28.0 -
EPLAN电气设计
¥29.9¥39.8 -
软件定义网络(SDN)实战教程
¥49.6¥69.8 -
[社版]大汉战神:霍去病传
¥14.0¥40.0 -
介入护理学(案例版)
¥52.4¥69.8 -
学前教育史(第二版)
¥31.2¥48.0 -
西方经济学(宏观部分·第八版)(21世纪经济学系列教材)
¥41.7¥49.0 -
西方经济学(微观部分·第八版)(21世纪经济学系列教材)
¥17.9¥56.0 -
数理经济学的基本方法(第4版)(精)
¥56.9¥79.0 -
老子道德经注校释(精)/新编诸子集成
¥30.1¥43.0 -
科技论文规范写作与编辑(第4版)
¥63.0¥75.0