图书介绍

生物数据整合与挖掘【2025|PDF|Epub|mobi|kindle电子书版本百度云盘下载】

生物数据整合与挖掘
  • 朱扬勇,熊赟著 著
  • 出版社: 上海:复旦大学出版社
  • ISBN:9787309066142
  • 出版时间:2009
  • 标注页数:240页
  • 文件大小:88MB
  • 文件页数:253页
  • 主题词:生物信息论-数据处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

生物数据整合与挖掘PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 背景知识1

1.1生物信息学1

1.1.1基本概念1

1.1.2研究内容2

1.1.3研究方法5

1.1.4研究机构6

1.2数据整合6

1.2.1数据资源7

1.2.2数据整合的动因8

1.2.3数据整合的概念9

1.2.4数据整合的内容12

1.3数据挖掘13

1.3.1数据挖掘的定义13

1.3.2数据挖掘的任务14

1.3.3数据挖掘的类型21

1.3.4相关技术的差异23

第2章 数据整合与数据挖掘方法26

2.1数据整合的方法26

2.1.1数据整合的方式26

2.1.2数据整合的步骤28

2.2数据挖掘的方法33

2.2.1数据挖掘过程示例33

2.2.2数据挖掘过程模型34

2.2.3数据挖掘应用方式36

2.3数据清洁技术38

2.3.1数据的质量问题38

2.3.2数据清洁的主要工作39

2.4数据仓库技术40

2.4.1数据仓库的概念41

2.4.2数据组织41

2.4.3主题设计43

2.4.4数据加载44

2.4.5数据规约46

2.5小结46

第3章 生物数据源47

3.1生物数据47

3.1.1生物序列数据47

3.1.2生物分子结构数据48

3.1.3芯片及基因表达数据49

3.1.4生物网络数据49

3.2生物数据组织50

3.2.1生物数据的数据库组织形式51

3.2.2生物数据的互联网组织形式53

3.3生物数据库54

3.3.1生物序列数据库55

3.3.2基因组数据库57

3.3.3结构数据库58

3.3.4芯片和基因表达数据库58

3.3.5生物文献数据库59

3.4生物数据源的特征60

3.5小结62

第4章 复杂生物数据源的数据抽取63

4.1生物数据抽取63

4.1.1生物数据抽取面临的问题63

4.1.2包装器的要素65

4.1.3抽取算法66

4.1.4元数据生成与包装器生成工具66

4.2包装器的设计67

4.2.1基于实例切分的抽取算法67

4.2.2基于定位器多结点共享的数据抽取模型68

4.2.3数据抽取模型描述68

4.2.4元数据的生成和维护69

4.2.5数据抽取模型表达能力69

4.3包装器解决方案69

4.3.1面向无噪声复杂数据源的解决方案69

4.3.2面向含噪声复杂数据源的解决方案70

4.3.3 ReDE和L-树包装器生成工具的架构71

4.3.4 ReDE和L-树包装器生成工具的实现技术73

4.4 L-树匹配:面向复杂数据源的数据抽取算法74

4.4.1 L-树上的数据映射机制74

4.4.2 L-树匹配算法的相关概念76

4.4.3 L-树匹配算法78

4.4.4 L-树匹配算法举例79

4.5基于L-树的包装器生成工具82

4.5.1将ERE扩充成数据抽取脚本语言82

4.5.2可视化编辑调试环境83

4.5.3 ERE的可视化构建83

4.5.4 ERE的逻辑检查86

4.5.5抽取结果的可视化评价86

4.5.6以XML格式输出抽取结果87

4.6小结88

第5章 生物数据整合案例89

5.1生物数据整合系统的设计89

5.1.1生物数据整合的关键问题分析89

5.1.2生物数据整合目标的确立90

5.1.3生物数据整合方式和技术的设计91

5.2基于GO的数据整合92

5.2.1 GO简介93

5.2.2 DB2GO表95

5.2.3语义相似数据库表95

5.2.4以GO统一数据的逻辑和语义96

5.3数据抽取和增量更新98

5.3.1数据抽取98

5.3.2数据的增量更新100

5.4基于GO的查询技术101

5.4.1异构生物数据库的语义查询101

5.4.2 BioDW中语义查询的体系结构101

5.4.3 GO语义相似性度量方法102

5.4.4语义相似性查询104

5.5 BioDW系统106

5.5.1 BioDW的系统结构106

5.5.2 BioDW的系统的数据规模107

5.5.3 BioDW的数据查询107

5.6小结115

第6章 生物序列数据挖掘进展116

6.1生物序列数据挖掘的基本概念和内容116

6.1.1生物序列相似性117

6.1.2生物序列模式挖掘118

6.1.3生物序列聚类分析119

6.1.4生物序列分类分析120

6.1.5生物序列关联分析120

6.1.6生物序列异常分析120

6.2生物序列数据挖掘的研究阶段121

6.2.1基于统计技术的数据挖掘方法的应用阶段121

6.2.2一般化数据挖掘方法的应用阶段122

6.2.3专门数据挖掘技术的设计阶段122

6.3生物序列数据挖掘研究与应用现状122

6.3.1生物序列模式挖掘方面123

6.3.2生物序列聚类分析方面127

6.3.3生物序列分类分析方面130

6.3.4生物序列关联分析方面132

6.3.5生物序列异常分析方面132

6.4生物序列数据挖掘研究趋势133

6.5小结134

第7章 生物序列数据挖掘技术135

7.1序列数据源135

7.2生物序列模式挖掘137

7.2.1生物序列模式挖掘问题137

7.2.2基于多支持度的生物序列模式挖掘框架139

7.2.3基于多支持度的生物序列模式挖掘算法141

7.3生物序列聚类分析147

7.3.1生物序列聚类问题分析147

7.3.2蛋白质序列聚类149

7.3.3基因序列聚类154

7.4生物序列分类分析167

7.4.1生物序列分类问题分析167

7.4.2转录因子分类167

7.4.3基于支持向量机的转录因子分类算法169

7.5小结171

第8章 基因芯片数据挖掘172

8.1基因表达谱芯片数据挖掘172

8.1.1基因表达谱数据分析172

8.1.2基因表达相似性分析173

8.1.3基因表达共发生分析173

8.1.4基因表达路径分析173

8.1.5特殊表达基因分析174

8.2基因表达谱数据库建设175

8.2.1基因表达谱芯片数据的标准175

8.2.2基因表达谱数据库建设的难点176

8.2.3数据库结构设计177

8.2.4数据加载与数据管理179

8.2.5自动导入数据180

8.3基因表达谱数据挖掘系统182

8.3.1数据挖掘框架182

8.3.2 BDMAPA架构扩展183

8.3.3基因表达谱芯片数据挖掘系统184

8.4小结186

第9章 转录因子、顺式调控元件挖掘系统187

9.1转录因子、顺式调控元件挖掘原理187

9.1.1转录因子、顺式调控元件挖掘原理188

9.1.2顺式调控元件文本挖掘原理188

9.2转录因子、顺式调控元件挖掘系统设计194

9.2.1数据挖掘软件194

9.2.2数据分析服务195

9.2.3综合的转录因子、顺式调控元件数据库200

9.3小结201

第10章 生物序列数据库管理系统202

10.1生物数据处理面临的问题202

10.1.1生物数据存储方式202

10.1.2生物序列数据库的查询需求204

10.2生物序列数据模型BioSeg205

10.2.1数据结构206

10.2.2代数操作210

10.2.3 Open BUILT-IN函数224

10.2.4等价规则225

10.2.5 BioSeg模型的特点227

10.3生物序列数据库管理系统的设计229

10.3.1代数查询实例229

10.3.2查询语言232

10.3.3体系结构234

10.4小结235

参考文献236

致谢239

热门推荐