数据库模式与范式
数据的规范化
综合1NF、2NF和3NF、BCNF的内涵可概括如下:
(1)非主属性完全函数依赖于码(2NF的要求)
(2)非主属性不传递依赖于任何一个候选码(3NF的要求)
(3)主属性对不含它的码完全函数依赖(BCNF的要求)
(4)没有属性完全函数依赖于一组非主属性(BCNF的要求)
数据库设计
逻辑结构设计
1.基本E-R模型向关系模型转换
2.数据模型优化
(1)改善数据库的性能。
- 减少连接运算
- 减少关系大小和数据量(分表)
分表常用有
水平分割与垂直分割。水平分割为分系建立关系,垂直分割为将常用数据与非常用数据分开。
(2)节约存储空间
- 缩小每个属性占用的空间
通常可以有两种方法:即用编码和用缩写符号表示属性,但这两种方法的缺点是失去了属性值含义的直观性。
- 采用假属性
主要任务
逻辑结构设计阶段的主要任务是确定数据模型、将ER图转换成指定数据模型、确定完整性约束、确定用户视图。
超类实体:由多个实体中共有的属性组成
派生属性:由其他属性计算获得,用于存储计算结果值。
数据挖掘
数据挖掘是从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程,数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特意群组分析和演变分析等等。
并非所有的信息发现任务都被称为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过英特网的搜索引擎查找特定的web页面,则是信息检索领域的任务。虽然这些任务是重要的,可能设计使用复杂的算法和数据结构,但是他们主要是依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。