数据模型是用于描述数据或者信息的标记 一般由三部分组成
1.数据结构
这是一种物理数据模型,与那些实际的物理门电路有较大差别
2.数据操作
在数据库系统模型中,只能在数据上附加一些有限的可执行的操作集,作为一个强有力的约束,使得数据库系统可以更高效地执行这些操作
3.数据上的约束
数据库系统中数据模型通常有一种方法来描述数据上的约束
现今数据库系统当中两种非常重要并且比较优秀的数据模型是:关系数据模型和半结构化数据模型
关系模型是一种基于表的数据模型 类似于C语言中的结构体
半结构化模型类似树或者图,而非表或者数组
半结构化数据目前最主要的体现就是XML
半结构化模型比关系模型具有更大的灵活性 但是关系模型仍然是DBMS采用最多的一种数据模型
关系模型可以体现高效性(对于庞大规模数据的高效访问和修改)和易用性(对于开发者而言)
1.他可以提供一种简单有限的方法来对数据进行建模并且功能全面,因此现实中的任何事情都可以有效地模型化
2.它提供了一套有限但是有效的操作集
虽然有很多“有限”,但是这些限制性的条件正是关系模型的特征。
在关系模型中,可以使用高级的程序语言例如SQL,使得开发者可以在较高层级上进行开发。短短几行SQL语言就可以完成数百数千行其他代码可以完成的操作。由于关系模型中使用较强的有限的集合操作,短短的SQL程序可以被优化从而快速运行,或者能够比其它语言代码块。
关系模型为人们提供了但以一种描述数据的方法:一个被称之为关系的二维表(每一行对应一个实体,每一列对应一个属性)
关系的列被命名为列
关系名和其属性集合的组合被称为模式 形式为 关系名(属性1,属性2,属性3,...)
关系模式中的属性是集合,不是列表,而为了讲述关系常常赋予属性一个“标准”顺序,以显示关系或者关系的一行。
关系模型中数据库是有一个或者多个关系组成的。数据库的关系模式集合叫做关系数据库模式,或者称之为数据库模式
关系中除含有属性名所在行之外的其他行,也就是包含具体信息的行,被称之为元组
每个元组均具有一个分量对应于关系的每个属性
若要单独表示一个元组而非作为关系的一部分时,常使用逗号分开各个变量,并使用圆括号括起来
单独表示元组时,由于属性不出现,因此要给出元组的所在关系的标志,通常就是属性在关系模式中的排列顺序