关系型数据库与非关系型数据库的区别
SQL(关系型数据库)数据存在特定的结构的表中,而NoSQL(非关系型数据库)则更加灵活和可扩展,存储方式可以是JSON文档、hash表或者其他方式。SQL通常以数据库表形式存储数据。举个例子:
而NoSQL存储方式比较灵活,比如使用类JSON文件存储上表中熊大的借阅数据:
在SQL中,必须定义好表和字段结构后才能够添加数据,例如定义表的主键(primary key),索引(index),触发器(trigger),存储过程(stored procedure)等。表结构可以在被定义之后更新,但是如果有比较大的结构变更的话就会变得比较复杂。在NoSQL中,数据可以在任何时候任何地方添加,不需要先定义表。例如下面这段代码会自动创建一个新的“借阅表”的数据集合:
NoSQL也可以在数据集中建立索引。以MongoDB为例,会自动在数据集合创建后创建唯一值_id字段,这样的话就可以在数据集创建后增加索引。
从这点来看,NoSQL可能更加适用于初始化数据还不明确或者未定的项目中。
SQL中如何需要添加外部关联数据的话,规范化做法实在原表中增加一个外键,关联外部数据表。例如需要在借阅表中增加审核人信息,先建立一个审核人表:
再在原来的借阅人表中增加审核人外键:
这样如果我们需要更新审核人个人信息的时候只需要更新审核人表而不需要对借阅人表做更新。而在NoSQL中除了这种规范化的外部数据表做法以外,我们还能用如下的非规范化方式把外部数据直接放到原数据集中,以提高查询效率。缺点也比较明显,更新审核人数据的时候将会比较麻烦。
SQL中可以使用JOIN表链接方式将多个关系数据表中的数据用一条间的查询语句查询出来。NoSQL暂未提供类似JOIN的查询方式对多个数据集中的数据做查询。所以大部分NoSQL使用的是非规范化的数据存储方式存储数据。
SQL中不允许删除已被使用的外部数据,例如审核人中表中的“熊三”已经被分配给了借阅人熊大,那么在审核人表中将不允许删除熊三这条数据,以保证数据完整性。而NoSQL中则没有这种强耦合的概念,可以随时删除任何数据。
SQL中如果多张表数据需要同批次被更新,即如果其中一张表更新失败的话其他的表也不能更新成功。这种场景可以通过事务来控制,可以在所有命令完成后再统一提交事务。而NoSQL中没有事务这个概念,每一个数据集的操作都是原子级的。
在相同水平的系统设计前提下,因为NoSQL中省略了JOIN查询的消耗,故理论上性能是优于SQL的。