使用数据库可以高效且条理分明地存储数据,使人们能够更加迅速、方便地管理数据。 数据库具有以下特点。
可以结构化存储大量的数据信息,方便用户进行有效的检索和访问。
可以有效地保持数据信息的一致性、完整性,降低数据冗余。
可以满足应用的共享和安全方面的要求。
数据库技术是计算机科学的核心技术之一,具有完备的理论基础。对数据库基本概念的掌握,将有助于对数据库的理解。
描述事物的符号记录
包括数字,文字、图形、图像、声音、档案记录等
以“记录”形式按统一的格式进行存储
将不同的记录组织在一起
用来存储具体数据
表的集合,是存储数据的仓库
以一定的组织方式存储的相互有关的数据集合
数据库管理系统(Database Management System,DBMS)是实现对数据库资源有效组织、 管理和存取的系统软件。它在操作系统的支持下,支持用户对数据库的各项操作。DBMS 主 要包括以下功能。
数据库的建立和维护功能:包括建立数据库的结构和数据的录入与转换、数据库的 转储与恢复、数据库的重组与性能监视等功能。
数据定义功能:包括定义全局数据结构、局部逻辑数据结构、存储结构、保密模式 及信息格式等功能。保证存储在数据库中的数据正确、有效和相容,以防止不合语 义的错误数据被输入或输出。
数据操纵功能:包括数据查询统计和数据更新两个方面。
数据库的运行管理功能:这是数据库管理系统的核心部分,包括并发控制、存取控 制、数据库内部维护等功能。
通信功能:DBMS 与其他软件系统之间的通信,如 Access 能与其他 Office 组件进行 数据交换。
是一个人机系统,由硬件、OS、数据库、DBMS、应用软件和数据库用户组成
用户可以通过DBMS或应用程序操作数据库
数据库技术的发展已经成为先进信息技术的重要组成部分,是现代计算机信息系统和计 算机应用系统的基础和核心。数据库技术最初产生于 20 世纪 60 年代中期,根据数据模型的 发展,可以划分为三个阶段:第一代的网状、层次数据库系统;第二代的关系数据库系统; 第三代的以面向对象模型为主要特征的数据库系统。
(1)初级阶段——第一代数据库
自 20 世纪 60 年代起,第一代数据库系统问世。它们是层次模型与网状模型的数据库系 统,为统一管理和共享数据提供了有力的支撑。在这个阶段中,数据库的代表是 1969 年 IBM 公司研制的层次模型的数据库管理系统——IMS(Information Management System,信息管 理系统)和 20 世纪 70 年代美国数据系统语言协会(CODASYL)下属数据库任务组(DBTG) 提议的网状模型。
(2)中级阶段——第二代数据库
20 世纪 70 年代初,第二代数据库——关系数据库开始出现。自 1970 年 IBM 研究员德 加·考特阐述了关系模型的概念后,IBM 大力投入关系数据库的研究。关系数据库的底层实 现起来比较容易,所以很快被采用,并进入了众多商业数据库的研发计划。Oracle 就是当 时应关系数据模型的出现而成立的一家专做(关系)数据库的公司。20 世纪 80 年代初,IBM 公司的关系数据库系统 DB2 问世,而 Oracle 公司也将 Oracle 数据库移植到桌面计算机上。 这时,作为第二代数据库系统的关系数据库,开始逐步取代层次与网状模型的数据库,成为 占主导地位的数据库,成为行业主流。到目前为止,关系数据库系统仍占领数据库应用的主 要地位。
关系数据库系统将结构化查询语言(Structured Query Language,SQL)作为数据定义 语言(Data Definition Language,DDL)和数据操作语言(Data Manipulation Language, DML),它一诞生就成为关系数据库的标准语言。SQL 使得关系数据库中的数据库表的查询 可以通过简单的、声明性的方式进行,大大简化了程序员的工作。
关系数据库系统构筑在比较高的软件层次上,执行查询的效率普遍偏低。另外,严格的、 标准的关系数据库是一个纯理论的模型。如果完全按照关系模型实现,会涉及很多方面的问 题,其中一条就是效率不高。在现实环境中,考虑到商业运用的目的,数据库生产厂商各自 加入了一些提高效率和提高可用性的功能,舍弃了一些不太现实的约束。不同的数据库厂商 在不同基础上的选择,导致了关系数据库系统向不同方向上的变迁。例如,在这个阶段中, Oracle 加入了“并行”的元素,并开始了向“关系-对象”型数据库的变迁。这样的变迁, 也慢慢引出了新一代的数据库系统。
(3)高级阶段——第三代数据库
由于计算机应用的发展,计算机已从传统的科学计算、事务处理等领域,逐步扩展到工 程设计、人工智能、多媒体、分布式等领域,这些新的领域需要有新的数据库支撑,而传统 关系数据库系统是以商业应用、事务处理为背景而发展起来的,并不完全适用于新领域的应 用,因此,需要新的数据库系统,以满足不同领域的要求。
自 20 世纪 80 年代开始,各种适应不同领域的新型数据库系统不断涌现,如工程数据库、 多媒体数据库、图形数据库、智能数据库、分布式数据库及面向对象数据库等,特别是面向 对象数据库系统,由于其实用性强、适应面广而受到人们的青睐。20 世纪 90 年代后期,形 成了多种数据库系统共同支撑应用的局面。当然,在商务应用方面,依然还是关系数据库占 主流。不过,已经有一些新的元素被添加进主流商务数据库系统中。例如,Oracle 支持的“关 系-对象”数据库模型。
随着科学技术的发展,计算机技术不断应用到各行各业。数据存储需求的不断膨胀,对 未来的数据库技术将会有更高的要求。
①SQL Server 简介
SQL Server 是 Microsoft 公司的数据库产品,在设计上大量利用了 Microsoft Windows 操作系统的底层结构,直接面向 Microsoft Windows,尤其是 Windows 系列服务器操作系统 的用户。
Microsoft Windows 拥有众多的用户群,Microsoft 所有的产品都遵循统一的操作习惯。 对数据库基本概念熟悉的 Windows 用户,可以很快地学会使用 SQL Server,上手比较容易。 Windows 系统的易用性也让数据库管理员可以更容易、更方便、更轻松地进行管理。
Microsoft 公司针对市场的需求,不断扩展其性能,使得 SQL Server 在网络数据库服 务和电子商务方面展示了强大的性能。
②Oracle 简介
Oracle 公司成立于 1977 年,最初就是专门的数据库公司。
1998 年 9 月,Oracle 公司正式发布 Oracle 8i,“i”代表 Internet,这一版本中添加 了大量为支持 Internet 而设计的特性。这一版本为数据库用户提供了全方位的 Java 支持。
在 2001 年 6 月的 Oracle Open World 大会中,Oracle 公司发布了 Oracle 9i,包含应 用集群软件 Real Application Clusters(RAC)和商务智能(BI)功能。
2004 年 2 月,Oracle 公司发布了 Oracle 10g 版本,“g”代表 grid(网格)。这一版 的最突出特性就是加入了网格计算的功能。
2013 年 6 月,Oracle 12C 正式发布,该版本提供了先进的技术堆栈管理、安全的数据 库管理及企业级的服务管理,使企业能够快速实现私有云。
数据库领域 Oracle 公司在很长一段时间内一直处于领先地位,不仅数据库核心相当优 秀,而且其相关的支持产品也相当完善和全面。Oracle 能适应 70 多种操作系统,这也是其 他产品难以企及的优势。不过随着云计算的不断发展,以 Oracle 为代表的传统数据库正在 逐渐失势,云数据库时代正在来临。2019 年 10 月 15 日亚马逊宣布永久关闭 Oracle 数据库 业务。可以说亚马逊关闭 Oracle 既是自身产业转型升级的需要,也是云计算领域发展迈出 的重要一步。如今已经有越来越多的企业开始上云,抛弃传统数据库,转而使用云数据库, 推动着云计算的不断发展。
③DB2 简介
1970 年,IBM 公司的一位研究员德加·考特发表论文,提出“关系模型”的概念。此后, 他被称为“关系数据库之父”。IBM 公司投入巨资,开展包括“SystemR”和“SystemR” 项目在内的关系数据库技术的研究。13 年后,在“SystemR”和“SystemR”项目的基础上, DB2 以 SystemR 为原型面世。
DB2 支持从 PC 到 UNIX,从中小型机到大型机,从 IBM 到非 IBM(HP 及 Sun UNIX 系统等) 的各种操作系统平台。其中,服务器平台可以是 OS/400、AIX、OS/2、HP-UNIX、Sun Solaris 等操作系统,客户机平台可以是 OS/2 或 Windows、DOS、AIX、HP-UX、Sun Solaris 等操作 系统。但是,DB2 服务器端的最佳运行环境还是 IBM 自己的操作系统平台 OS/400。
DB2 数据库核心又称为 DB2 通用服务器,可以运行于多种操作系统之上,它根据相应的 平台环境做了调整和优化,以便达到较好的性能。由于 IBM 公司在商用服务器领域内的长期 优势,在全球 500 强的企业中,超过 80%的企业曾使用 DB2 作为数据库平台。
④MySQL简介
MySQL 也是一个关系型数据库管理系统,现已被 Oracle 公司收购。它与上述大型数据 库相比,有不足之处,但是这丝毫没有减少它受欢迎的程度。
MySQL 运行于 Linux 操作系统之上,Apache 和 Nginx 作为 Web 服务器,MySQL 作为后台 数据库,PHP/Perl/Python 作为脚本解释器。这四款软件都是免费或开源的,也就是说,企 业可以不花一分钱(除人工外)就能建立起一个稳定、高速的网站系统,业内称为“LAMP”组合。因此,其以体积小、速度快、开源等特点,霸占了中小型网站相当大的市场。
非关系数据库也被称作 NoSQL(Not Only SQL),存储数据不以关系模型为依据,不需要 固定的表格式。非关系型数据库作为关系数据库的一个补充,在日益快速发展的网站时代, 发挥着高效率与高性能。
非关系型数据库的优点:
数据库高并发读写的需求
对海量数据高效率存储与访问
数据库的高扩展性与高可用性的需求 常用的非关系数据库例如 Memcached、Redis、MongoDB、HBase等,我这里就不详细介绍了。
关系数据库系统是基于关系模型的数据库系统
关系模型的数据结构使用简单易懂的二维数据表
关系模型可用简单的“实体-关系”(E-R)图来表示
E-R图中包含了实体(数据对象)、关系和属性三个要素
1)实体:也称为实例,对应现实世界中可区别于其他对象的“事件”或“事物”
如银行客户、银行账户等
2)属性:实体所具有的某一特性,一个实体可以有多个属性
如“银行客户”实体集中的每个实体均具有姓名、住址、电话等属性
3)联系:实体集之间的对应关系称为联系,也称为关系
如银行客户和银行账户之间存在“储蓄”的关系
非关系数据库也被称作NoSQL(Not Only SQL)
存储数据不以关系模型为依据,不需要固定的表格式
非关系型数据库的优点
数据库可高并发读写
对海量数据高效率存储与访问
数据库具有高扩展性与高可用性
常用的非关系数据库:Redis、mongoDB等
1)安装相关依赖软件(需要配置yum官方或者阿里源进行安装)
2)下载python安装包(自己下载过可以忽略此步骤)
3)创建目录,并添加配置
4)安装相关依赖软件,解压python软件包并进行编译安装
tar -zxvf Python-3.9.0.tgz
cd Python-3.9.0/
./configure --prefix=/usr/local/python --with-ssl
make && make install
5)优化路径,安装pip3
6)登录测试