数据库系统概述

本文共--字 阅读约--分钟 | 浏览: -- Last Updated: 2021-04-18

数据库基本概念

1、数据(Data)是描述事物的符号记录,是指用物理符号记录下来的、可以鉴别的信息。可以是包括数字、字母、文字、特殊字符组成的文本数据,也可以是图形、图像、动画、影像、声音、语言等多媒体数据。

2、数据库(Database,DB):存储数据的仓库,是长期储存在计算机中的有组织、可共享的数据集合。数据库中存储的数据具有永久存储、有组织和可共享三个基本特点。

3、数据库管理系统(Database Management System,DBMS)是专门用于建立和管理数据库的一套软件,介于应用程序和操作系统之间。

4、数据库管理系统的主要功能

  • 数据定义功能:提供数据定义语言DDL定义数据库中的数据对象,包括表,视图,存储过程,触发器等

  • 数据操纵功能:提供数据操纵语言DML实现对数据库的基本操作,包括数据的查询、插入、删除和修改

  • 数据库的运行管理功能:提供统一的控制和管理机制,确保多个用户能并发使用共享数据,保证数据的安全性、可靠性以及发生故障时能进行正确的恢复;

  • 数据库的建立和维护功能:创建数据库及对数据库空间的维护、数据库的备份与恢复功能、数据库的重组织功能和性能监视、分析等

  • 数据组织、存储和管理功能:例如索引查找、顺序查找等;

  • 其他功能:主要包括与其他软件的网络通信功能、不同数据库管理系统之间的数据传输以及相互访问功能等;

5、数据库系统(Database System,DBS)是指在计算机中引入数据库技术之后的系统。包括数据库,数据库管理系统及相关实用工具、应用程序、数据库管理员和用户。

6、数据库管理员(Database Administrator,DBA)专门负责对数据库进行维护,并保证数据库正常、高效运行的人员。

数据管理技术的发展

1、数据管理的任务是进行数据的收集、组织、控制、存储、选取、维护,是数据处理的中心问题。

2、数据管理技术经历的三个阶段:

  • 人工管理阶段(40年代中–50年代中)
    特点:
    1.数据不保存
    2.应用程序管理数据
    3.数据面向应用

  • 文件系统阶段(50年代末–60年代中)
    特点:
    1.数据可以长期保存;
    2.提供了物理数据独立性,使应用程序与数据的具体物理存储结构分离;
    3.不能实现数据的普通共享,只能实现文件级的共享,而不能在记录或数据项级实现数据的共享;
    4.文件的逻辑结构是根据它的应用而设计的,数据的逻辑结构与应用程序之间相互依赖;
    5.存在大量的数据冗余;

  • 数据库系统阶段(60年代末–现在)
    特点
    1.数据集成;
    2.数据共享性高;
    3.数据冗余小;
    4.数据一致性;(数据的不一致性的根源就是数据冗余)
    5.数据独立性高;
    6.实现统一管理与控制;
    7.减少应用程序开发与维护的工作量

三者相对比:数据共享程度;数据独立程度;数据控制能力;

  • 人工管理:无共享,冗余度大;不独立,完全依赖于程序;应用程序自己控制;
  • 文件系统:共享性差,冗余度小;独立性差;应用程序自己控制;
  • 数据库系统:共享性大,冗余度小;具有高度的物理独立性和逻辑独立性;由DBMS提供数据安全性、完整性、并发控制和恢复;

数据库系统结构

1、数据库的三级模式有外模式、模式、内模式。

2、模式,也称为概念模式或逻辑模式,它是数据库中全体数据的逻辑结构和特征的描述。模式只能有一个,DBMS提供模式描述语言(schema DDL)来定义模式。

3、外模式也称为子模式或用户模式,它是数据库用户最终能看到的局部数据的逻辑结构和特征的描述。外模式可以有多个,DBMS提供子模式描述语言(SubSchema DDL)来定义子模式。

4、内模式,也称为存储模式,它是对数据库中数据物理结构和存储方式的描述,是数据在数据库内部的表示形式,内模式只能有一个。DBMS提供内模式描述语言(内模式DDL / 存储模式DDL)来定义内模式。

5、映像:是一种对应规则,它指出映像双方是如何进行转换的。

6、三级模式结构的两层映像:

  • 外模式/模式映像: 定义了各个外模式与概念模式之间的映像关系。在各自的外模式中加以描述。保证了数据与程序的逻辑独立性。
  • 模式/内模式映像:定义了数据库全局逻辑结构与物理存储之间的对应关系。通常在模式中加以描述。保证了数据与程序的物理独立性。

正是由于这两层映像保证了数据能够具有较高的逻辑独立性和物理独立性。

7、数据库系统的运行与应用结构有两种:

  • 客户/服务器结构(Client/Server,C/S);
  • 浏览器/服务器结构(Browser/Server,B/S)

8、简述外模式/模式映像及其如何保证数据的逻辑独立性

  • 外模式/模式映像定义了各个外模式与概念模式之间的映像关系。在各自的外模式中加以描述
  • 当数据库的模式发生改变时,DBA会对各个外模式/模式做出相应的改变,以使那些用户对可见的外模式保持不变,从而使应用程序的编程人员不必去修改那些依据数据的外模式所编写的应用程序,如此实现了外模式不受模式变化的影响,从而保证了数据与程序的逻辑独立性。

数据模型

1、数据模型的三个要素。

  • 数据结构:描述的是系统的静态特性,即数据对象的数据型、内容、属性以及数据对象之间的联系;
  • 数据操作:描述的是系统的动态特性,是对各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则;
  • 数据约束:描述的是数据结构中数据间的语法和语义关联,包括相互制约与依存关系以及数据动态变化规则,以保证数据的正确性、有效性与相容性;

2、两大类数据模型:概念层数据模型 、 逻辑层数据模型和物理层数据模型

  • 概念层数据模型:用来描述现实世界的事物,与具体计算机系统无关,且独立于任何DBMS。
  • 逻辑层数据模型:是用户通过数据库管理系统看到的现实世界,是基于计算机系统的观点来对数据进行建模和表示。
  • 物理层数据模型: 描述数据在存储介质上的组织结构,是逻辑模型的物理实现。

3、概念层数据模型涉及的基本概念

  • 实体:客观存在,可以相互区别的事物称为实体。(一条数据代表的事物)
  • 属性:实体所具有的某种特性。(字段)
  • 码或键:可唯一标识实体的属性集。
  • 域:属性的取值范围
  • 实体型:用实体名与属性名集合来抽象和刻画同类实体。例如,学生(学号,姓名,性别,出生日期)就是一个实体型;
  • 实体集:同型实体的集合,称为实体集。
  • 联系:现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系。

4、一对一联系。如果对于实体集A中的每一个实体,实体集B中至多有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系。记为1:1。

5、一对多联系。如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系记为1:n。

6、多对多联系。如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体B具有多对多联系。记为m:n。

7、逻辑层数据模型是用户通过数据库管理系统看到的现实世界,是基于计算机系统的观点来对数据进行建模和表示。主要的逻辑数据模型有:

  • 层次模型:有向树,有且仅有一个结点(根结点)没有父结点,其他结点有且仅有一个父结点。
  • 网状模型:以网状结构表示实体与实体之间的联系。
  • 关系模型:用二维表结构表示实体及实体间联系的模型。
  • 面向对象模型:面向对象方法与数据库相结合所构成的数据模型

8、关系模型的优点

  • 关系模型是建立在严格的数学概念的基础上的;
  • 关系模型的数据结构简单、清晰,用户易懂、易用;
  • 具有更高的数据独立性、更好的安全保密性,也简化了程序员的工作和数据库开发建立的工作。

9、物理层数据模型描述数据在存储介质上的组织结构,是逻辑模型的物理实现

  • 物理模型确定数据的物理存储结构、数据存取路径以及调整、优化数据库的性能。
  • 物理模型的设计目标是提高数据库性能和有效利用存储空间。

10、概念模型、逻辑模型、物理模型这三个数据模型相互独立又存在着关联:

  • 从现实世界到概念模型的转换,是由数据库设计人员完成;
  • 从概念模型到逻辑模型的转换,是有数据库设计人员,也可以由数据库设计工具协助设计人员完成;
  • 从逻辑模型到物理模型的转换,是由数据库管理系统完成。