第一章 绪论
本文整理了《数据库系统概论》(第6版,王珊、杜小勇、陈红)第一章“绪论”的课后习题及补充题目答案,供学习者参考使用。
1. 试述数据、数据库、数据库管理系统、数据库系统的概念
(1)数据
在现代计算机系统中,“数据”是一个广义的概念。早期的计算机主要用于科学计算,处理的数据多为整数、实数或浮点数等数值类型。而如今,计算机能够存储和处理的对象种类大大扩展,对应的数据形式也更加复杂多样。
值得注意的是,数据与其语义密不可分。例如,数字500可能表示某商品价格为500元,也可能代表一袋奶粉的重量是500克。这种语义依赖性决定了对数据的理解必须结合其上下文环境。
作为数据库技术管理的基本对象,数据具有多种表现形式。掌握数据的本质特征,是理解数据库技术的前提。
(2)数据库
① 从通俗角度理解,数据库是指按照一定数据模型组织、可供多个用户共享、并长期存储于数据库管理系统中的数据集合。
② 其中,数据模型是数据库领域的核心概念之一,贯穿整个数据库设计与实现过程,需逐步深入理解和掌握。
(3)数据库管理系统
数据库管理系统(DBMS)属于大型软件系统,是计算机基础软件的重要组成部分。目前市场上已有众多厂商专门研发此类系统,并推出了丰富的相关产品。
[此处为图片1](4)数据库系统
数据库系统是一种人机交互系统,其中数据库只是其组成部分之一。“数据库系统”与“数据库”是两个不同的概念,但在日常交流中常被混用,即将“数据库系统”简称为“数据库”。
读者应根据具体语境加以区分,避免概念混淆。
2. 文件系统与数据库系统的区别与联系
文件系统和数据库系统均用于数据的持久化存储与管理。前者是底层的基础存储机制,后者则是在文件系统基础上发展起来的高级数据管理体系,具备更强的规范化管理能力。
两者的主要差异体现在:数据结构化程度、独立性、共享性以及管控能力等方面。而它们之间的主要联系在于——数据库系统的物理存储依赖于底层的文件系统来完成。
3. 适合使用文件系统与数据库系统的应用示例
一些功能较为简单且固定的应用系统更适合采用文件系统进行数据管理。例如,许多手机应用程序将照片、短信、微信聊天记录等信息直接保存在操作系统提供的文件系统中。
相比之下,绝大多数企业和机构的信息系统都以数据库系统为基础构建。比如工厂的信息系统涵盖库存管理、物资采购、生产调度、设备管理和人事管理等多个子系统;又如学校的学籍管理系统、教职工管理系统、图书借阅系统等。
由此可见,数据库系统已成为现代信息系统的核心支撑平台。
[此处为图片2]4. 数据库系统的主要特点
(1)整体数据的结构化
这是数据库系统区别于文件系统的本质特征。“整体”二字尤为关键。在数据库系统中,数据不再局限于单一应用,而是面向整个组织或企业的多种业务需求进行统一规划与设计。
(2)数据共享性强、冗余度低、易于扩充
数据库中的数据可通过不同接口、不同编程语言被多个用户或多个应用程序并发访问和共享。这不仅显著减少了数据冗余,节省了存储资源,还能有效防止因重复存储导致的数据不一致问题。
所谓“弹性大”,即指系统在新增或减少应用时,无需大规模调整数据库结构,仅需少量修改即可适应变化。
(3)数据独立性强
数据独立性意味着数据与程序之间相互解耦。即使数据的逻辑结构或物理存储方式发生变化,应用程序也不必随之修改。这一特性包括物理独立性和逻辑独立性两个层面。
通过将数据定义从程序代码中分离出来,数据库系统实现了高度的数据抽象,这也是其重要优势之一。
(4)数据由 DBMS 统一管理和控制
数据库中的数据共享具有并发性特征,允许多个用户同时访问同一数据项。DBMS 负责协调这些并发操作,确保数据的一致性、安全性和完整性。
5. 数据库管理系统的主要功能有哪些?
- 提供数据定义功能,支持模式、表结构等的创建与修改。
- 实现数据的组织、存储与管理,优化存取效率。
- 支持数据操纵功能,包括查询、插入、删除和更新等基本操作。
- 负责事务管理与运行控制,涵盖安全性、完整性、并发控制及系统恢复等功能。
- 提供数据库的建立、初始化及后期维护工具。
- 支持其他扩展功能,如异构数据库间的互访与互操作能力。
6. 什么是概念模型?试述其作用
概念模型是连接现实世界与机器世界的桥梁,在数据建模过程中处于中间层次。
它主要用于信息世界的建模,既是数据库设计人员开展设计工作的有力工具,也是设计人员与用户之间沟通交流的重要语言。
[此处为图片3]7. 定义并解释以下术语:实体、实体型、实体集、实体之间的联系
实体:指客观存在且可以相互区分的事物。例如一个学生、一名员工或一笔订单都可以被视为实体。
实体型:用来抽象描述同类实体的结构,通常由实体名称及其属性集合构成。一般表示为“实体名(属性1, 属性2, ..., 属性n)”的形式。
示例:“学生”可定义为如下实体型:
学生 (学号,姓名,性别,年龄,专业)
“订单”实体型可定义为:
订单 (订单号,客户ID,下单时间,总金额)
实体集:指同一类实体的集合。例如所有在校学生的集合构成了“学生实体集”。
实体间的关联关系可分为两类:一是实体(型)内部各属性之间的联系,二是不同实体集之间的相互联系。实体内部的联系主要体现在构成该实体的各个属性之间如何相互作用;而实体之间的联系则反映在不同实体集合间存在的对应关系。这些联系通常表现为三种基本形式:一对一、一对多以及多对多。
[此处为图片1]
数据模型的基本概念、功能及其三大组成要素
数据模型是数据库系统中用于抽象现实世界信息的重要工具,它提供了一套形式化的结构来表示和操作数据。作为整个数据库系统的基石,每一种数据库管理系统(DBMS)都基于特定的数据模型构建,或至少支持某种类型的数据模型。
一个完整的数据模型由以下三个核心部分构成:
- 数据结构:用于描述数据库中所包含的对象及其对象之间的逻辑关系,定义了数据的组织方式。
- 数据操纵:指对数据库中各类对象实例所允许执行的操作集合,包括查询、插入、删除、更新等操作及其相关规则。
- 完整性约束:是一组关于数据及其联系的制约条件与依赖规则,用以确保数据库的状态及其变化过程符合预设的语义要求。
层次模型的定义及实际应用示例
在数据库领域,若一组基本的层次联系满足如下两个条件,则被称为层次模型:
- 有且仅有一个节点没有父节点,该节点称为根节点。
- 除根节点外的所有其他节点都有且仅有一个父节点。
网状模型的定义及相关实例
当数据库中的基本联系集合满足下列两个特征时,即构成网状模型:
- 允许存在一个以上的节点无父节点。
- 任一节点可拥有多个父节点。
以下是几个典型的网状模型应用场景:
- 学生-宿舍-系:每位学生既隶属于某个系,也居住于某一宿舍;而一个宿舍可容纳多名学生,一个系也可包含多名学生。因此,宿舍和系均为学生的双亲节点。
- 教师-教研室-学生:教师属于某教研室(一个教研室有多名教师),同时指导若干学生;学生可能接受多位教师指导,并通过其导师间接关联到相应的教研室。
- 航空公司-航线-城市:每条航线归属于一家航空公司(一家公司可运营多条航线),并连接两个城市——出发地与目的地;同一城市可作为多条航线的起点或终点。因此,航线的双亲节点包括航空公司、出发城市和终到城市。
层次模型与网状模型的优劣分析
层次模型的优势:
- 结构清晰简洁,易于理解和实现。
- 在查询处理方面具有较高的执行效率。
- 能够有效支持数据完整性的维护机制。
层次模型的局限性:
- 无法自然表达非层次性的现实联系,如多对多关系。
- 所有查询必须从根节点开始沿路径逐层访问,要求用户熟悉数据库的整体层次结构,使用门槛较高。
网状模型的优点:
- 能更真实地反映现实世界的复杂关系,例如一个节点可有多个父节点,便于表达多对多联系。
- 具备良好的数据存取性能,响应速度快。
网状模型的不足之处:
- 随着应用规模扩大,整体结构趋于复杂,不利于普通用户掌握。
- 其数据定义语言(DDL)和数据操纵语言(DML)较为繁琐,通常需嵌入高级编程语言中使用,学习和操作难度较大。
关系模型的核心概念及相关术语解析
关系模型由三大部分组成:关系数据结构、关系操作集合以及关系完整性约束。从用户视角来看,其逻辑结构表现为一张二维表格,由行和列构成。
以下是对关键术语的定义与说明:
- 关系:指代一张二维表,每个关系代表一个数据集合。
- 属性:表中的一列表示一个属性,每个属性具有唯一的名称。
- 域:指某一属性的取值范围,例如“性别”属性的域为{男, 女}。
- 元组:表中的一行称为一个元组,对应现实世界中的一个具体实体。
- 码:能够唯一标识一个元组的单个属性或属性组合,例如“学生表”中的“学号”。
- 分量:指元组中某一属性的具体取值,如某学生记录中“姓名”字段的值“张三”。
- 关系模式:是对关系结构的描述,通常写作“关系名(属性1, 属性2, ..., 属性n)”,例如“学生(学号, 姓名, 性别, 年龄, 专业)”。
关系模型的优缺点探讨
优点:
- 建立在严格的数学基础之上(如集合论与关系代数),理论体系严密。
- 模型概念统一,仅使用二维表表示数据,结构简单明了,便于用户理解与使用。
- 数据的物理存储路径对用户透明,用户无需关心底层实现细节,提升了使用的便捷性。
缺点:
- 由于存取路径被隐藏,为了提升查询效率,关系数据库管理系统(RDBMS)必须对用户的查询进行优化处理,这显著增加了系统开发的技术难度。
数据库系统的三级模式架构及其优势
数据库系统采用三级模式结构,分别为:
- 外模式:又称子模式或用户模式,是用户所能看见和使用的局部数据的逻辑结构和特征描述,体现为用户的数据视图。一个数据库可以拥有多个外模式。
- 模式:亦称逻辑模式,是对数据库中全部数据的整体逻辑结构和特征的描述,是所有用户的公共数据视图。一个数据库仅有一个模式,外模式通常是模式的一个子集。
数据库系统的三级模式结构是数据库设计中的核心框架,其包括外模式、模式和内模式。其中,内模式,也被称为存储模式,是对数据在数据库中物理结构与存储方式的具体描述,反映了数据在存储介质上的组织形式。每个数据库仅存在一个内模式,它是数据存储的最底层表示。
在三级模式之间,数据库系统提供了两级映像机制:一是外模式/模式映像,二是模式/内模式映像。这两层映像的存在,为数据库带来了较高的独立性保障。[此处为图片1]
数据与程序的逻辑独立性与物理独立性
(1)逻辑独立性
当数据库的数据逻辑结构(即模式)发生变化时,数据库管理员只需调整相应的外模式与模式之间的映像关系,即可保持外模式不变。这样一来,依赖于外模式的应用程序无需修改,从而实现了数据与程序之间的逻辑独立性。
(2)物理独立性
当数据库的物理存储结构(即内模式)发生变更时,通过调整模式与内模式之间的映像,可以确保整体逻辑模式不受影响。因此,应用程序仍可正常运行而无需重新编写或调整,这便是数据与程序的物理独立性。
(3)独立性的实现原因
数据库系统之所以能够实现上述两种独立性,关键在于DBMS所提供的两级映像机制。这些映像起到了中间桥梁的作用,在某一层模式发生变化时,可通过调节映像来维持其他层级的稳定性,避免对上层应用造成影响,从而有效解耦数据与程序,降低维护成本。
数据库系统的组成结构
一个完整的数据库系统通常由以下几个部分构成:数据库本身、数据库管理系统(DBMS),以及配套的应用开发工具、具体的应用系统,还有负责整个系统管理与维护的数据库管理员(DBA)。
补充习题解析
1. 选择题
题目
- 数据库系统的核心和基础是( )。
A. 物理模型 B. 概念模型 C. 数据模型 D. 逻辑模型 - 实现将现实世界抽象为信息世界的是( )。
A. 物理模型 B. 概念模型 C. 关系模型 D. 逻辑模型 - 数据管理技术经历了若干阶段,其中人工管理阶段和文件系统阶段相比,文件系统的一个显著优势是( )。
A. 数据可以长期保存 B. 数据共享性很强 C. 数据独立性很好 D. 数据整体结构化 - 能够保证数据库系统中的数据具有较高逻辑独立性的是( )。
A. 外模式/模式映像 B. 模式 C. 模式/内模式映像 D. 外模式 - IBM公司的IMS数据库管理系统采用的数据模型是( )。
A. 层次模型 B. 网状模型 C. 关系模型 D. 面向对象模型 - DBMS是一类系统软件,它建立在下列哪种系统之上?( )。
A. 应用系统 B. 编译系统 C. 操作系统 D. 硬件系统 - 关于网状数据库,以下说法正确的是( )。
A. 只有一个结点可以无双亲结点 B. 一个结点可以有多于一个的双亲结点
C. 两个结点之间只能有一种联系 D. 每个结点有且只有一个双亲结点 - 下列说法中,正确的是( )。
A. 数据库的概念模型与具体的DBMS有关 B. 三级模式中描述全体数据的逻辑结构和特征的是外模式
C. 数据库管理员负责设计和编写应用系统的程序模块 D. 从逻辑模型到物理模型的转换一般是由DBMS完成的 - 长期存储在计算机内,有组织的、可共享的大量数据的集合是( )。
A. 数据(Data) B. 数据库(DataBase) C. 数据库管理系统(DBMS) D. 数据库系统(DBS) - 在数据管理技术发展过程中,需要应用程序管理数据的是( )。
A. 人工管理阶段 B. 人工管理阶段和文件系统阶段
C. 文件系统阶段和数据库系统阶段 D. 数据库系统阶段
答案
| 题号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|---|---|---|---|---|
| 答案 | C | B | A | A | A | C | B | D | B | A |
[此处为图片2]
2. 判断题
题目
- 在文件系统管理阶段,由文件系统提供数据存取方法,所以数据已经达到很强的独立性。( )
- 通常情况下,外模式是模式的子集。( )
- 数据库管理系统是指在计算机系统中引入数据库后的系统,一般由DB、DBS、应用系统和DBA组成。( )
- 在数据模型的组成要素中,数据结构是刻画一个数据模型性质的最重要的方面,人们通常按照数据结构的类型来命名数据模型。( )
- 数据库系统的三级模式是对数据进行抽象的三个级别,把数据的具体组织留给DBMS管理。( )
- 层次模型是比网状模型更具普遍性的结构,网状模型是层次模型的一个特例。( )
答案
| 题号 | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| 答案 | × | √ | × | √ | √ | × |
3. 填空题
题目
- 数据模型按照计算机的观点对数据建模,主要的数据模型包括______、______、______、面向对象模型、对象关系模型和半结构化数据模型等。
- 最经常使用的概念模型是______。
- 数据独立性是数据库领域的重要概念,包括数据的______独立性和数据的______独立性。
- 数据库系统的三级模式结构是指数据库系统是由______、______和______三级构成。
- 两个实体型之间的联系可以分为三种:一对一联系、______和______。
[此处为图片3]
(6)数据库管理系统在数据控制方面所提供的功能主要包括安全性、完整性、并发控制以及数据库恢复。
(7)在数据库的三级模式体系结构中,用于描述局部数据逻辑结构和特征的是外模式。
(8)层次模型与网状模型中的基本单位是层次联系,指的是两个记录(型)之间的一对多联系(包含一对一的情况)。
(9)数据模型的构成要素中,反映系统静态特性的为数据结构,体现动态特性的则是数据操纵。
[此处为图片1]
(1)在数据管理的不同阶段,“数据独立性”的内涵存在明显差异:
在文件系统阶段,“数据独立性”主要指设备独立性。程序通过文件名访问数据,不依赖具体的物理存储设备(如磁盘或U盘),但若文件内部结构(如字段顺序、格式)发生变化,程序仍需相应调整。
而在数据库系统阶段,数据独立性被细分为物理独立性和逻辑独立性。物理独立性意味着应用程序不受数据物理存储方式(如存储路径、文件组织形式)变化的影响;逻辑独立性则保证当数据的整体逻辑结构(如模式定义、字段类型)发生改变时,应用程序可以保持不变。
(2)采用文件系统进行数据管理存在以下主要缺点:
- 数据共享能力弱,冗余度高:每个应用通常拥有独立的数据文件,导致相同数据在多个系统中重复存储,不仅浪费空间,还容易引发数据不一致问题。
- 数据独立性低:一旦数据的逻辑结构发生变更,相关应用程序必须随之修改;此外,若数据的物理存放位置变动,也可能需要调整程序中的文件路径配置。
[此处为图片2]


雷达卡


京公网安备 11010802022788号







