数据库知识基本概念

最近在学习数据库原理与应用,自己理解着整理出了一些基础的概念,有不同意见可以留言讨论:

  • 数据和信息
  • 数据库系统的组成
  • 数据管理技术的发展阶段
  • 数据库系统的发展过程和发展趋势
  • 数据模型
  • 关系模型
  • 实体一联系模型
  • 其他数据模型
  • 数据库内部体系结构
  • MySQL简介
  • powerdesigner的简介

思维导图

数据库思维导图

数据库的基本概念

1.信息

信息来源于数据,是一种被加工为特定形式的数据,它相对于使用者是有意义、有价值的。例如一个销售主管除非得到由这些数据加工处理后的概要汇总,否则计算机打印出包括大约252518个客户的1000页数据对他也并没有多少价值。(见表1-1)

年龄分布25岁以下25~30岁31~40岁41~50岁51~60岁60岁以上总计
208713389425778183391509214396128430
229473004924115192431673111003124088
总计438186394349893376423182625399252518

表1-1 客户性别与年龄交叉表


2.数据

数据是现实生活中一种抽象的表示符号,包括数据内容和数据形式,一个数据表示一个事实,数据是能够被记录并具有固定的意义,从中我们可以提取出对我们有价值的信息。
例如,我们来考虑这样的事实,作为M/s Elbee公司的经理,我们感兴趣的可能是雇员Thomas Mathew,我们希望记住他的雇员号是106519,他的基本工资是每月2 000 000Rs.(4000美元),他所在的城市是Jamshedpur,他所在的国家是印度,他的出生Et期是1957年9月6日,他的结婚纪念日是5月29日,他的电话号码是0091.657-2431322,等等。我们知道这些事实是为了每月处理Mathew的工资单,在生日和结婚纪念日发贺卡给他,打印他的工资条,万一遇到紧急情况通知他的家人,等等。显然,收集所有有关Mathew的事实(或数据),并将它们保存在一起确实是很有道理的。表1-2显示了有关Thomas Mathew的工资单和其他相关情况的所有信息。(见表1-2)

Employee NumberEmployee Last NameEmployee First NameBasic Salary(US $)Home TownHome CountryDate of BirthMarriage AnniversaryTelephone Number
106519MathewThomas4000JamshedpurIndia06-09-195729.050091-657-2431322

表1-2 Thomas Mathew的工资单事实


3.数据与信息的关系

数据与信息是密不可分的,数据是信息的具体表示形式,而信息是数据所包含的意义,信息可用不同的数据形式来表现,信息不随数据的表现形式而改变。例如:2017年10月10日与2017-10-10。

数据库系统的组成

1.数据库

数据库(DataBase,DB)指数据的集合,数据的存储独立于使用它的程序,结构化的存放数据可以完全地或部分地消除了数据的冗余。例如,一个部门可能同时有职工文件(职工号、姓名、地址、部门、工资等)和业务档案文件(职工号、姓名、部门、完成项目、评价等),在这两个文件中存在有一定的重复数据(如职工号、姓名、部门)。在构造数据库时,就可以只存储一套数据,消除职工号、姓名、部门这3项数据的冗余。数据库中的数据能为用户共享。

2.数据库管理系统

数据库管理系统简称DBMS,由相互关联的数据集合以及一组用于访问这些数据的程序组成,是一种负责数据库的定义、建立、操作、管理和维护的系统管理软件。主要目标是为人们提供方便高效的环境来存储和检索数据。

3.数据库管理员

数据库管理员(DataBase Administrator,DBA)是负责设计、建立、管理和维护数据库的人员。

4.用户

用户是数据库系统的服务对象,是使用数据库系统者,一般可分为两类:终端用户和应用程序员。

5.数据库应用系统

数据库应用系统简写DBAS,指在数据库管理系统(DBMS)支持下建立的计算机应用系统,是由数据库系统、应用程序系统、用户组成的。

数据管理技术的发展阶段

1.人工管理阶段

人工管理阶段没有操作系统及数据管理的软件,对数据的管理均是手工操作。
本阶段有如下特点:
(1)数据不能长期保存;
(2)应用程序负责管理数据;
(3)数据不能共享;
(4)数据没有独立性。

2.文件系统阶段

在文件系统阶段,出现了操作系统,并带有专门的数据管理软件(即文件系统),对数据的处理不仅使用手工操作,而且能够联机实时处理。此时各种用途的应用程序仍然具有各自的数据,数据仍然具有两种形式,即用户看到的逻辑结构(称为逻辑文件)和实际存储的物理结构(称为物理文件)。但此时逻辑文件和物理文件之间已允许有所区别,文件管理系统提供从逻辑文件到物理文件的转换。
本阶段有如下特点:
(1)数据能够长期保存;
(2)文件系统负责管理数据;
(3)数据可以共享,但冗余较大;
(4)数据具有独立性,但独立程度一般。

3.数据库系统阶段

20世纪60年代末发生了对数据库技术有着奠基作用的3件大事,标志着以数据库系统为基本手段的数据管理阶段的开始。
(1)1968年美国的IBM公司推出了世界上第一个数据库管理系统IMS,它是基于层次模型的。
(2)1969年美国数据系统语言协会(CODASYL)的数据库任务组(DBTG)发表了网状数据模型的DBTG报告。
(3)1970年美国IBM公司的高级研究员E.F.Codd连续发表论文,提出了关系数据模型,奠定了关系数据库的理论基础。以数据库为中心的数据库系统,是当代数据管理的主要方式。它克服了文件系统的弊病,是一种较完善的高级数据管理方式,获得了广泛的应用。
这个阶段有如下特点 :
(1)整体数据结构化;
(2)数据库管理系统统一管理和控制数据;
(3)数据共享性高,且冗余较小;
(4)数据独立性高。

数据库系统的发展过程和发展趋势

1.人机交互阶段

1969年,美国IBM公司研制了世界上第一个数据库管理系统IMS(Information Management System),IMS的数据模型是层次结构的;美国CODASYL委员会(Conference On Data System Language)的DBTG(Data Base Tast Group)小组对数据库方法进行了系统的研究、讨论,于60年代末至70年代初公布了若干研究报告,称为DBTG报告,它所提议的方法是基于网状结构的;1970年IBM公司的研究员E.F.Codd博士发表了题为“大型共享数据库数据的关系模型”的著名论文,提出了数据库的关系模型,开创了数据库关系方法和关系数据理论的研究,为数据库技术奠定了理论基础,被公认为是数据库发展历史上的一个重要里程碑。由于E.F.Codd的杰出工作,他于1981年获得了ACM图灵奖。这三大事件标志着数据处理已进入了数据库技术的新时代。

2.应用捆绑阶段

20世纪70年代以后,计算机中的应用系统发展很快,它们在商业、企业管理等事务处理领域成为应用主流,此时将应用程序与数据库系统捆绑而构成一种完整的数据库应用系统已成为当时之必须,这就出现了应用程序与数据库间的数据交互过程。

3.网络阶段

20世纪90年代开始数据库系统的应用环境进入网络时代,出现了分布式系统与C/S结构模型在集中式数据库应用系统中整个系统捆绑于一起,而实际上一个完整的应用程序有下面三个部分:
·存储逻辑部分包括DBMS及相应的数据存储;
·应用逻辑部分包括由算法语言所编写的数据处理业务流程;
·表示逻辑部分是用于与用户交互可视化编程,它包括图形用户界面(GⅥ)等。
在C/S结构模式中,由一个服务器S(server)与多个客户机C(client)所组成,它们间由网络相连并通过接口进行交互。

4.因特网阶段

2l世纪初,因特网的普及应用及W-eb的发展,从而出现了B/S结构、XML语言及脚本语言。在Web数据库中一般使用典型的三层结构B/S模式,在这个结构中,由浏览器、Web服务器及数据库服务器三部分组成。

数据模型

1.数据模型的概念

数据模型是数据库的基础,是描述数据、数据联系、数据语义以及一致性约束的概念工具的集合。现有数据模型可分为三类:基于对象的逻辑模型、基于记录的逻辑模型和物理模型。

2.实体一联系模型

实体-联系模型简称E-R,是Peter Chen于1976年提出的一种语义模型,是基于对现实世界的这样一种认识:现实世界由一组称作实体的基本对象以及这些对象闻的联系构成。 E—R模型主要包含三个要素:实体、属性和联系。

3关系模型

关系模型(Relational Schema)的发展较晚,是20世纪70年代初由mM公司的E.F.Codd首先提出。关系模型是完全不同于前两种模型的一种新的模型,它的基础不是图而是表格。用表的集合来表示数据和数据间的联系,每个表有多个列,每列有惟一的列名。图1是一个示例的关系数据库,其中包括三个表:一个表中是银行客户的详细信息,第二个表中是客户账户信息,第三个表中是账户与客户之间对应的信息。
关系数据库的例子
图1关系数据库的一个例子
表a)customer 表b)account 表c)deopsitor表

4.关系模型的特点:

(1)描述的一致性。无论是信息世界中的实体还是联系都是用一个关系来描述,保证了数据操作语言相应的一致性,对于每一种基本操作功能(插入、删除、修改等),都只需要一种操作运算即可。
(2)利用公共属性连接。关系模型中各个关系之间都是通过公共属性发生联系的。例如学生关系和选课关系是通过公共属性“学号”连接在一起,而选课关系又可以通过“课程号”与课程关系发生联系。
(3)结构简单直观。采用表结构,用户容易理解,有利于和用户进行交互,并且在计算机中实现也极为方便。
(4)有严格的理论基础。二维表的数学基础是关系数据理论,对二维表进行的数据操作相当于在关系理论中对关系进行运算。这样,在关系模型中整个模型的定义与操作均建立在严格的数学理论基础上。
(5)语言表达简练。在进行数据库查询时,不必像前两种模型那样需要事先规定路径,而用严密的关系运算表达式来描述查询,从而使查询语句的表达非常简单直观。
(6)关系模型的概念单一。在关系模型中,无论是实体还是实体之间的联系都用关系来表示。
(7)关系必须是规范化的关系。所谓规范化是指关系模型中,每一个关系模式要满足一定的要求或者称为规范条件。

5.其他数据模型

(1)层次模型(Hierarchical Model),的设计思想是把系统划分成若干小部分,然后,再按照层次结构逐级组合成一个整体。图2描述了这种分层结构的构造方法,其结构类似于“倒置树”。层次模型的构造方法
图2 层次模型的构造方法

层次模型的特点如下:
①有且仅有一个结点,无父结点,此结点是根结点,例如,在大学数据模型中的校长;
②其他结点有且仅有一个父结点,如校长下属的学院院长,他们的父结点就是大学校长;
③适合于表示一对多的联系,如一个校长下属若干院长。

(2)网状模型(Network Model),指用网状结构表示实体及其之间联系的模型,是以记录类型为节点的网络结构,网络模型的特点是一个子节点可以有两个或多个父节点,可以有一个以上的节点无父节点,在两个节点之间可以有两种或多种联系。图3表示了一个网状模型的结构。
网状模型
图3 网状模型

数据库内部体系结构

一个数据库系统的体系结构在很大程度上受到计算机系统的组成结构的影响。数据库系统的结构分为三级,由外模式、模式和内模式组成,如图4所示。
数据库的结构示意图
图4数据库的结构示意图

1.内模式又称存储模式,具体描述了数据是如何组织、存储在存储介质上的,是系统程序员用一定的文件形式组织起来的存储文件和联系手段。所以内模式又称为系统程序员视图,只有内模式才是真正存储数据的。
2.模式又称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
3.外模式通常是模式的一个子集,又称为子模式。外模式面向的是用户,是用户眼中的数据库,所以外模式又称为用户视图。

MySQL简介

MySQL是一个小型关系数据库管理系统,它由一个服务器守护程序mysqld和很多不同的客户程序和库组成。它的规模小、功能有限,但是它体积小、速度快、成本低,且它提供的功能对稍微复杂的应用来说已经够用,这些特性使得MySQL成为世界上最受欢迎的开放源代码数据库。

PowerDesigner简介

PowerDesigner是Sybase公司一个功能强大而使用简单的的CASE工具集(ComputerAided Software—CASE),使用它可以方便地对管理信息系统进行分析设计,它几乎包括了数据库模型设计的全过程。利用PowerDes igner可以制作数据流程图、概念数据模型、物理数据模型,可以生成多种客户端开发工具的应用程序,还可为数据仓库制作结构模型,也能对团队设计模型进行控制。

目录

Logo

更多推荐