数据管理阶段
计算机数据管理技术经历了人工管理、文件系统、数据库系统等3 个阶段。
人工管理阶段
20世纪50年代以前,人工管理阶段计算机主要用于数值计算。硬件方面外存只有纸带、卡片、磁带,没有直接存取设备;软件方面没有操作系统以及管理数据的软件。人工管理数据具有以下特点:
- 数据不保存。计算机主要用于科学计算,一般不需要保存数据。计算时将数据输入,计算后将结果数据输出。
- 数据由程序管理。数据需要由应用程序自己管理,没有相应的软件系统负责数据的管理工作。程序和数据是一体的,在编写程序时要定义数据的逻辑结构、存储结构、存取方法、输入方式等。
- 数据不共享。由于程序和数据是一体的,所以一组数据只能对应一个程序。程序之间数据不能共享,因此程序与程序之间存在大量的数据冗余。
- 数据不具有独立性。数据的逻辑结构或物理结构发生变化后,必须对应用程序作相应的修改,这就进一步加重了程序员的负担。
文件系统阶段
20世纪50年代后期到60年代中期,文件系统阶段硬件方面已有了磁盘、磁鼓等直接存取存储设备;软件方面操作系统中己经有了专门的数据管理软件,称为文件系统;处理方式上不仅有了批处理,而且能够联机实时处理。用文件系统管理数据具有如下特点:
-
数据可以长期保存。由于硬件有了存储设备,所以数据可以长期保留在外存上反复进行查询、修改、插入和删除等操作。
-
由文件系统管理数据。数据有了专门的管理软件即文件系统进行管理,可以以文件的形式单独进行存储,程序和数据之间由文件系统提供存取方法进行转换,具有了一定的独立性。数据文件内部有局部的数据结构,即记录结构,但整体无结构。
-
数据共享性差,冗余度大。在文件系统中,数据文件是按应用程序的需要建立起来的,和应用程序的算法密切相关,很难被其他应用程序使用,所以共享性差,冗余度大。
-
数据独立性差。由于数据文件和应用程序之间存在密切的联系,所以无论哪一部分修改,都要影响到另一部分,数据独立性差。
数据库系统阶段
20世纪60年代后期至今,在数据库系统阶段,计算机开始广泛地应用于数据管理,人们对数据共享的要求越来越高。共享是指多种应用、多种语言互相覆盖地共享数据集合。数据量越大,管理规模越大,共享性也就越强。与此同时,联机实时处理的需求增加,人们开始考虑分布处理。大容量磁盘的出现使得硬件价格下降,软件价格相对上升,编制和维护系统软件及应用程序所需的费用相对增加。因此,传统的文件系统已经不能满足人们的需要,能够统一管理和共享数据的数据库管理系统应运而生。
数据库系统阶段是数据管理的最高级阶段,从文件系统到数据库系统,标志着数据管理技术的飞跃。
数据库系统的特点
-
数据结构化。数据结构化是数据库系统与文件系统的根本区别。文件系统尽管数据文件内部记录具有局部的结构,但记录之间无联系,整体无结构,通常是面向一个应用建立起来的;而数据库是按照某种数据模型,面向多个应用建立起来的,它不但可以描述记录内部的结构,还可以描述记录之间的联系,具有整体的结构性。
-
数据的共享性高,冗余度低。数据库系统是面向系统内外所有用户建立起来的,从整体角度看待和描述数据,因此可被系统内外所有用户使用,共享性高,同时也减少了冗余,避免数据之间的不相容性与不一致性。
-
数据独立性。数据独立性是数据库领域中一个常用术语,包括数据的物理独立性和数据的逻辑独立性。物理独立性是指当数据库中数据在磁盘上的存储结构或位置发生变化时,应用程序不用改变;逻辑独立性是指数据库的逻辑结构发生变化时,用户程序不用改变。数据与程序的独立,把数据的定义从程序中分离出去,加上数据的存取又由 DBMS 负责,从而简化了应用程序的编制,大大减少了应用程序的维护和修改难度。
-
数据由 DBMS 统一管理和控制。数据的统一管理与控制包括数据的安全性保护、数据的完整性检查、并发控制和数据库恢复4 个方面。
DBMS 能统一管理和控制数据库的建立、运行和维护,使用户能方便地定义数据和操作数据,并能够保证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复。