关系型和后关系型数据库的演变与发展
随着信息技术的发展,采用两维表结构的数据库,已经无法保存大量的多媒体非结构化复杂数据,以及各类数据之间的关系。关系型数据库亟待突破。 信息技术平台的选择常常是建立或重新建立应用系统时的关键问题,而数据库正是其中需要做出选择的关键平台。 关系数据库管理系统曾处于技术主流而独领风骚,但是这种传统的数据库管理系统因采用两维数据模型,而存在着本身固有的约束和限制。难以适应当今迅速变化的业务需求,以及新技术发展。
关系型数据库的局限
随着信息技术的飞速发展,数据处理不仅在数量上要求越来越大,而且在质量上也要求越来越高,数据库所管理的数据已经发生了根本的变化。这一变化给数据库技术带来了巨大挑战,数据库管理的对象已不再仅限于文本数据等简单的数据类型,而需要描述和保存大量多媒体非结构化的复杂数据,以及数据间的关系。 此外,随着热门网站访问数量的激增,对数据库本身的存储机制、大量并发用户的使用需求、存储空间的使用效率、以及数据的完整性和安全性等方面都提出了更高要求。而这些都不是传统关系数据库中,使用二维表简单结构就可以满足的。 关系型数据库依据的是把数据表示为简单的两维模型,即表示为行与列的记录来进行存储处理。显然由于受到当时条件的限制,只是一种适合于对简单数据存储处理的技术,存在难以克服的局限性。 关系型数据库管理系统本身固有的局限性,表现在以下三个方面:
数据模型上的限制
关系数据库所采用的两维表数据模型,不能有效地处理在大多数事务处理应用中,典型存在的多维数据。其不可避免的结果是,在复杂方式下,相互作用表的数量激增,而且还不能很好地提供模拟现实数据关系的模型。 关系数据库由于其所用数据模型较多,还可能造成存储空间的海量增加和大量浪费,并且会导致系统的响应性能不断下降。而且,在现实数据中,有许多类型是关系数据库不能较好地处理的。
性能上的限制
为静态应用例如报表生成,而设计的关系型数据库管理系统,并没有经过针对高效事务处理而进行的优化过程。其结果往往是某些关系型数据库产品,在对GUI和Web的事务处理过程中,没有达到预期的效果。除非增加更多的硬件投资,但这并不能从根本上解决问题。 用关系数据库的两维表数据模型,可以处理在大多数事务处理应用中的典型多维数据,但其结果往往是建立和使用大量的数据表格,仍很难建立起能模拟现实世界的数据模型。并且在数据需要作报表输出时,又要反过来将已分散设置的大量的两维数据表,再利用索引等技术进行表的连接后,才能找到全部所需的数据,而这又势必影响到应用系统的响应速度。
扩展伸缩性上的限制
关系数据库技术在有效支持应用和数据复杂性上的能力是受限制的。关系数据库原先依据的规范化设计方法,对于复杂事务处理数据库系统的设计和性能优化来说,已经无能为力。此外,高昂的开发和维护费用也让企业难以承受。 除此之外,关系数据库的检索策略,如复合索引和并发锁定技术,在使用上会造成复杂性和局限性。
后关系型数据库浮出水面
随着信息技术的发展,在用关系数据库数据模型来处理复杂的数据类型、复杂的数据关系以及多种访问方法上,仍存在着诸多的能力限制。 虽然传统的关系数据库能很好地适合于处理相对简单的事务交易,但是却不能胜任来自不同表格的数据的处理。更多的数据库应用开发者认识到了关系数据库的限制,并开始寻找适合的替代方案。 但变革并不是很容易就可以实现的。在原有的两维表数据模型架构上,增加其它的功能并不能解决问题,有的开始尝试网络化的解决方案。 例如对于前几年出现的通用数据库和对象-关系数据库解决方案,专家们认为这些所谓的通用数据库,以及企图在关系数据库架构上,再增加一层对象层的对象-关系数据库,仍然是把关系数据库引擎作为它们的核心,而且通过所加的对象层,访问数据时,还需要进行转换映射。 因此,国外的一些专家们也指出:靠增加一些模块到
一个已经很复杂的关系数据库上去的途径,并不能从根本上解决问题。 我们知道,数据库技术的一个基本目标就是要找到一个恰当的数据模型来表达它所管理的对象。为了解决用关系数据库不能有效表达和管理复杂数据的问题,我们必须寻求更好的、采用更适合管理复杂数据的数据模型,来适应新的变化。 一种更新的被誉为数据库新分水岭的后关系型数据库管理系统(Post-Relational Database,PRDBMS)逐渐出现并兴起,成为取代传统关系数据库的途径之一。 在脱颖而出的后关系型数据库管理系统中,采用了更现代化的多维模型,作为数据库引擎。并且,这种以稀疏数组为基础的独特的多维数据库架构,是从已成为国际标准的数据库语言基础上继承和发展的,是已积累了实践经验的先进而可靠的技术。 后关系型数据库提供了一种实际可行的解决方案,能够更加适合当前用户的真实需要。用对象访问方式或者用SQL方式,可以直接实现对数据的访问。
数据库技术演变阶段
从数据库发展历程来看,数据库技术的演变可划分为如下几个阶段:
以技术为中心
在二十世纪七十年代,数据库的实现方案都把注意力集中在能提供联机的对信息的访问技术,着眼于获得处理效率,并尽可能最少使用价格昂贵的计算机硬件。 那时,能够为特殊硬件平台优化的那些由厂商专卖的即非开放式的数据库,是早期阶段用户唯一可能做出的选择。 以用户为中心
二十世纪八十年代,硬件价格下降和个人计算机逐步普及,用户的信息需求显著上升,应用软件的开发生产效率成为关键的成功因素。 带有易于理解的、简单的、两维数据模型的关系型数据库管理系统,成为服务于用户查询和满足这类需求的大量报表生成的基础,并得到了广泛采用。
以网络为中心
进入二十世纪九十年代后,大量图形化用户界面被应用系统普遍采用,而且Internet得到了迅猛发展,应用系统的架构从采用C/S结构转变为以.Web应用为主的处理阶段。 随着经济向全球化发展,现代化企业为了要在竞争中取得成功,它们的业务活动已经和日益增加的复杂事务交易应用紧密地联系在一起。 企业级的运作活动已涉及巨大数量的数据的采集和利用,越是有能力将更多的用户连接到更多的应用系统功能上去,就越能取得更大的、竞争上的优势。 以往的关系数据库系统本身具有的限制,使它难以适应建立以网络为中心的、企业级快速事务交易处理应用的需求,而后关系型数据库技术能为网络为中心环境提供所需的性能、扩展性、互操作性和安全性。