网络编程
位置:首页>> 网络编程>> 数据库>> 使用SQL Server 2008管理非结构化数据

使用SQL Server 2008管理非结构化数据

作者:陈麟  发布时间:2009-01-08 15:28:00 

标签:

这篇论坛文章详细的讲解了使用SQL Server 2008管理非结构化数据的具体方法,更多内容请参考下文:

microsoft SQL Server™ 2008提供了一个灵活的解决方案,使得可以存储非结构化数据,并将它与关系数据合并起来建立使用整个公司范围内的数据的综合的解决方案。

1. 导言

在最近几年,个人和公司创建和存储的数字数据的数量急剧膨胀。过去,企业使用计算机系统和数据库以结构化格式例如关系表或固定的格式文档来存储它们的大部分商业数据,软件应用程序使用这些结构化数据存储来执行商业操作。然而在现今,公司的很大一部分数据是存储在使用功能强大的工具例如Microsoft® Office Excel®和Microsoft Office Word所创建的文档中的,而数字摄影、文档扫描、视频产品和音频格式进一步的扩大了用于商业数据的非结构化数据格式的范围。此外,在存储硬件和内存上的成本的显著降低极大的影响了存储在计算机中的数据的数量和类型,并导致产生了新一代的商业应用,这些商业应用合并了传统的关系数据结构和非结构化数字内容。数字内容的丰富意味着公司现在正在试图能够在企业范围内管理关系数据和非结构化数据,并需要一个能够全面满足关系数据存储和非关系数据存储,同时降低管理和建立使用这些数据的应用程序的成本的解决方案。

例如,考虑一个保险索赔应用程序在过去的15年里是怎样改变的。15年前,这个应用程序一般维护一列以简单的行和列来存储的保险索赔记录。而今天,一个保险索赔应用程序更趋向于管理一组包括图片、照片和文档的索赔记录。它还可能需要以基于XML的格式来显示索赔数据,以此来与其它的系统集成,并且它还可能包括更高级别的功能像空间可视化、报表和分析。

SQL Server 2008提供了一些超出传统的数据库系统、向能够存储、管理和查询所有类型的数据的数据平台发展的功能;包括非结构化二进制数据、XML和空间数据。这篇白皮书集中讲述了非结构化数据,并描述了使用SQL Server 2008的存储、管理和使用非结构化数据的选项。

2. 商业推动非结构化数据

大多数公司依赖于存储在数据库中的关键业务数据,并在存储和操纵这些数据的数据管理系统和应用上投入很大。然而,日渐增长的业务产生了大量的数字图片、文档视频和其它多媒体格式的非关系和非结构化数据——这些新的数据格式迅速成为正式的和非正式的商业处理的一个关键组成部分,它们与现有的商业应用程序集成在一起,遵守调整要求,或者简单的提供了一个更加丰富的用户体验。

例如,在下面这些商业情景中:

· 一个保险公司需要存储政策文档和按照要求处理来提取这些文档。

· 一个在线的零售商需要存储用于在一个电子商城中显示它的产品的视频胶片。

· 一个电话系统需要保存语音信息的音频流以便他们可以远程传送。

· 一个广播台需要制作一个在它的网站上用于下载的并可以搜索的广播库。

· 一个操作需要存储文档的图片形式的电子拷贝,并能很容易的获取与一个单独的客户端或例子相关的文档。

· 一个建筑合伙企业需要存储和提取数字计划和其相关联的客户端数据。

· 一个需要转换和保存大量的现有的文件和分类内容的库,用于在一个数字搜索工具中进行检索和使用。

这些是全球商业中使用的非机构化数字数据的一些新的例子;并且随着创建数字内容变得越来越容易,公司也在寻找新的创新方式来使用这个数字内容来改进或扩展它们的商业能力。

2.1 对于非结构化数据的挑战

当新的非结构化数据的类型在不断增加的同时,数字内容带来了很多好处和商业机遇,但是它同时还带来了一些针对需要合并这些非结构化数据源到计算机应用程序和服务中去的系统架构师、管理员和应用程序开发人员的挑战。

存储非结构化数据的挑战

要考虑的第一个挑战,同时也可能是最明显的挑战,就是非结构化数据的大量存储。你值得拥有一个使你可以灵活地满足存储非关系数据、同时将成本和管理费用降低到最小的特定需求的系统。当你计划存储非结构化数据时你要考虑的主要问题包括:

· 存储你的非结构化数据的成本,不只是包括硬件成本,还包括管理成本。

· 非结构化数据的物理存储位置,例如文件服务器和网络附加存储(NAS)设备。

· 管理持久力和存档政策。

· 将非结构化数据文件和相关联的关系数据集成起来,并维护结构化数据源和非结构化数据源间的事务一致性。

· 将与维护关系数据和非结构化数据相关的管理费用降低到最小。

· 性能和可扩展性。.

· 保护非结构化数据,并确保相关的关系数据的一致性。

· 非结构化数据的可用性和可恢复性。

使用非结构化数据的挑战

还有关于存储非结构化数据的相关问题,你必须考虑数据将怎样被你公司的应用程序使用。一些具有代表性的要考虑的事项包括:

· 在建立使用结构化数据和非结构化数据的应用程序时遇到的开发挑战包括编写代码来创建、提取、更新和删除非结构化数据,并维护相关联的关系数据源和非结构化数据源间的事务一致性。

· 索引和搜索非结构化数据。

· 显式提取可用的元数据(例如从表格区域或文件属性),并将它显示给用户。

· 将文档内容转换为可以搜索和查询的格式(例如,转换音频文件到文本形式,从而可以被数据库查询或纯文本引擎检索到。)

2.2 在SQL Server 2008中的非结构化数据的目标

非结构化数据面临的相关挑战反应了那些开始为数字内容建立解决方案的公司所关注的一些常见情况:

· 管理多个不同的平台来处理关系数据和非关系数据,从而导致不必要的复杂性。

· 这些分散的数据存储使得对于开发人员来说增加了复杂度,并提高了经理的部署难度。

· 开发人员和数据库管理员缺乏在这些不同的数据类型中可以使用的服务。

SQL Server 2008旨在解决这些问题,通过:

· 降低管理这些不同的数据类型的成本。

· 简化使用关系数据和非关系数据的应用程序的开发工作。

· 将现在只用于关系数据的功能扩展到非关系数据。

3. 在SQL Server 2008中存储非结构化数据

依赖于关系数据和非关系数据的应用程序通常使用下面的三个架构中的一个:

· 数据库中的关系数据以及文件系统和文件服务器上的非关系型二进制大对象(BLOB)。

· 数据库中的关系数据和只用于BLOB的存储中的非关系数据。

· 数据库中的关系数据和非关系数据。

0
投稿

猜你喜欢

  • 说到这个话题,我们有个产品叫群组,为什么人们需要群组?简单说,群组就是个圈子,是有共同爱好和话题的人群聚在一起讨论、分享的地方。这个产品的诞
  • 在对浏览器兼容性要求越来越高的时候,大家是否正在寻找一个完整的解决方案呢?继《[原]最新CSS兼容方案》之后,更新的CSS hack出炉啦,
  • “到底是什么将艺术和设计分开的?”这样一个话题听起来费解,长时间以来, 也已经被讨论过无数次。艺术家和设计师都是通过共通的知识和素养来创造视
  • 很多开发人员对于IIS和ASP.NET的安装等问题困扰,特此做下面的小总结,请大家多交流!iis 坏了修复办法!一般IIS运行不了ASP.N
  • 一个asp显示当前日期农历的代码函数,效果 今天是:农历丁亥年(猪)八月十三。调用方便!Function nl()'获取当前系统时间
  • 打开在节点中加入一句:max_allowed_packet=5M   将MySQL的容量扩大到5M  
  • 应原书编辑要求,先在文章顶部给出链接:《Everything You Know About CSS Is Wrong》http://www.
  • 当你使用UPDATE, INSERT, DELETE语句更新数据的时候,你就改变了两个地方的数据:log buffer和data buffe
  • 当然是可以的,而且非常简单,今天就教大家在ASP中不用模板生成HTML静态页的方法。这里假设有一个htmer.asp动态页面,你想把它生成为
  • 今天彬Go将和大家一起讨论网页设计趋势中很重要的环节,那就是”勾引”用户的按钮。所谓”勾引”用户的按钮,其实对于Web设计师来说,就是如何设
  • 曾经为看别人写的杂乱代码而头痛吗?曾经为看BWindow代码而烦恼吗?曾经为减小JS体积和JS的可读性之间的矛盾而左右徘徊吗?最好的办法是有
  • 很多时候关心的是优化SELECT 查询,因为它们是最常用的查询,而且确定怎样优化它们并不总是直截了当。相对来说,将数据装入数据库是直截了当的
  • 1.首先,我们需要过滤所有客户端提交的内容,其中包括?id=N一类,另外还有提交的html代码中的操作数据库的select及asp文件操作语
  • asp如何将RGB颜色转化成到16进制的?在R G B中输入小于255的数字点击观看即可转换成#开通的16进制。代码如下:<%R_RG
  • 是什么能让一个设计看上去是协调的,有条理的,专业的?答案是”色彩”.不是所有的项目都要用那种浅的”公司蓝”(corporate blue)才
  • 互联网上的资源多不胜数,无论我们搜索资料还是查阅新闻,或者是在网上淘物等等,肯定没少见分页!分页模式和表现方法也是各有千秋。我们来看看下面这
  • 动态联接库(DLL)是加快应用程序关键部分的执行速度的重要方法,但有一点恐怕大部分人都不知道,那就是在ASP文件也能通过调用DLL来加快服务
  • 在CSS中,实现分栏布局有两种方法。第一种方法是使用四种CSS定位选项(absolute 、static、relative和fixed)中的
  • Sjoerd Visscher 发现了一个简洁的 方法 让样式在 IE 中作用到未知的元素上——仅需 JS 创建此未知元素即可:docume
  • 在自己的网站主页上增加社会化分享按钮,是有效提高自己网站流量的一种方法。今天我在无争围棋网上增加了社会化按钮,根据我个人的习惯,我选择了豆瓣
手机版 网络编程 asp之家 www.aspxhome.com