深入探讨SQL Server 2008商务智能(BI)
发布时间:2008-12-23 13:56:00
Microsoft SQL Server 2008通过与Microsoft Office的深度集成,为所有人提供了可用的商业智能,以合适的价格提供给正确的用户以合适的工具。它的结果就是公司里所有层级的雇员都可以通过使用易于使用和功能强大的工具看到和帮助改变商业执行。与2007 Microsoft Office系统的集成使得用户可以以他们可以理解和觉得舒服的方式来查看商业性能;而PerformancePoint Server 2007的推出帮助客户获得对整个公司的全面的洞察力,以至于他们可以监控、分析和计划他们的业务,还可以加强团结、增强责任感和对整个企业的全面洞察力。
导言
在竞争日益激烈的市场中,商业人士逐渐认识到他们只有预先看出市场的趋势和机遇,并快速的对新的客户需求作出响应才能获得成功。此外,雇员需要对商业活动和花费进行排列优先次序,以此来确保达到最有效的使用可用的资源和作出有效的商业决策。
为了满足这些挑战,雇员需要获得对商业的全面的洞察力,以便他们可以作出睿智的决策,并为促进商业成功作出贡献。公司想将这个洞察嵌入每天的商业活动中,以便所有雇员可以明确的或是暗含的使用对所有的企业数据的完整和稳定的版本所作出的分析结果。
一、Microsoft 商业智能技术
Microsoft提供了一个全面的商业智能(BI),它为数据仓储、分析和生成报表提供了一个扩展的数据平台,并提供了终端用户可以用来访问和分析商业信息的强大的和直觉工具。Microsoft商业智能“提供给终端”的核心是Microsoft SQL Server 2008,它是一个全面的数据服务平台,使你能够:
· 统一企业中所有数据的存储和访问。
· 建立和管理复杂的商业智能解决方案。
·SQL Server 2008形成了所提供的这个强大的商业智能的基础,它的特有技术如下面所示:

二、2007 Microsoft Office系统集成
SQL Server 2008商业智能平台通过下面的2007 Office 系统组件提供给信息工作人员:
1.Microsoft Office Excel。这是一个强大的电子表格应用,你可以将它作为一个用于联机分析处理分析、数据挖掘和报表渲染的接口。通过 SQL Server 2008和Excel 2007的深度集成,你可以:
加强了终端用户访问和分析从SQL Server 2005分析服务获得的数据的能力。有了Excel 2007,终端用户可以浏览存储于分析服务中的多维联机分析处理立方体中的数据。Excel 2007使用户能够通过使用已经安装在大多数桌上计算机里的工具以他们想要的任何方式来轻松的建立“切片和切块”数据的Microsoft PivotTable 动态视图。
Excel与分析服务的紧密集成使终端用户可以轻松的使用分析服务的特性,例如转换、关键绩效指标(KPI)、计算成员、命名集、和Excel中的将Excel转化为一个分析客户端的服务器活动,通过使用这个集成使你可以从Excel 执行中收获更多。
为每个人作有用的预测分析,使非技术用户可以在熟悉的Office环境中利用SQL Server 2005分析服务的非常复杂的数据挖掘算法。设计时就为终端用户做了考虑,用在Office 2007中的数据挖掘插件使终端用户可以直接在Excel和Microsoft Office Visio中执行复杂的分析。
增加了自动化分析特性,例如强调了数据与表的其它部分或数据范围的格式看起来不同的异常,基于现在的趋势预测未来的数值,分析各种场景下的情况,决定需要改变什么来达到宽衣个特定的目标。
以大多数终端用户所喜欢的格式,通过使用新的增强的报表服务Excel渲染能力来发送报表,这个能力使得终端用户可以直接在Excel中接收到报表。
2.Microsoft Office Word。它是一个word处理应用程序,你可以使用它作为报表的一种格式。使用这个很多人所期待的新的用于Microsoft Word的报表渲染器,它使得你可以用Word格式来渲染SQL Server 2008报表服务的报表。
3.Microsoft Office Visio。一个画图应用,你可以使用它来作注释、增强和展示你的图形化的数据挖掘视图。有了SQL Server 2008和Visio 2007,你可以:
渲染决策树、回归树、集群图、和依赖网络。
将数据挖掘模型保存为内嵌到其它Office 文档中的Visio 文档,或者保存成一个网页。
4.Microsoft Office SharePoint Server。这是一个全面的协作、发布、和仪表盘解决方案,你可以使用它作为一个用于提供一个放置你所有的企业级商业智能的内容和工具的中央位置的中央组件,这样你公司的所有人都可以查看相应的和及时的分析视图、报表和关键绩效指标,并与它们进行交互。SQL Server 2008报表服务和Office SharePoint Server 2007的集成使你可以:
使用一个一致的用户接口来管理和查看报表。
当版本和报表的工作流存储到Office SharePoint Server 2007文档库中时跟踪它们。
通过SharePoint文档库管理一个单独的用于报表的安全模型。
使用Office SharePoint Server 2007 即开即用报表中心模板轻松的建立一个站点用以存储报表。
5.Microsoft Office PerformancePoint Server。 一个集成的性能管理应用,雇员可以使用它来监控、分析和计划基于SQL Server 2008提供的分析数据的商业活动。
通过这篇文章的其它部分,你将学习到SQL Server 2008和它与2007 Office系统的集成将怎样帮助你统一商业智能数据存储和访问,建立和管理复杂的商业智能解决方案,并将这些解决方案覆盖的范围扩大到你的所有的雇员。
统一数据存储和访问
大多数公司拥有多个商业系统,每一个都有它自己专用的数据存储。尽管你可以经常从单独的应用中生成报表,并对它们包含的数据进行分析,但是你只能通过合并企业内的异构数据来创建一个集中的用于生成报表和分析的商业数据源。
一.合并所有的数据,用于分析和生成报表
SQL Server 2008支持两个常见的方法来统一商业数据用于分析和生成报表:
数据仓库。一个只针对企业级数据的存储,它的数据从企业中的不同数据源的商业数据而来,并与其同步。这个方法的主要优点是你可以设计数据仓库用于最佳的分析和报表性能,而对作为数据来源的商业应用的性能没有影响。这个方法的另外一个优点是你可以清理和合并多个数据源而来的数据到一个单独的与真实数据保持一致的版本中。
数据源抽象。SQL Server 2008分析服务使得可以创建数据源视图以提供一个针对一个或多个数据源的抽象层。然后你可以将这个数据源视图作为分析服务、集成服务和报表服务的单独的数据源。有了这个数据源视图,当进行分析和生成一个报表的时候,会从后台的数据源系统获取数据。这个方法的主要优点是它使得可以对你的商业应用中的数据作实时分析。此外,数据源视图通过它增加的抽象层可以用来创建合适的名称来替代较长的或含义模糊的表名。
图1显示了这些方法。有了SQL Server 2008,你可以或者使用这些方法,或者两者结合使用。

图1
1. 以你想要的方式来使用你所有的数据
无论你采取哪个方法来统一你的商业数据,SQL Server 2008建立在过去对关系数据和非关系数据的强大的支持,提供了使开发人员和管理员可以有效的存储和管理非结构化数据的数据类型,例如文档和图片,所以你可以以最适合你的业务的格式来存储、管理和分析数据。
SQL Server 2008增强了对XML数据存储和一个FILESTREAM 数据类型的支持,FILESTREAM 数据类型使大型的二进制数据可以存储在文件系统中,并且保持事务一致性仍作为数据库完整的一部分。此外,删除了对用户定义的数据类型规模的限制,使得可以超过在之前的SQL Server版本中的8 KB 的限制。对空间和位置数据类型的支持使得可以存储和分析符合行业标准的地理数据。
2.集成所有的企业数据源
SQL Server 2008数据源视图使得可以集成数据和对从异构的企业级数据存储获得的数据进行访问,例如SQL Server、Oracle、DB2和Teradata。这些视图还提供了一个企业范围的联机分析处理存储,而且在SQL Server集成服务中对不同数据源的支持广度意味着你可以从现有的所有种类的商业应用中提取数据。因此,统一你所有的企业数据源的数据是很容易实现的,不论你是否想建立一个抽象层来通过数据源查看或使用ETL处理来与一个只用于分析和报表的数据仓库同步。
此外,通过对Web services和Microsoft .NET框架的支持,SQL Server 2008支持与多个平台、应用和编程语言的协同工作能力,所以你可以通过集成和连接到你的异构的数据源来最大化你对新的和现有的系统的投资回报。支持已有的和新出现的开放标准,例如HTTP、XML、SOAP、XQuery和XSD,进一步推动了你的扩展了的企业系统的通信。
二、数据仓库性能
SQL Server 2008提供了一个全面的和可扩展的数据仓库平台,使得你的企业可以更快的将数据整合到数据仓库中,这样你就可以扩展和管理不断增长的数据量和用户数量。
1.优化ETL过程
数据仓库一般通过ETL 过程从数据源系统获得的数据进行组装和更新。在数据最初加载到数据仓库中之后,会定期的刷新源系统的新的和更改的数据,以确保数据仓库的数据是最新的。
SQL Server 集成服务提供了一个全面的平台,你可以使用它从不同的数据源系统提取数据,做所要求的任何对数据或它的结构和格式的转换,然后加载转换的数据到数据仓库中。执行查找来匹配从数据源系统获得的记录到在数据仓库中的已有的记录是ETL过程中的一个常见操作,在SQL Server 2008中查找的性能被显著的提高了,以致于这些操作扩展到大型表。
为了帮助跟踪数据变化和确保数据仓库一致性,SQL Server 2008推出了变化数据捕获(Change Data Capture,CDC)功能,将更新记录在变更表中,这使得很容易标识被更改的行和确定更改的细节以及更改的原因。
2.有效的管理硬件资源
通过对数据压缩的支持,SQL Server 2008使你可以更有效地存储你的数据和降低存储成本。另外,压缩明显的提高了大型的具有输入/输出限制的工作负载的性能。SQL Server 2008还为备份压缩提供了本地支持即开即用。此外,VARDECIMAL数据类型和SQL Server 2008中的新的稀疏列通过降低大型表(这些表如在数据仓库所常见的,主要为数字或空值)所需要的空间数量来帮助你从你的磁盘存储资源获得最好的效率。
除了在数据存储方面的效率,SQL Server 2008还支持映射内存的地址窗口扩展(Address Windowing Extensions,AWE)的动态分配,它支持Windows Server 2003、数据中心版(Datacenter Edition)的64GB内存、和64位版本的2TB内存,来支持大型数据仓库环境。
SQL Server 200还推出了资源监控器,它使得管理员可以为不同的工作负载定义资源限制和优先权,以便使并发工作负载可以提供稳定的执行,并使得可以预先的管理资源竞争问题。
3.优化数据库性能
SQL Server 2008包括高性能的关系数据库引擎,它使得你可以建立高效的数据仓库解决方案。创新(例如用于star schema(星型模式)和工具的查询优化帮助你调整索引和数据结构)使得SQL Server为经常查询的数据仓库自动选择,同时在SQL Server 2008中推出了MERGE Transact-SQL语句,开发人员可以更有效地处理普通的数据仓库场景,例如检查一行是否存在然后执行插入或更新。此外,对GROUP BY条件语句进行了扩展,使得用户可以在一个查询中定义多个组。Grouping Set生成了一个单独的结果集,这与对不同分组的行执行UNION ALL 操作是等价的,它使得聚合查询和生成报表更加容易和快速。
SQL Server 2008支持分区表,帮助你优化大型表的性能和管理,有了对分区表并行的新的支持,你可以通过使用分区表显著的优化一个数据仓库。
管理复杂的商业智能解决方案
随着公司对复杂分析日益增长的需求,对能够快速的建立和提交有效的商业智能解决方案,并能降低你的商业智能基础设施的管理费用的要求,成为了一个主要要考虑的事项。SQL Server 2008包含创新的工具,这些工具提高了开发人员的效率和管理能力,它使得可以更快的从新的分析和生成报表能力获得收益,同时使得管理费用降低了。
一、开发人员生产力
SQL Server 2008简化了商业智能解决方案的开发过程。商业智能开发人员受益于易使用的功能和工具,这些功能和工具增加了控制和自动进行例行操作、耗时的任务,并可以使用SQL Server 2008的高效的特性更快速的创建高效的分析和报表解决方案;这样你的公司很快就可以利用它们。
1.使用一个丰富的、现代的编程环境
通过与Microsoft Visual Studio 的紧密协同工作,开发人员可以轻松地建立和维护强大的、安全的、可扩展的商业智能解决方案。SQL Server 商业智能开发套件提供了一个单独的工具,它涵盖了多个商业智能解决方案类型,并为开发ETL、分析和报表解决方案提供了一个单独的、稳定的环境。作为商业智能开发套件的一部分推出的直接的商业智能向导,使得甚至初级开发人员也能很容易的建立高级的商业智能模型和项目。


猜你喜欢
- 一、多线程同步由于CPython的python解释器在单线程模式下执行,所以导致python的多线程在很多的时候并不能很好地发挥多核cpu的
- 加上设置字符编码的方法:response.setHeader("charset","gb2312")
- try { int readByte = 0;
- MSDN上看了一下说是sql server 2005不支持在分布式事务处理中存在指向本地的链接服务器(环回链接服务器)个人尝试了下是由于在双
- 迭代数组NumPy中引入了 nditer 对象来提供一种对于数组元素的访问方式。一、单数组迭代1. 使用 nditer 访问数组的每个元素&
- 比如input中的数据和data中的msg双向绑定。那么我们可以 判断先把msg以空格拆分成数组,然后拼接起来,判断字符串的长度
- Django cors跨域问题前后端分离项目中的跨域问题 即同源策略同源策略:同源策略/SOP(Same origin policy)是一种
- 原始值->基本类型Number String Boolean undefined null存储在栈(stack)中的简单数据段,也就是
- 一、Django密码存储和加密方式#算法+迭代+盐+加密<algorithm>$<iterations>$<s
- 首先 跳过权限表模式启动MySQL:mysqld --skip-grant-tables &从现在开始,你将踏入第一个坑
- 1. 用SimpleITK读取dicom序列:import SimpleITK as sitkimport numpy as npimg_p
- 一:什么是数据库,为什么要有数据库?数据,数据库,数据库管理系统和数据库系统是与数据库技术密切相关的四个基本概念。数据库相信大家都耳熟能详了
- NumPyNumPy是一个用于科学计算和数据分析的Python库,也是机器学习的支柱。可以说NumPy奠定了Python在机器学习中的地位。
- 前言在前面两篇文章中 初见 Go Mutex 、Go Mutex 源码详解,我们学习了 Go语言 中
- 如下所示:import timedef date_compare(item1, item2): t1 = time.mktime(time.
- 区别:xx:公有变量,所有对象都可以访问;xxx:双下划线代表着是系统定义的名字。__xxx:双前置下划线,避免与子类中的属性命名冲突,无法
- """已知列表li = [{"key": 5}, {"key": 9}
- 前言接上文 matlab与Excel交互 非xlsread和xlswrite (1) ,此处默认:Excel=actxserver(‘Exc
- docx2txt的Github地址docx2txt是基于python的从docx文件中提取文本和图片的库。代码是从python-docx中获
- 在 Web 编辑器领域,CKEditor – 七年的专注,赢取的是王者风范。TinyMCE – 五年前的小家碧玉,如今已成长为大家闺秀。Go