加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 大数据 > 正文

自助式商业智能面对数据质量问题风险

发布时间:2021-06-27 11:45:31 所属栏目:大数据 来源:互联网
导读:对于那些不想在IT人员协助下就可以完成数据分析的终端用户来说,微软的PowerPivot for SQL Server 2008 R2是一个很好的工具。业务人员可以自己动手将上百万行数据进行切割,并通过SharePoint Server 2010将结果与同事共享。 PowerPivot是一个十分强大的自助
    对于那些不想在IT人员协助下就可以完成数据分析的终端用户来说,微软的PowerPivot for SQL Server 2008 R2是一个很好的工具。业务人员可以自己动手将上百万行数据进行切割,并通过SharePoint Server 2010将结果与同事共享。
 
    PowerPivot是一个十分强大的“自助式”商业智能(BI)工具,但随之而来的是数据质量问题,一些专家认为使用微软的PowerPivot工具,在没有IT人员的监督管理之下,将很容易造成数据质量低下。PowerPivot可以在数据库层面上设定访问权限和策略,但同时还让终端用户在经过清洗的企业数据和来自外部的数据源上创建分析项目。Forrester机构的首席分析师Boris Evelson表示:“这就像是打开了潘多拉魔盒,因此企业需要进行某种程度上的治理。如果上千名终端用户在没有监督和控制的情况下创建并分享应用的话,其后果对于企业来说将是不堪设想的。”
 
    举例来说,任何错误的分析结果都可能会在公司内部进行分享,甚至其他业务人员还会反复使用错误的分析。不良的软件程序会在IT部门的监管范围之外不断扩散,没有被检查过的数据集会充斥整个企业。
 
    数据仓库与决策支持系统专家Rick Sherman表示:“我看过许许多多不良的数据系统,这些系统中,人们访问数据库,然后调取需要的数据到电子表格中再用PowerPivot生成分析结果。然后其他的用户再用电子表格随便做什么,添加宏和公式,而做出的变更则并不总是记录下来。”
 
    此外,一旦数据流出企业数据库之外,那更多的人将能够访问敏感的专有信息。
 
    监控PowerPivot文件
 
    那么,IT部门该如何维护新创建数据源以及企业数据库的准确性和一致性呢?
 
    企业中,业务人员希望使用像PowerPivot这样的自助式工具进行分析工作,究其原因有很大一部分是源自对IT部门的耐心不足。分析员肯定不希望等待IT人员把正式的数据分析模型创建之后再开展工作,所以PowerPivot是必不可少的,彻底抛弃这一工具显然并非明智之举。
 
    最佳的方法,就是花时间去创建一套策略来控制数据的安全。
 
    Gartner研究总裁Rita Sallam建议DBA充分利用SharePoint中的安全特性,它能够使管理员和用户对文件设定不同类型的限制条件。
 
    DBA还可以要求用户把所有的工作都保存到信任的文件位置,然后使用SharePoint来控制用户的访问权限。这些用户能够允许将文件保存到指定位置,或者能够下载相应文件。
 
    “让他们把所有的BI应用和数据存放到SharePoint Server共享的文件夹中,而不是之前都存放到自己的PC机。然后有规律地监控这些文件的使用率,如果其中一个使用率过高,说明它涉及到的用户和数据量就是比较大的,那么DBA可以在系统平台上标注一个红旗以示注意。” Evelson这样建议道。
 
    SharePoint 2010可以使管理员限制文件访问为只读,限制更改或创建特定的文件类型等。这能够使得DBA限制其他用户如何访问特定类型的文件或数据,举例来说,DBA可以限制用户在向SharePoint创建一个Workbook之前,先申请相应的授权。创建者还能够设定一个警告,当有人更改他们的文件时,警报启动能够通知到该用户。
 
    Sallam说:“IT人员可以监控到那些workbook被访问的次数最多。如果有workbook活跃度异常,他们就会在SQL Server数据库中创建相应的数据分析cube。这个功能可以让用户访问到正确的经过清洗的数据。”
 
    根据Sherman的说法,当自助式BI工具变得越来越强大时,终端用户更加需要对数据进行必要的保护。他建议IT部门加强对企业数据的访问控制,并将更多的权限授予高级用户,他们可以作为最终的裁定者,决定哪些用户可以访问数据并进行必要的业务分析。
 
    针对微软PowerPivot中的数据质量管理问题,Sherman建议制定细化的规则,根据数据需求和技术能力,把不同级别的访问权限授予不同的用户组,然后规定用户对自己的数据文件进行加密或设定访问权限,这样的话能够最大程度上减轻不良数据的蔓延。
 
    “决定加什么权限,数据中那些属性可以更改,这些都应该是由高级的用户进行管理的,这部分用户对企业的忠诚度比较高,并通过了IT部门的验收测试。”
 
    Sherman还表示,这样做的方法还有利于找出业务人员究竟希望获得怎样的工作模式,并不是所以终端用户都想要一样的数据访问级别。所以一些高级用户的限制政策在普通用户的眼中也许并不算是严格。多数情况下,能够把公式拖拽到pivot中在旁观者看来就已经是自助式了,他们也许并不想要更改公式或者数据

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读