加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 大数据 > 正文

Cloudera 拥抱云计算,深耕企业数据云平台

发布时间:2021-12-20 04:27:56 所属栏目:大数据 来源:互联网
导读:数据湖、数据仓库、数据中台随着大数据技术的不断更新迭代,相关概念如雨后春笋般应运而生。对于这些概念,已经有了无数篇文章去科普,可以简单的总结如下: 数据湖是一个集中的存储库,可以在其中存储超大规模的、所有结构化和非结构化数据。在数据湖中,
数据湖、数据仓库、数据中台……随着大数据技术的不断更新迭代,相关概念如雨后春笋般应运而生。对于这些概念,已经有了无数篇文章去科普,可以简单的总结如下:
 
数据湖是一个集中的存储库,可以在其中存储超大规模的、所有结构化和非结构化数据。在数据湖中,不需要对数据在存储时进行模式化,就可以运行不同类型的分析。
 
数据仓库也称为企业数据仓库,是一种数据存储系统,可以将不同来源的结构化数据聚合起来,用于业务智能领域的比较和分析。数据仓库是包含多种数据的存储库,并且是高度建模的。
 
数据中台是一个承接技术,引领业务,构建规范定义的、全域可连接萃取的、智慧的数据处理平台,目的是为了高效满足前台数据分析和应用的需求。数据中台距离业务更近,能更快速的响应业务和应用开发的需求,可追溯,更精准。
 
CDP:做好数据治理这件事
 
从定义来看,可以说数据湖、数据仓库、数据中台三者并不是非此即彼的关系。在Cloudera大中华区技术总监刘隶放看来,三者是融为一体的。
 
他认为,数据中台的本质是数据治理。“我们特别喜欢‘数据中台’这个概念,它让用户开始重视数据治理,而不再是把数据往你面前一扔了事。数据湖同样非常重要,它的理论是把数据从外边‘捞’进库里,它是原生态的。” Cloudera就具备了极强的数据治理能力。刘隶放表示,做好数据治理,一是要求产品要有思想方法论,二是产品要有能力。客户还会构建一个业务中台,通过“业务元数据”映射到“技术元数据“,进而加以治理。当今很多用户做大数据平台上的“数据中台”时,都会来找Cloudera合作,因为其CDP平台上有源数据治理的工具,能够加速客户做数据治理的工作。CDP(Cloudera Data Platform )就是2018年Cloudera与Hortonworks合并之后发布的首款新产品。
 
“先有Hadoop,后有大数据”,作为Hadoop的代表,规模最大、知名度最高的公司Cloudera红极一时。2014年,Cloudera引入到中国,提供的主要产品就是基于开源Hadoop集群的各种组件和服务。Hortonworks也是企业级全球数据管理平台,为100强企业中的一多半提供“任何类型数据”的可操作信息。2018年,二者宣布合并,融合推出了新产品CDP,而CDH,HDP成为了 Cloudera 的既有产品。同时,Cloudera 的许可证模式变更,不再提供所有产品的免费下载,遗留的 CDH,HDP的所有版本最晚明年初将不再提供支持,且不会再有新功能更新。
 
据了解,新版的CDP将能更好地适用于云环境,用户可以借助它管理、分析从本地到公有云、私有云、混合云环境中的数据。同时,CDH中许多安全漏洞补丁都无法基于CDH5的版本进行修复,因为CDH依赖的某些第三方库已经无法在当前版本维护,只有完成向新版本的CDP升级,才可以避开CVE安全漏洞。此外,相对于Cloudera和Hortonworks二者原来的产品CDH和HDP,CDP平台整合了两个平台的最强功能,并增加了新特性,带来了大量的性能和功能改进,如:Spark3在某些场景下将数据加工的性能提升5倍;HWC使得细粒度控制Spark的权限成为现实;Hive on Tez取代了Hive on MapReduce来提升查询性能;Impala使得性能提升2-7倍;运营数据库支持SQL和No SQL模式,同时吞吐量性能提高了15-20%等。
  
在CDP发布之前,Cloudera的 Hadoop版本CDH,Hortonworks的HDP,均提供社区免费版本。Cloudera通过企业版及商业化服务获得收入,其企业版包括一些不开源的管理工具。而从CDP开始,Cloudera采用100%开源策略,采用类似红帽的订阅收费的策略,用户付费就可以获得CDP的开源代码以及服务,不再提供免费下载版本。
 
刘隶放表示,“开源”和“收费”并不矛盾。“Cloudera就承诺一件事情:所有的组件,一定在开源上是正支的,您在Cloudera的代码中看到的一定是开源中正支里的代码。Cloudera的所有代码是从GitHub直接拿过来,没有修改,但是在不停演进的。”也就是说,CDP作为开源Hadoop生态的代表,其组件都是开源的,但将这些组件整合、调试成稳定的发行版CDP,并且提供一系列服务之后,CDP是收费的。“我们永远会使用开源版本,Cloudera是一家开源软件公司”。
 
加大对总代和ISV的投入
 
关于生态建设,Cloudera 大中华区区域副总裁王刚表示,Cloudera将加大对总代的投入,希望能通过总代的网络覆盖到全国,帮助Cloudera发展 “西南、西北”地区。此外,Cloudera还希望加大有CDP能力认证的代理商。对于ISV,王刚表示,明年会重点投入去做一些不同行业垂直的ISV,如汽车、金融等不同领域。将ISV的行业经验与Cloudera平台技术的领先性相结合,为客户提供一整套的方案。
  
Cloudera在国内推出了阿里云上的IaaS版本,使得国内的用户可以使用阿里云版本进行验证和迁移。Cloudera与阿里云也有一些战略合作,会与阿里云一起去拜访客户、解决客户的问题,提供售后服务等。
 
结语
 
企业正在不断加码对数字化的投入。CDP让企业IT人员能够在任何云环境中进行数据分析,同时提供多种数据安全功能,从而最大程度降低数据风险。Cloudera将依靠CDP及生态的力量,助力企业释放更多数据价值。

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读