-
携程如何从海量数据中打造精准用户画像?
所属栏目:[大数据] 日期:2021-08-24 热度:55
用户画像作为大数据的核心组成部分,在众多互联网公司中一直有其独特的地位。 作为国内旅游OTA的领头羊,携程也有着完善的用户画像平台体系。目前用户画像广泛用于个性化推荐,猜你喜欢等;针对旅游市场,携程更将其应用于房型排序机票排序客服投诉等诸多特色[详细]
-
大数据计算架构Hadoop、Spark和Storm 三者技术对照
所属栏目:[大数据] 日期:2021-08-24 热度:104
短短几年时间,大数据这个词便已家喻户晓。但在大数据这个名词被命名之前,人类对数据的搜集与分析已有着悠久的历史。从人工统计分析到电脑/大型机再到今天的分布式计算平台,数据处理速度飞速提高的背后则是整体架构的不断演进。今天大数据架构最火热的莫过[详细]
-
用户群体画像功能深度研究
所属栏目:[大数据] 日期:2021-08-24 热度:70
所有伟大的产品,都离不开用户的追随与期待。 用户群体画像是产品用户增长的利器之一它能够帮您探究产品指标数字背后的原因。 通过用户群体画像,我们已经能够持续的监测产品运营状况,比如:观察产品关键指标的变化、关注用户到目标的转化趋势、分析用户的[详细]
-
高速公路视图大数据处理应用研究
所属栏目:[大数据] 日期:2021-08-24 热度:72
近年来,随着高速公路通车里程的迅猛增长和车流量的快速增加,高速公路运营管理中暴露的新情况、新问题也逐年增多,特别是逃漏通行费问题,给正常运营秩序带来较大的冲击。为了解决偷逃漏费、路径识别等业务需求,其中在高速公路收费卡口逐步进行了监控高清[详细]
-
可视化不确定网络的概率图布局技巧
所属栏目:[大数据] 日期:2021-08-24 热度:198
不确定网络,在本文表示顶点是确定的(certain),边的存在与否满足某种概率分布的网络。在图1中,左图是确定网络(certain graph),右图是不确定网络(uncertain graph)。 在不确定网络可视分析中,现有的方法往往直接在确定图(exact graph)中用视觉变量(visual[详细]
-
使用R进行数据匹配的措施
所属栏目:[大数据] 日期:2021-08-24 热度:67
R中的merge函数类似于Excel中的Vlookup,可以实现对两个数据表进行匹配和拼接的功能。与Excel不同之处在于merge函数有4种匹配拼接模式,分别为inner,left,right和outer模式。 其中inner为默认的匹配模式。本篇文章我们将介绍merge函数的使用方法和4种拼接[详细]
-
为什么要进行现代数据集成?重点驱动程序和特性
所属栏目:[大数据] 日期:2021-08-24 热度:132
从商业角度来看,现代数据集成已经变得有用,因为很多可用于组织的数据只有非常短的保存期限。业务流程,计划,以及其他活动必须能够尽快利用数据。企业需要开发数据管理策略,专注于生成业务就绪和业务可用的数据。为此,组织需要一种全新的思维模式,各种[详细]
-
数据分析行业必须具备哪些技术 如何快速进入
所属栏目:[大数据] 日期:2021-08-24 热度:142
在深度学习中,为了有效地训练深度神经网络,有一些值得我们强烈推荐的做法。在本文中,我将介绍一些最常用的方法,从高质量训练数据的重要性,到超参数的选择,再到更快的做出 DNN 原型的通用技巧。这些方法的大多数由学术界和工业界的研究验证过,并且在诸[详细]
-
大数据世界 无处安放的隐私数据
所属栏目:[大数据] 日期:2021-08-24 热度:122
多年来,隐私和大数据之间的关系已经变得非常敏感,随着新兴技术产生大量数据,关于两者之间辩论才刚刚开始。 随着日常生活中数据生成设备的数量不断增长,因此关于应将数据公开,以及何时应将个人数据视为私有的争论也在不断增加。 SAP国家安全服务公司总裁[详细]
-
数据可视化技术的问题
所属栏目:[大数据] 日期:2021-08-24 热度:184
排雷啦~咱们聊聊可视化技术中的一些常见误区。 所谓数据可视化是指把数据以图形动画及地图等形式呈现出来,这样既直观又美观,易于理解从而看出数据背后的问题。 要做好数据可视化,需要两方面的能力。一方面是艺术能力,即知道什么样的数据用什么形式去表现[详细]
-
为何HDFS是大数据分析的痛点
所属栏目:[大数据] 日期:2021-08-24 热度:54
分布式文件系统是大型分析非常重要的一环。即使你是在使用Spark,你仍然需要将大量的数据快速的存入内存,所以文件系统一定要可以是高速率的。但是,HDFS并不像它标榜的那样好,它是大数据分析的薄弱环节。 什么是分布式文件系统?普通的文件系统是基于块来存[详细]
-
Pandas处理大数据的一些小方法
所属栏目:[大数据] 日期:2021-08-24 热度:144
近期的工作和Hive SQL打交道比较多,偶尔遇到一些SQL不好解决的问题,会将文件下载下来用pandas来处理,由于数据量比较大,因此有一些相关的经验可以和大家分享 近期的工作和Hive SQL打交道比较多,偶尔遇到一些SQL不好解决的问题,会将文件下载下来用pandas[详细]
-
关联规则推荐算法的原理及达成
所属栏目:[大数据] 日期:2021-08-24 热度:66
关联规则用来发现数据间潜在的关联,最典型的应用是电商网站的购物车分析。本文将通过一个简单的例子来说明关联规则中各个术语的含义以及具体的计算方法。 这是一些用户的购物数据,uid是用户的ID,后面是每个用户具体购买的商品名称,我们使用字母进行标识[详细]
-
大数据对网络运维代表着什么?
所属栏目:[大数据] 日期:2021-08-24 热度:186
2016年对于SDN来说无疑是利好的一年,在金融、电信、互联网等行业SDN产品和解决方案开始规模化部署,许多传统行业对于SDN的需求也初现端倪。《2016~2017年中国SDN市场发展状况白皮书》显示,2016年中国SDN软件市场(主要指SDN控制器及相关的软件解决方案与服[详细]
-
达成Spark部署 依赖供应商还是"自力更生"?
所属栏目:[大数据] 日期:2021-08-24 热度:85
Apache Spark用户经常面临一个困境:继续获取来自供应商的支持还是更新版本,使用具有更新功能的快速移动的开源软件? Novantas公司将Spark数据处理引擎作为商业Hadoop发行版的一部分。这样使得分析服务和软件提供商与Spark版本的Hadoop软件包支持的Spark版本[详细]
-
如何打造下一代大数据架构——数据湖
所属栏目:[大数据] 日期:2021-08-24 热度:82
如何创建一个适用于多样数据类型,并可扩展的敏捷数据平台?答案就在数据湖中! 技术和软件的进步使我们能够处理和分析大量数据。虽然很明显,大数据是一个企业投入了大量资金的热门话题,但要注意,除了考虑数据规模,我们还需要考虑到被分析数据类型的多样性[详细]
-
DIY Hadoop大数据环境的5大圈套
所属栏目:[大数据] 日期:2021-08-24 热度:152
虽然Hadoop可以运行在廉价的商品计算机硬件,且用户很容易添加节点,但是它有一些细节是很昂贵的,尤其是你在生产环境中运行Hadoop。 甲骨文公司大数据产品经理Jean-Pierre Dijck称:IT部门认为我已经有服务器,我还可以买到便宜的服务器,我也有人员,所以[详细]
-
神经网络理论基础及Python达成
所属栏目:[大数据] 日期:2021-08-24 热度:83
一、多层前向神经网络 多层前向神经网络由三部分组成:输出层、隐藏层、输出层,每层由单元组成; 输入层由训练集的实例特征向量传入,经过连接结点的权重传入下一层,前一层的输出是下一层的输入;隐藏层的个数是任意的,输入层只有一层,输出层也只有一层;[详细]
-
AI的挑战 核心算法和相关系统软件缺位
所属栏目:[大数据] 日期:2021-08-23 热度:61
人工智能的挑战是什么?人工智能面临的挑战会有什么?我们看看专家是怎么解读的。 中国科技新闻网12月21日讯(那珊)在人工智能领域,我国和其他国家相比,在核心算法和相关系统软件方面我们也还存在卡脖子的可能性。在近日举办的2020年大数据科技传播与应用[详细]
-
构建深度学习模型的五个基本流程
所属栏目:[大数据] 日期:2021-08-23 热度:80
几十年前 AI 失败的主要原因是缺乏数据和计算能力。经过数年时间,这一情况已显著改善。基于大型科技巨头和跨国公司投资AI数据,数据的丰富程度已大大提高。而鉴于 图形 处理单元( GPU s)功能强大,计算能力也不再是挑战。 本文将详细讨论构建深度学习模型[详细]
-
AI行业热点事件汇总
所属栏目:[大数据] 日期:2021-08-23 热度:50
2020年,人工智能成为产业发展的高频热词,市场前景获得业界的普遍认可,发展速度不断加快,各区域也纷纷出台规划助推新型应用落地。在国际市场上,人工智能技术研发、交流合作等活动更是频繁进行。下面,就让我们一起来了解下相关热点。 法加德等15国成立人[详细]
-
AI的知识点科普
所属栏目:[大数据] 日期:2021-08-23 热度:132
什么是人工智能?获得这个问题的答案取决于你问谁。 早在上世纪50年代,人工智能行业先驱Minsky和McCarthy将人工智能描述为由机器执行的任何任务,这些任务在以往需要人类智能才能完成。 这显然是一个相当宽泛的定义,这就是有时人们针对某种技术是否真是人[详细]
-
人工智能如何降低物联网传感器的困境
所属栏目:[大数据] 日期:2021-08-23 热度:113
物联网(IoT)正在慢慢改变我们收集数据和生活的方式。它还使日常用品能够与组织内的其他设备共享无线连接。这项技术正在打破所有工业领域的创新和概念。据AnalyTIcsInsight预测,就全球市场而言,物联网的复合年增长率为10.6%。预计将从2019年的6536亿美元[详细]
-
AR边缘云技术分析 AR云的定义和关键作用
所属栏目:[大数据] 日期:2021-08-23 热度:180
早在2019年,AR及其云服务和能力融合构架进入了百舸争流的快速发展阶段。各ICT,人工智能以及互联网的领军企业纷纷发布了令人眩目的新技术并拓展其基于云的服务模式,如结合AR技术的3D高精度地图服务Cybervers和基于视觉定位系统LiveView的MapsAR导航功能。[详细]
-
数据为墨 智能作笔 落笔姑苏城 画一卷人工智能姑苏繁华图
所属栏目:[大数据] 日期:2021-08-23 热度:147
在清代长卷画历史中,有一幅独树一帜的作品,名为《万笏朝天图》。在长达17米的长卷上,由苏州城郊开始,以城西天平山为中心展开,完整刻录了繁华甲天下的姑苏城。 三百年后的今天,如果有一个地方能极致精细,又能同时全局一览地统看智能时代的苏州胜景,那[详细]

浙公网安备 33038102330482号