-
大数运算(小项目)
所属栏目:[大数据] 日期:2021-03-15 热度:134
? ?我们都知道每个变量都有类型,而类型都取值范围。如char类型的取值范围为[-128,127]。而类型中取值范围最大的当属long long型。其取值范围为[0x8000000000000000,0x7fffffffffffffff]。当我们在计算时,难免会超出范围,我们称之为溢出。那么,应如何[详细]
-
利用SVM 实现文本分类的实例
所属栏目:[大数据] 日期:2021-03-15 热度:178
原文来自:http://blog.csdn.net/zhzhl202/article/details/8197109 之前做过一些文本挖掘的项目,比如网页分类、微博情感分析、用户评论挖掘,也曾经将libsvm进行包装,写了一个文本分类的开软软件Tmsvm。所以这里将之前做过一些关于文本分类的东西整理总[详细]
-
数据标准化与PCA白化原理探索
所属栏目:[大数据] 日期:2021-03-15 热度:185
PCA是实验中很常用的工具,一般用来做降维,它的实现有很多很多种,其中牵涉相当多的细节,笔者在实现PCA时常常有困惑,为什么查到的各种代码总有一些不同的trick,有时候对样本提前归一化?有时候又要减均值?这些操作对于PCA降维效果到底有什么影响?这[详细]
-
R语言绘制文字云
所属栏目:[大数据] 日期:2021-03-15 热度:181
差不多一年没有怎么认真写过博客了,最近要做毕业设计,记录一下有关实验。参考实验楼上一个实验。主要学习使用分词包 Rwordseg 对莎士比亚的名著《仲夏夜之梦》中的内容进行单词频数统计,提取关键词,并进行数据清洗,最后使用包 wordcloud 根据关键词出[详细]
-
K 大数查询
所属栏目:[大数据] 日期:2021-03-15 热度:51
题目大意 有N个集合,初始为空。有M个操作, 修改操作:编号范围在l~r的集合都加入一个数值为a的数, 询问操作:编号范围在l~r的集合数值为第k大的数。 n,m=50000,|a|=n,k 树套树 当然可行,但我不会 考虑离线——整体二分 L,R表示数值的区间,mid=(L+R)[详细]
-
大数 Astar-Round1 Problem B
所属栏目:[大数据] 日期:2021-03-15 热度:149
题目 2016"百度之星" - 资格赛(Astar Round1) http://bestcoder.hdu.edu.cn/contests/contest_showproblem.php?cid=690pid=1002 Problem Description 度熊面前有一个全是由1构成的字符串,被称为全1序列。你可以合并任意相邻的两个1,从而形成一个新的序[详细]
-
R语言数据处理——tidyr包
所属栏目:[大数据] 日期:2021-03-15 热度:63
????在实际进行数据分析的过程中,我们常需要对数据进行一些相应的整理,“ tidyr 包”中的 gather(宽数据转为长数据)、 spread(长数据转为宽数据)、 unit(多列合并为一列)、 separate(将一列分离为多列)这四个函数为我们的数据整理提供了极大的便[详细]
-
R文本挖掘 | 如何在用户词库中添加搜狗词典?
所属栏目:[大数据] 日期:2021-03-15 热度:183
写 在前面 亲爱的小伙伴们!阔别大家将近10天,是不是等得有些着急了呢?本期大猫课堂将继续《R文本挖掘》系列,上节课中已经教大家 如何用jiebaR分词包进行分词,本期将教大家一个更加进阶的分词功能: 把搜狗专业词库添加进自己的用户自定义词典中。 稍[详细]
-
lt;大数处理gt; 2016百度之星第二题
所属栏目:[大数据] 日期:2021-03-15 热度:195
链接:http://bestcoder.hdu.edu.cn/contests/contest_showproblem.php?cid=690pid=1002 Problem B ? ?Accepts: 2483 ? ?Submissions: 9088 ?Time Limit: 2000/1000 MS (Java/Others) ? ?Memory Limit: 65536/65536 K (Java/Others) Problem Description[详细]
-
2016#34;百(sha)度(bi)之星#34;-资格赛(Astar Round 1)题解
所属栏目:[大数据] 日期:2021-03-15 热度:149
副标题#e# 昨天中午一年一坑人的百(sha)度(bi)之星又开赛了,当然正赛的话是下周开始,最先开始的是资格赛。资格赛嘛,过一题就算过了,所以也不管那么多了,就在比赛结束前把题解贴出来了。然后呢,果然不愧是刚刚被政府找去谈话的百度,秉承着坑死你[详细]
-
HDOJ1002 大数相加
所属栏目:[大数据] 日期:2021-03-15 热度:181
pre name="code" class="java"import java.math.BigInteger;import java.util.Scanner;public class Main{ public static void main(String[] args) { Scanner cin = new Scanner(System.in); BigInteger a,i,t; int kase=0; int ts; ts=cin.nextInt(); in[详细]
-
2016#34;百度之星#34; - 资格赛(Astar Round1)Problem B(大
所属栏目:[大数据] 日期:2021-03-15 热度:147
副标题#e# Problem B ?Time Limit: 2000/1000 MS (Java/Others) ? ?Memory Limit: 65536/65536 K (Java/Others) Problem Description 度熊面前有一个全是由1构成的字符串,被称为全1序列。你可以合并任意相邻的两个1,从而形成一个新的序列。对于给定的一个[详细]
-
简单大数相加
所属栏目:[大数据] 日期:2021-03-14 热度:52
#include iostream#include cstdio#include cstringusing namespace std;#define N 1000char s1[N];char s2[N];int main(){ int k,i,j; int l1,l2; int a[N]={0}; int b[N]={0}; gets(s1); //getchar() //不用这个玩意,有的话会吞掉下一个字符串的第一个[详细]
-
[sicily] 1020. Big Integer
所属栏目:[大数据] 日期:2021-03-14 热度:189
1020. Big IntegerConstraintsTime Limit: 1 secs,Memory Limit: 32 MBDescriptionLong long ago,there was a super computer that could deal with VeryLongIntegers(no VeryLongInteger will be negative). Do you know how this computer stores the Ve[详细]
-
如何利用BI搭建电商数据分析平台
所属栏目:[大数据] 日期:2021-03-14 热度:191
? ? ? ? 某电商是某大型服装集团下的重要销售平台。2015 年,该集团品牌价值达数百亿元,产品质量、市场占有率、出口创汇、销售收入连年居全国绒纺行业第一,在中国有终端店3000多家,零售额80 亿。其羊绒制品年产销能力1000万件以上的规模,占有中国的40%[详细]
-
[案例分享] 大数据分析的威力:HPE Vertica 帮助Guess 网上商店
所属栏目:[大数据] 日期:2021-03-14 热度:50
副标题#e# 在今天这个颠覆式创新的时代,消费者行为正在发生着巨大的变迁,他们相互之间的联系越来越紧密,他们与自己心仪的品牌之间也有着与以往不同的互动行为,此时,零售行业必须适时作出改变,通过大数据分析,实现更加精准的营销。 通过将大量数据从[详细]
-
HDU 1042 N! (大数阶乘,紫书上的方法超时!!还是Java大法好!!)
所属栏目:[大数据] 日期:2021-03-14 热度:170
N! Time Limit: 10000/5000 MS (Java/Others)????Memory Limit: 262144/262144 K (Java/Others) Total Submission(s): 73270????Accepted Submission(s): 21210 Problem Description Given an integer N(0 ≤ N ≤ 10000),your task is to calculate N! ?[详细]
-
Bi-shoe and Phi-shoe(欧拉函数变形)
所属栏目:[大数据] 日期:2021-03-14 热度:177
Bi-shoe and Phi-shoe Time Limit:2000MS?????Memory Limit:32768KB?????64bit IO Format:%lld %llu Submit? Status? Practice? LightOJ 1370 Description Bamboo Pole-vault is a massively popular sport in Xzhiland. And Master Phi-shoe is a very po[详细]
-
BI Automation Framework
所属栏目:[大数据] 日期:2021-03-14 热度:142
副标题#e# com.oracle.biqa.framework.webdriver.WebAutomation(接口类) Selenium.WebElement.WebElement(String xpath_obj) //获得页面元素 void setObject(String xpath_obj) //设置button void setObject(String xpath_obj,String value) //输入input vo[详细]
-
POJ 1001 Exponentiation(大数幂,还是Java大发好!需调用多个方法
所属栏目:[大数据] 日期:2021-03-14 热度:113
Exponentiation Description Problems involving the computation of exact values of very large magnitude and precision are common. For example,the computation of the national debt is a taxing experience for many computer systems.? This prob[详细]
-
【邀请函】2016永洪科技大数据分析沙龙——济南站
所属栏目:[大数据] 日期:2021-03-14 热度:175
副标题#e# 报道大数据企业:大数据产品、大数据方案、 ? 大数据人物 分享大数据干货:大数据书籍、大数据报告、 大数据视频 本文由永洪BI投稿。欢迎更多优质原创文章投稿给大数据人:289585305@qq.com 前言:大数据人作为此次大数据分析沙龙活动协办方,将[详细]
-
怎样挖掘用户需求
所属栏目:[大数据] 日期:2021-03-14 热度:71
副标题#e# 需求分析在数据库生命周期中至关重要,通常也是涉及人员最多的步骤。数据库设计师在这个阶段必须走访最终用户,与他们进行访谈,从而确定用户想在系 统中存储什么数据以及想怎样使用这些数据。 我们将需求分析分为两个步骤:1.理解用户需求;2.提[详细]
-
推荐系统技术之文本相似性计算(三)
所属栏目:[大数据] 日期:2021-03-11 热度:141
副标题#e# 今天这篇也比较长,但中间有部分是代码,7,8,9最后三节的信息我认为较为有用。前面说了两篇了,推荐系统技术之文本相似性计算(一)和推荐系统技术 --- 文本相似性计算(二)分别介绍了 TFIDF 和向量空间的相关东西,然后介绍了 主题模型 ,这[详细]
-
趣图:论修电脑和当医生的相似性
所属栏目:[大数据] 日期:2021-03-11 热度:53
(点击上方公众号,可快速关注) 既然喝水这么重要,今天来送个福利 ↓↓↓ 据路边社报道,水杯离你越近,喝水的频率将会越高。借今天的趣图,来团一款方便携带的随手水杯。emoi 品牌,环保,外观设计简洁大方,手感也很不错。密封防漏做的好,可随身携带[详细]
-
[生产库实战] 如何合理的使用logmnr进行日志挖掘,并对生产库影
所属栏目:[大数据] 日期:2021-03-11 热度:88
Oracle Logmnr这个工具怎么用这里就不详细说,可以查看官方文档,网上的文档也一大堆,自己找吧。我这里就直接上干货了。 --创建Oracle目录 select * from dba_directories; create directory archivelog_dir as '/archivelog1/temp_archivelog/'; --grant[详细]

浙公网安备 33038102330482号