加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 大数据 > 正文

R语言数据处理——tidyr包

发布时间:2021-03-15 02:05:27 所属栏目:大数据 来源:网络整理
导读:????在实际进行数据分析的过程中,我们常需要对数据进行一些相应的整理,“ tidyr 包”中的 gather(宽数据转为长数据)、 spread(长数据转为宽数据)、 unit(多列合并为一列)、 separate(将一列分离为多列)这四个函数为我们的数据整理提供了极大的便

????在实际进行数据分析的过程中,我们常需要对数据进行一些相应的整理,“tidyr包”中的gather(宽数据转为长数据)、spread(长数据转为宽数据)、unit(多列合并为一列)、separate(将一列分离为多列)这四个函数为我们的数据整理提供了极大的便利。

????下面本文将以R自带的mtcars数据集来演示tidyr包”的用法。

数据准备:

R语言数据处理——tidyr包

为方便处理,在数据集中增加一列car?:

gather

gather的调用格式为:

这里,...表示需要聚合的指定列。

利用gather进行聚合:

R语言数据处理——tidyr包

? ? ????如聚合结果所示,除了car列外,其余列聚合成两列,分别命名为attributevalue。如果你想gathermapgear之间的所有列而保持carbcar列不变,可以如此操作:

spread

spread的调用格式为:

R语言数据处理——tidyr包

利用spread进行聚合:

R语言数据处理——tidyr包

unite

unite的调用格式如下:这里,...表示需要合并的列,col表示合并后的列。

数据构造:

R语言数据处理——tidyr包

现在,我们需要把datehourminsecond列合并为新列datetime。通常,R中的日期时间格式为"Year-Month-Day-Hour:Min:Second"。

R语言数据处理——tidyr包

separate

separate的调用格式为:

R语言数据处理——tidyr包

我们可以用separate函数将数据恢复到刚创建的时候,如下所示:

分离过程为,先将datetime分为date列和time列。再将time列分为hourminsecond列。

英文原版见:Data manipulation with tidyr

(http://datascienceplus.com/data-manipulation-with-tidyr/)

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读