力压 R,Python 在数据科学领域风生水起
9月15日技术沙龙 | 与东华软件、AWS、京东金融、饿了么四位大咖探讨精准运维!
TIOBE 最新发布的 9 月编程语言排行榜中,Python 凭 4.67% 的增速以 0.26% 的优势力压 C++,逆袭成功进入 Top 3。 而近一年势头不灭的 Python 在数据分析领域,是专家们的必备技能。随着 IT 行业的增长,对有经验的数据科学家的需求也水涨船高,而 Python 也一跃而成最受欢迎的语言。本文旨在介绍分析数据的基本知识,并利用 Python 创建一些漂亮的数据可视化。 概要 数据科学领域,非 Python 语言莫属? Python 是最适合数据科学家的语言,这一点毫无争议。下面几点可以帮你理解为什么从事数据科学的人选择了 Python: 你知道最大的好处是什么吗?数据科学家是目前收入最高的职位之一,根据 Indeed.com 的数据,平均年薪为 $130,621。 Python 由 Guido Van Rossum 于 1989 年创建。它是个解释语言,拥有动态语义。它在所有的平台上可以免费使用。Python 是: ![]() 为数据科学中的 Python 安装 Jupyter 我们先来在自己的系统上安装 Jupyter。请按照以下步骤进行: 我建议你使用 Anaconda 发行版(https://www.anaconda.com/download/)安装 Python 和 Jupyter。装好Jupyter 之后,可以在命令行中输入“Jupyter Notebook”即可在默认浏览器中打开。现在我们在 Jupyter 上写个最基本的程序。
要运行这段代码,可以按下“Shift+Enter”,即可查看输出。如下面的截图所示: ![]() 数据科学中的 Python 的基础 现在可以开始编程了。为了编程,你需要先了解以下的基础知识: 关于 Python的更多信息和实际的实现,可以参考这篇文章:Python 入门(https://www.edureka.co/blog/python-tutorial/)。 数据科学中的 Python 库 这是 Python 在数据科学中发挥力量的部分。Python 拥有大量用于科学计算、分析、可视化等的库。一些库如下: Demo:实际应用 问题描述:给定一组数据集,该数据集是由多种数据组成的综合统计数据,如监狱设施的分布和情况、监狱的拥挤程度、监狱中的犯人类型,等等。请在这个数据集上做描述性的统计,并从数据中找出有用的信息。下面是几个任务: 加载数据使用以下代码:
![]() 然后用 Pandas 的 describe 方法,只需输入以下语句:
![]() 然后进行数据操作:
![]() 最后,用 Python 做一些数据可视化。代码如下:
![]() 【编辑推荐】
点赞 0 (编辑:PHP编程网 - 黄冈站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |