加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

想从事数据科学相关岗位,这些数学基

发布时间:2018-09-18 20:07:40 所属栏目:教程 来源:佚名
导读:副标题#e# 9月15日技术沙龙 | 与东华软件、AWS、京东金融、饿了么四位大咖探讨精准运维! 很多同学想从事数据科学岗位,对于这个岗位而言,数学知识的储备重要吗? 答案显而易见,掌握好数学对于从事该岗位而言是很重要的。数学一直是任何当代科学学科的基础

线性代数

想从事数据科学相关岗位,这些数学基础“必备”

What:社交网络软件上的朋友推荐、音乐APP中的歌曲推荐以及使用深度迁移学习将自拍照转换为其它风格的图像,这些都有用到线性代数的知识。线性代数是数学领域的一个重要分支,用于理解大多数机器学习算法如何在数据流上工作以创建洞察力。以下是要学习的基本内容:

  • 矩阵和向量的基本属性——标量乘法、线性变换、转置、共轭、秩、行列式
  • 内积外积、矩阵乘法法则和各种算法、逆矩阵
  • 特殊矩阵——方阵、单位矩阵、三角矩阵、稀疏和密集矩阵、单位向量、对称矩阵、埃尔米特矩阵、斜埃尔米特矩阵和酉矩阵,
  • 矩阵分解、高斯/高斯-若尔消除法,求解Ax = b方程的线性系统
  • 矢量空间、基、跨度、正交性、线性最小二乘,
  • 特征值、特征向量和对角化,奇异值分解(SVD)

示例:如果你使用过主成分分析(PCA)降维技术,那么你可能已经使用过奇异值分解来实现数据集的紧凑维度表示,使得参数更少。所有神经网络算法都使用线性代数技术来表示和处理网络结构和学习操作。

学习资源:

线性代数基础—— edX
https://courses.edx.org/courses/course-v1:UTAustinX+UT.5.05x+2T2017/course/

机器学习数学:线性代数——Coursera
https://www.coursera.org/learn/linear-algebra-machine-learning

微积分

想从事数据科学相关岗位,这些数学基础“必备”

What:无论你在大学期间喜欢它还是讨厌它,在数据科学或机器学习领域的许多地方都会应用微积分的概念。它隐藏在线性回归中最小二乘问题的简单分析解决方案背后,或者嵌入到神经网络学习新模式的每个反向传播中。以下是要学习的内容:

  • 单变量、极限、连续性和可微性的函数
  • 中值定理、不确定性和洛必达法则
  • 极大值和极小值
  • 乘积和链式法则
  • 泰勒级数、无穷级数求和/积
  • 积分计算和中值定理、对有限和不正确积分的评价,
  • Beta和Gamma函数
  • 多变量函数、极限、连续性、偏导数
  • 普通和偏微分方程的基础知识

示例:如何实现逻辑回归算法,它很有可能使用一种称为“梯度下降”的方法来找到最小损失函数。要了解其如何工作,需要使用来自微积分的基本概念——梯度、导数、极限和链式法则。

学习资源:

大学前掌握的微积分——edX
https://www.edx.org/course/pre-university-calculus

可汗学院的微积分全部内容
https://www.khanacademy.org/math/calculus-home

机器学习数学:多变量微积分——Coursera
https://www.coursera.org/learn/multivariate-calculus-machine-learning

离散数学

想从事数据科学相关岗位,这些数学基础“必备”

What:这部分内容通常是“数据科学数学”方案中较少讨论的主题,但事实是所有现代数据科学都是在计算系统的帮助下完成的,离散数学是这类系统的核心。要学习的内容:

  • 集合、子集和幂集
  • 计数函数、组合学、可数性
  • 基本证明技术——归纳法、反证法
  • 归纳、演绎和命题逻辑的基础知识
  • 基本数据结构——堆栈、队列、图、数组、哈希表、树
  • 图表属性——连接组件、度、最大流量/最小切割概念、图形着色
  • 递归关系和方程
  • 函数的增长和O(n)符号概念

示例:在任何社交网络分析中,你需要知道图的属性和快速算法以搜索和遍历整个网络。在选择任何算法时,都需要通过使用 O(n)表示法来了解时间和空间复杂度。

学习资源:

计算机科学专业的离散数学概论——  Coursera
https://www.coursera.org/specializations/discrete-mathematics

数学思维导论——Coursera
https://www.coursera.org/learn/mathematical-thinking

掌握离散数学:集合、数学逻辑—— Udemy
https://www.udemy.com/master-discrete-mathematics/

最优化、运筹学

想从事数据科学相关岗位,这些数学基础“必备”

What:这些主题与应用数学中的传统话语没什么不同,因为它们在专业领域——理论计算机科学、控制理论或运筹学中最为相关和最广泛使用。实际上,每种机器学习算法旨在最小化受各种约束影响的某种估计误差,这就是优化问题。要学习的内容:

  • 优化的基础——如何制定问题
  • 最大值、最小值、凸函数、全局解
  • 线性规划、单纯形算法
  • 整数规划
  • 约束编程、背包问题

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读