如何查询酒店开房记录?谁可以查?去哪儿查?

简介说明

对于诸位“机器学习儿”而言,梯度下降这个概念一定不陌生,然而从直观上来看,梯度下降的复杂性无疑也会让人“敬而远之”。本文作者 Suraj Bansal 通过对梯度下降背后的数学原理进行拆解,并配之以简单的现实案例,以轻松而有趣的口吻带大家深入了解梯度下降这一在机器学习领域至关重要的方法。

敏捷软件开发定义了迭代产品开发的过程,以下步骤可通过这一过程执行。

1)市场调研后进行产品构建

2)产品商业化并进入市场

3)评估消费者满意度和市场渗透率

4)对反馈及时回应,并更新迭代产品

5)重复上述过程

这个过程实质上是将市场测试、 收集反馈和产品迭代反复进行,直到能以最小的误差实现最大的市场渗透率。此循环重复多次,并确保消费者可以在每个步骤中提供一定的反馈来影响产品的更改策略。

实际上,这种看似简单的反复迭代过程很好地体现在梯度下降原理中。梯度下降能够通过首先计算出成本函数的梯度、然后更新梯度对应的现有参数从而最小化成本函数来处理。

梯度将具有众多变量的函数转换为一个向量,稍后我们将对该话题进行讨论。

WOAHHHHHHHHHH......就此打住——这看起来太复杂啦!

你也许会对这张图片感到惊讶,但实际上你完全不用担心。

了解梯度下降背后的多米演算听起来可能会让人十分畏惧,别怕,下面我将对梯度下降背后的原理做出解释并且仅跟大家探讨理解梯度下降所需的数学概念。

在此之前,我强烈建议你们查看我此前写的一篇关于机器学习的文章或视频先对基础知识进行复习!

一、梯度下降变体:不止一个

梯度下降采用机器学习算法实现了三种主要的变体,每个变体在计算效率上各异并且都具有各自独特的优势。

1、第一种变体:批量梯度下降

批量梯度下降(Batch Gradient Descent)可以说是梯度下降变体中最简单的一种。这整个过程可以看作是训练迭代的次数(Epoch),即以决定训练用来更新模型权重的向量的次数。

批量梯度下降的误差通过训练集每一批单独的样本计算出来,并且在所有训练点数都在一个 Epoch 内经过机器学习算法的训练后更新模型参数。

更多相关信息可参考下面这篇文章(文中为大家推荐了五本机器学习相关的书籍):

该方法的误差梯度和收敛速度较为稳定,可以实现足够水平的计算效率。但是,由于该模型仅在分析了整个训练集之后才对权重进行迭代,此时的收敛状态可能不是最优的状态,事实上,该模型还可以优化以达到更精确的结果!

 

  • 发表于 2021-04-18 10:45
  • 阅读 ( 279 )
  • 分类:互联网

0 条评论

请先 登录 后评论
腾龙小熊
腾龙小熊

665 篇文章

你可能感兴趣的文章

相关问题