• 梯度下降法可以求函数的最值
    • 一直沿着函数梯度一步步的走
      • 可以设置一个步长
        • 每次迭代都走这个步长
      • 走的越多, 离最值点越近
  • 类似于牛顿迭代法