梯度下降法求极值和直接求导求极值的区别在哪?