首页 > 建设工程

题目内容（请给出正确答案）

[多选题]

假设在一个深度学习网络中，批量梯度下降花费了大量时间时来找到一组参数值，使成本函数小。以下哪些方法可以帮助找到值较小的参数值？（）

A.令所有权重值初始化为0

B.尝试调整学习率

C.尝试mini-batch梯度下降

D.尝试对权重进行更好的随机初始化

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“假设在一个深度学习网络中，批量梯度下降花费了大量时间时来找到…”相关的问题

第1题

假设在一个深度学习网络中批处理梯度下降花费了太多的时间来找到一个值的参数值，该值对于成本函数J(W[1],b[1],…,W[L],b[L])来说是很小的值。以下哪些方法可以帮助找到J值较小的参数值()

A.尝试使用Adam算法

B.尝试对权重进行更好的随机初始化

C.尝试调整学习率α

D.尝试mini-batch梯度下降

点击查看答案

第2题

假设你有一个非常大的训练集合，如下机器学习算法中，你觉着有哪些是能够使用map-reduce框架并能将训练集划分到多台机器上进行并行训练的（)。

A.逻辑斯特回归(LR)，以及随机梯度下降(SGD)

B.线性回归及批量梯度下降(BGD)

C.神经网络及批量梯度下降(BGD)

D.针对单条样本进行训练的在线学习

点击查看答案

第3题

假设在训练一个模型的时候，发现靠近输入层的网络层参数基本不更新，请问是什么原因？（）

A.梯度消失

B.梯度爆炸

C.过拟合

D.以上都不是

点击查看答案

第4题

在深度学习中，我们经常会遇到收敛到localminimum，下面不属于解决localminimum问题的方法是（）。

A.随机梯度下降

B.设置Momentum

C.设置不同初始值

D.增大batchsize

点击查看答案

第5题

下列关于深度学习中优化问题说法错误的是（）。

A.当优化问题的数值解接近局部最优值时，随着目标函数解的梯度接近或变为零，通过最终迭代获得的数值解可能仅使目标函数局部最优，而不是全局最优

B.在深度学习优化问题中，经常遇到的是梯度爆炸或梯度消失

C.优化问题中设置的学习率决定目标函数能否收敛到局部最小值，以及何时收敛到最小值

D.一般来说，小批量随机梯度下降比随机梯度下降和梯度下降的速度慢，收敛风险较大

点击查看答案

第6题

随机梯度下降算法是传统机器学习和深度学习中重要的算法之一，以下关于其说法正确的是（)。

A.收敛过程比较缓慢

B.难以收敛到极值

C.容易遇到局部极值问题

D.可以避免局部极值问题

点击查看答案

第7题

下面对梯度下降方法描述不正确的是（)。

A.梯度方向是函数值下降最快方向

B.梯度下降算法是一种使得损失函数最小化的方法

C.梯度下降算法用来优化深度学习模型的参数

D.梯度反方向是函数值下降最快方向

点击查看答案

第8题

对于卷积神经网络而言，减少梯度消失不适合采用以下哪些方法（)？

A.增大学习率

B.减少网络深度(隐层个数)

C.skipconnection

D.减少通道数

点击查看答案

第9题

深度学习采用了layer-wise的训练机制，克服了BP神经网络训练中的梯度扩散问题。（)

点击查看答案

第10题

在深度学习中，下列对于sigmoid函数的说法，错误的是（）。

A.存在梯度爆炸的问题

B.不是关于原点对称

C.计算exp比较耗时

D.存在梯度消失的问题

点击查看答案

第11题

下面关于经典的卷积神经网络说法错误的是（）。

A.AlexNet的网络结构和LeNet非常类似，但更深更大，并且使用了层叠的卷积层来获取特征

B.GoogLeNet的主要贡献是实现了一个bottleneck模块，能够显著地减少网络中参数的数量

C.ResNet使用了特殊的跳跃链接，大量使用了批量归一化，并在最后使用了全连接层

D.VGGNet的主要贡献是展示出网络的深度是算法优良性能的关键部分

点击查看答案

湘ICP备2021011892号湘公安备案43019002002176号营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）