题目内容（请给出正确答案）

[多选题]

假设在一个深度学习网络中批处理梯度下降花费了太多的时间来找到一个值的参数值，该值对于成本函数J(W[1],b[1],…,W[L],b[L])来说是很小的值。以下哪些方法可以帮助找到J值较小的参数值()

A.尝试使用Adam算法

B.尝试对权重进行更好的随机初始化

C.尝试调整学习率α

D.尝试mini-batch梯度下降

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“假设在一个深度学习网络中批处理梯度下降花费了太多的时间来找到…”相关的问题

第1题

随机梯度下降算法是传统机器学习和深度学习中重要的算法之一，以下关于其说法正确的是（)。

A.收敛过程比较缓慢

B.难以收敛到极值

C.容易遇到局部极值问题

D.可以避免局部极值问题

点击查看答案

第2题

对于卷积神经网络而言，减少梯度消失不适合采用以下哪些方法（)？

A.增大学习率

B.减少网络深度(隐层个数)

C.skipconnection

D.减少通道数

点击查看答案

第3题

假设你有一个非常大的训练集合，如下机器学习算法中，你觉着有哪些是能够使用map-reduce框架并能将训练集划分到多台机器上进行并行训练的（)。

A.逻辑斯特回归(LR)，以及随机梯度下降(SGD)

B.线性回归及批量梯度下降(BGD)

C.神经网络及批量梯度下降(BGD)

D.针对单条样本进行训练的在线学习

点击查看答案

第4题

深度学习采用了layer-wise的训练机制，克服了BP神经网络训练中的梯度扩散问题。（)

点击查看答案

第5题

机器学习中，为何要经常对数据做归一化（)①归一化后加快的梯度下降对最优解的速度②归一化有可能提高精度③归一化有一定提高精度

A.①②③

B.②③

C.①②

D.①③

点击查看答案

第6题

你正在训练一个RNN网络，你发现你的权重与激活值都是“NaN”，下列选项中，哪一个是导致这个问题的最有可能的原因（)

A.梯度消失

B.梯度爆炸

C.eLU函数作为激活函数g(.)，在计算g(z)时，z的数值过大了

D.Sigmoid函数作为激活函数g(.)，在计算g(z)时，z的数值过大了

点击查看答案

第7题

后向传播是一种用于分类的（)算法，使用梯度下降方法，它搜索一组权重，这组权重可以对数据建模，使得数据元组的网络类预测和实际类标号之间的均方差距离最小。

A.贝叶斯算法

B.支持向量机算法

C.神经网络算法

D.决策树算法

点击查看答案

第8题

AlphaGo用了两个深度学习网络：___。

A.对等网络

B.价值网络

C.深度网络

D.策略网络

点击查看答案

第9题

所谓深度学习，是指多层神经网络中每一层学一个简单的任务，从简单的部件构成复杂对象的过程。（)

点击查看答案

第10题

操作系统是最基本、最重要的系统软件，目前种类繁多，（）指计算机连接多个终端，每个终端有一个用户在使用，系统把主机时间分成若干时间片，采用时间片轮转法的方式处理用户的服务请求，给每个用户分配一段CPU时间进行处理。

A.批处理系统

B.分时操作系统

C.网络操作系统

D.分布式操作系统

点击查看答案

湘ICP备2021011892号湘公安备案43019002002176号营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）