优化深度学习模型的更快方法
人工智能及其相关术语现在已广为人知。许多人听说过“神经网络”等术语,甚至可能将“CNN”与“卷积神经网络”联系起来,而不是新闻机构。那些对人工智能感兴趣的人甚至可能知道 AlexNet,这是 2012 年彻底改变图像识别和深度学习的开创性 CNN 架构。
鲜为人知的是优化器或优化算法的使用,它们有助于提高 AI 模型的性能。例如,计算机视觉 AI 模型需要优化器来接收数据输入(视觉图像)并正确“预测”该数据,即正确地将熊猫图像识别为“熊猫”而不是“熊”或“考拉”。
“熊猫”将是人工智能模型每次都应该正确预测的基本事实,而人工智能预测和基本事实之间的差异被量化为一个称为训练损失的数字。
“给定一个任务,AI 模型将获取输入样本并输出其预测。如果没有经过训练,AI 模型通常无法正确预测,因此在任务中表现不佳,”SMU 计算机科学助理教授周攀解释道。“优化器是为了更新 AI 模型的参数,以便 AI 模型能够做出正确的预测。”
“优化器的主要作用是将训练样本输入AI模型,然后计算训练损失,即模型预测与真实预测之间的差异,最后调整模型参数以最小化训练损失。”
解决超调问题
不同类型的深度学习网络需要不同的优化器,通常需要经过多次试验才能选择最合适的优化器,而这往往既昂贵又耗时。
简单来说,当 AI 模型的输出与训练损失近似 V 形曲线的最低点相对应时,优化器就会发挥作用,这通常被称为收敛点。此时模型已经学会了最佳参数集,因此进一步的训练迭代不会显著提高其在当前任务上的表现。
有效优化的一个关键障碍是所谓的“超调问题”,即优化器产生与 V 形曲线另一侧相对应的预测,这需要重新校准以使预测回到曲线的轮廓。
周教授的最新项目“Adan:用于更快优化深度模型的自适应 Nesterov 动量算法”试图解决超调问题。
他解释道:“Adan优化器可以加速模型寻找良好模型参数的过程。在每次训练迭代中,和其他优化器一样,Adan也会将数据输入模型,然后计算训练损失,最后计算模型参数的梯度。”
“但它在用梯度来更新参数的时候,会先一步一步的更新模型参数,看当前模型参数更新得好不好,如果好,就以较大的步长去更新模型参数;否则,就以较小的步长,慢慢的更新参数,这样就保证了参数更新总是朝着正确的方向,从而保证了更快的收敛速度。”
划时代的成就
神经网络训练的改进可以通过时期来衡量,其中一个时期是整个训练数据集的完整传递或循环。
周教授预计,Adan 将在视觉、语言和强化学习等主要深度学习任务上超越现有的最先进 (SoTA) 优化器,例如 AlphaGo 所依赖的优化器,AlphaGo 是 2017 年在古代棋盘游戏围棋中击败世界顶级人类选手的人工智能模型。
“总体而言,Adan 可以使用一半的训练迭代来实现与 SoTA 优化器相当的性能,”周教授详细阐述道。
“对于视觉任务,在用于监督图像分类任务的 ViT 和 Swin 模型上,Adan 可以使用 150 个训练 epoch 来实现与训练 300 个 epoch 的 SoTA 优化器 AdamW 类似的性能。在用于自监督图像分类任务的 MAE 模型上,Adan 可以使用 800 个训练 epoch 来实现与训练 1,600 个 epoch 的 SoTA 优化器 AdamW 类似的性能。
“对于语言任务,在 GPT2 上,Adan 可以使用 150k 次训练迭代来实现与训练 150k 次训练迭代的 SoTA 优化器 Adam 类似的性能;在 Transformer-XL 上,Adan 可以使用 100k 次训练迭代来实现与训练 200k 次训练迭代的 SoTA 优化器 Adam 相同的性能。”
对于 RL 或强化学习任务,Adan 致力于开发四款游戏,分别是 Ant、Half Cheetah、Humanoid 和 Walker2d。为简单起见,人们通常将它们称为MuJoCo 游戏。这些游戏旨在控制机器人的身体在 3D 环境中稳定而稳健地完成不同的活动,例如行走和跑步。
周教授表示: “在强化学习中,通过使用相同的训练迭代,Adan 在四项测试的游戏任务中总是取得比 SoTA 优化器 Adam 更高的性能。”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
截至2024年,大众探岳GTE的售价可能会因地区、配置和促销活动而有所不同。一般来说,2024款探岳GTE的价格可能...浏览全文>>
-
关于2025款途观L的价格信息,目前还没有官方发布。不过,根据以往的市场规律和车型更新周期,我们可以大致推测...浏览全文>>
-
根据您提供的信息,2024款广东东莞威然的最低售价为22 99万元起。关于具体的落地价,需要考虑以下因素:1 ...浏览全文>>
-
根据您的描述,生活家PHEV 2025款的最低售价为 63 98万元起。如果目前有促销活动或优惠政策,建议尽快咨询...浏览全文>>
-
奔腾T99作为一汽奔腾旗下的旗舰SUV车型,凭借其大气的外观设计、丰富的科技配置以及出色的性能表现,吸引了众...浏览全文>>
-
当然可以!以下是一个简单的试驾预约流程,帮助您轻松开启智蓝G5新能源的试驾之旅:1 确定需求- 车型选择...浏览全文>>
-
特斯拉的赛博越野旅行车(Cybertruck)自发布以来就引发了广泛关注。这款车型结合了皮卡的实用性、SUV的多功能...浏览全文>>
-
江淮悍途EV是一款纯电动皮卡,如果您想预约试驾,通常需要满足以下条件和准备以下信息:1 基本条件 - 年...浏览全文>>
-
截至我所掌握的信息,瑞驰新能源的ED75 2024款具体价格和配置可能会因地区、经销商以及政策补贴的不同而有所...浏览全文>>
-
在考虑购买上汽大众ID 4 X时,了解车辆的价格以及相关的购车费用是非常重要的。以下是一些关键信息和费用明...浏览全文>>
- 山东济南途观L新能源价格大公开,买车不花冤枉钱
- 东莞途岳最新价格2025款全分析,买车不踩坑
- 济南探岳GTE新车报价2024款,换代前的购车良机,不容错过
- 郑州ID.7 VIZZION多少钱 2024款落地价,配置升级,值不值得买?
- 郑州途锐新能源最新价格2024款,优惠购车,最低售价67.98万起
- 瑞虎7 PLUS新车报价2025款,买车前的全方位指南
- 广东东莞揽巡价格走势,市场优惠力度持续加大
- 轩逸新车报价2025款,买车前的全方位指南
- 飞凡R7新车报价2025款,换代前的购车良机,不容错过
- 试驾风光ix5,轻松搞定试驾
- 捷途山海L7预约试驾,从预约到试驾的完美旅程
- 试驾E福顺,从预约到试驾的完美旅程
- 长安星卡EV多少钱?选车指南与落地价全解析
- 凯翼E5 EV多少钱?如何挑选性价比高的车
- 标致408X预约试驾,快速操作,轻松体验驾驶乐趣
- 试驾星际牛魔王,新手必看的操作流程
- 岚图汽车岚图梦想家试驾预约,轻松几步,畅享豪华驾乘
- 影豹多少钱?全方位对比助你选车
- 豪运最新价格2023款,豪华配置超值价来袭
- 缤智多少钱 2025款落地价全解买车必看