发布日期:2026-01-01 12:19 点击次数:140
唯有改一滑代码开yun体育网,就能让大模子磨真金不怕火着力晋升至 1.47 倍。

领有得州大学奥斯汀分校布景四名华东谈主学者,建议了大模子磨真金不怕火优化器 Cautious Optimizers。
在提速的同期,Cautious 概况保证磨真金不怕火着力不出现弃世,而且言语和视觉模子都适用。

该优化器以哈密顿量和下落能源学为表面基础,在加快的同期不影响管理特点。
作家在 600M 到 1B 不同参数范围的 Llama 模子上进行了磨真金不怕火,获取了最高 47% 的加快率。
该督察关连代码如故开源,在 GitHub 上有使用圭臬的缜密训诫。

一滑代码修订大模子磨真金不怕火
Cautious Optimizers 在 PyTorch 当中加多的一滑代码,中枢念念路是引入罢了一种隐私机制,从而幸免参数更新的所在与刻下梯度所在各异。

因为这两个所在一朝不一致,就有可能导致弃世函数暂时加多,形成管理速率的减缓。
不外作家并未在所在不一致的开首问题上过度纠结,而是引入了一种判断机制,在参数更新之前加多一步计算,从而过滤掉所在不一致的情形。
这也恰是上头代码的径直作用。

△GD:梯度下落,GDM:带动量的梯度下落,C-GDM:本样式
具体来说,加入的两行代会对 u 和 g 两个向量求内积,u 向量对应优化器给出的参数更新所在,而 g 向量对应刻下本事的梯度所在。
作家瞎想了一个对王人掩码函数 ϕ,当 u 和 g 的内积小于 0 时(即所在不一致),ϕ 的输出为 0 向量;当内积大于就是 0 时,ϕ 的输出为全 1 向量。
而一朝 ϕ 为零向量时,w_t 计算式中含 u 的项也会变为零向量,导致此项更新被跳过。

这么就不错判断参数更新和梯度所在是否一致,要是不一致则不会用于参数更新,幸免了磨真金不怕火历程中弃世函数的回升。
磨真金不怕火着力晋升 47%
为了评估 Cautious Optimizers 的具体着力,作家分离在言语模子 Llama 和视觉模子 MAE 上进行了磨真金不怕火。
作家登科了 60M、100M、350M 和 1B 四种参数范围的 Llama 模子,在 C4 语料库上进行预磨真金不怕火。
优化器采选了 AdamW 和 Lion,以及它们对应的 Cautious 版块 :C-AdamW 和 C-Lion,每个推行中进行 1 万步迭代。
遏抑 C-AdamW 和 C-Lion 在系数范围上都发达出彰着的管理加快着力。
尤其是在 1B 范围上,比拟原版的 AdamW 和 Lion,它们的样本着力分离提高了 47% 和 28%,这标明 Cautious Optimizer 能灵验减少磨真金不怕火轰动,使管理更沉稳高效。

何况,Cautious Optimizer 在系数情况下都取得了更低的困惑度,印证了其出色的泛化性能。

为了评估模子的本色着力,督察者在语句匹配、文本蕴含、情愫分类等 6 个 GLUE 卑劣任务上测试了 AdamW 和 C-AdamW 优化后 1B 模子的发达 ,
遏抑标明,C-AdamW 的平均得分比 AdamW 超越 2%,在大大量任务上都取得了跨越,评释 Cautious 跳过部分参数更新的形式不会引起模子性能下落。

关于视觉模子,作家以 ViT 为主干麇集,在 ImageNet-1K 数据集上预磨真金不怕火了 MAE 模子。
由于视觉任务的尽头性,磨真金不怕火历程给与了随即狡饰图像块并重建的范式,因此优化盘算是最小化重建罪行,而非频繁的分类弃世。
作家对比了 AdamW 和 C-AdamW 的发达,即磨真金不怕火 50 轮后的最终重建罪行,遏抑 C-AdamW 的罪行动 0.5926,低于 AdamW 的 0.6085。

一作曾在一周内复刻 o1
本样式是由四名华东谈主学者共同打造的。
第一作家 Kaizhao Liang,是 AI 推理加快干事商 SambaNova 公司的又名高档 ML 工程师。
在 o1 模子发布一周内,该公司就推出了一个近似 o1 模子念念考历程的开源平替,主要作家恰是 Liang。

其他三名作家是得州大学奥斯汀分校 CS 助理教授 Qiang Liu,以及他的两名博士生,Lizhang Chen 和 Bo Liu。
此外,Liang 的东谈主工智能硕士学位亦然从该校获取。
论文地址:
https://arxiv.org/abs/2411.16085
GitHub:
https://github.com/kyleliang919/C-Optim
— 完 —
「MEET2025 智能当年大会」
火热报名中
定档 12 月 11 日!李开复博士、周志华教授、智源督察院王仲远院长都来量子位MEET2025 智能当年大会磋议行业破局之谈了!
最新嘉宾声势在此,不雅众报名通谈已开启!接待来到 MEET 智能当年大会,期待与您一谈料到智能科技新当年
傍边滑动检察最新嘉宾声势
点这里� � 海涵我,谨记标星哦~
一键三连「点赞」、「共享」和「在看」
科技前沿进展日日再会 ~
Powered by 开yun网页版app(官方)kaiyun网站/网页版登录入口/手机版最新 @2013-2022 RSS地图 HTML地图
Copyright Powered by365站群 © 2013-2024