NVIDIA NeMo 通过 AutoModel 功能增强 Hugging Face 模型集成
By: blockchain news|2025/05/13 15:45:04
0
分享
NVIDIA 推出了 NeMo 框架的重大增强,推出了 AutoModel 功能,旨在简化 Hugging Face 模型的集成和微调。根据 NVIDIA 官方博客 的说法,该开发旨在支持最先进模型的 Day-0 支持,使组织能够高效利用生成式 AI 的最新进展。 AutoModel:模型集成的新纪元 AutoModel 功能作为 NeMo 框架内的高级接口,允许用户轻松微调来自 Hugging Face 的预训练模型。起初涵盖文本生成和视觉语言模型,AutoModel 计划扩展到视频生成和其他分类。该功能简化了模型并行的过程,通过 JIT 编译增强 PyTorch 性能,并确保无缝过渡到由 NVIDIA Megatron-Core 提供支持的最佳训练和后训练方案。 AutoModel 的引入解决了将新模型架构集成到 NeMo 框架中的挑战,提供了利用 Hugging Face 庞大模型库的简单途径。该功能通过完全分片的数据并行 2 (FSDP2) 和分布式数据并行 (DDP) 支持模型并行,未来扩展包括张量并行 (TP) 和上下文并行 (CP)。 高效训练和可扩展性 AutoModel 接口启用开箱即用的模型并行和增强的 PyTorch 性能,允许组织高效扩展它们的 AI 解决方案。集成使导出至 vLLM 进行优化推理变得轻而易举,计划很快引入 NVIDIA TensorRT-LLM 导出。这确保了组织能够维持高吞吐量和可扩展性,这对于竞争激烈的 AI 领域至关重要。 AutoModel 还提供了无缝的“选择加入”高性能 Megatron-core 路径,允许用户通过最小化代码修改切换到优化训练。一致的 API 确保了对 Megatron-Core 支持路径的最大吞吐量过渡是简单的。 扩展 NeMo 的能力 AutoModel 的引入是 NVIDIA 增强 NeMo 框架能力的更广泛战略的一部分。该功能不仅支持文本生成的 AutoModelForCausalLM 类,还允许开发人员通过创建子类来扩展对其他任务的支持,从而拓宽 AI 应用的范围。 随着 NeMo 框架 25.02 的发布,鼓励开发人员通过 NVIDIA 的 GitHub 仓库提供的教程笔记本探索 AutoModel。社区也被邀请提供反馈并为 AutoModel 功能的持续开发做出贡献,以确保其持续演变以满足尖端 AI 研究和开发的需求。 随着 AI 领域的快速发展,NVIDIA 的 NeMo 框架及其 AutoModel 功能,将自身定位为组织寻求最大化生成 AI 模型潜力的关键工具。通过实现无缝集成和优化性能,NeMo 框架使团队能够始终站在 AI 创新的前沿。 nvidia ai 模型 hugging face nemo 框架
猜你喜欢

可组合 RWA 的崛起
270亿RWA资金流向大洗牌:美债“遇冷”,高收益信用类资产正凭借无许可设计悄然霸占DeFi借贷市场,一文揭秘可组合RWA的爆发逻辑

Key Takeaways A prominent whale, known as “UnRektCapital,” has strategically escalated its short position in Bitcoin while simultaneously…

MegaETH 上线 FDV 突破 20 亿美元 ,哪些生态项目值得关注?
MegaETH 生态中诸多项目的融资与团队背景丰富,进而成为未发币公链中发展最繁荣的生态,也是撸毛党目前关注的重心。

对话「木头姐」Cathie Wood:下一轮牛市即将到来
黄金和比特币的相关系数只有 0.14。在过去两轮周期里,黄金都先于比特币启动,这次也一样。

预测市场们能赢得永续合约的竞赛吗?
Polymarket与Kalshi杀入永续合约赛道。面对Hyperliquid的“交叉保证金”降维打击,预测市场能否打破流失魔咒逆风翻盘?

到底是谁在 Trade.xyz 上交易?
一个 Polymarket 用户用 3.4 万个钱包撑起了 Trade.xyz 近半“活跃地址”,却只贡献不到 1% 的交易量。真正撑起盘口的是 Jump、Selini、Wintermute 等做市机构,以及一批从 Polymarket 跨界而来的方向性交易者。本文用链上数据拆解了 Trade.xyz 的参与者结构:谁在刷,谁在做市,谁在真交易。

币安悄悄押注了一家头部大模型公司
近一年,YZi Labs 在 AI 领域的投资动作明显提速,从教育 Agent 到物理机器人,再到大模型,加密资本与 AI 技术正在加速深度融合。

Stripe Sessions 2026:AI Agent、全球支付与隐形的加密基建
稳定币终于开始走向真实商业世界,但这一次,主角可能不是交易所、钱包或公链,而是 Stripe。它把 KYC、钱包、Gas、合规和结算全部封装起来,让企业像使用普通支付产品一样接入链上资产。加密行业等来的大规模采用,可能也是一次被支付巨头“收编”的开始。

韩国加密税收将走向何方?
距离韩国实施加密货币征税所剩时间不多,但现行税法仅覆盖简单的现货及币币交易。在国际税务信息交换标准(CARF)的推动下,韩国正全面构建情报分析系统。面对短期的监管空白,参考美国模式成为必然选择,但这同时也带来了公平性争议、监管套利以及链上交易追踪等深层难题。

传奇投资人纳瓦尔:Apple 已死,SaaS 也将步其后尘,创业者还有 18 个月重塑护城河
“你可以继续持有苹果股票。只是别指望你持有的是一家成长型公司的股票。”

早报 | Visa 将 Polygon 纳入全球稳定币结算计划;MoonPay 斥资 1 亿美元收购安全公司 Sodot;数字钱包平台 Belo 完成 1400 万美元 A 轮融资
4 月 29 日市场重要事件一览

美联储决议全文:连续第三次按兵不动但分歧加剧
美联储连续第三次维持利率不变,但内部投票出现分歧,一名官员主张降息,另有三人反对释放宽松信号。中东局势与能源价格波动进一步放大经济前景不确定性。

但斌出手,建仓 Circle
Web3 如果只是停留在价格和叙事上,传统资金很难真正进来;但一旦开始出现一批可以被解释清楚、可以被放进资产负债表里的公司,这个行业的参与方式就会发生变化。

Polymarket 交易策略尸检报告:20多个方向,「活」下来的只有4个
历时三个月、试遍 20 余种策略,大多死于市场效率、成本结构和数据幻觉。

DeFi 借贷的不可能两角
借款人希望固定利率,放贷方追求即时流动性,这是链上借贷的鱼与熊掌,二者不可兼得。

重新审视 RWA:近5万人第一笔链上交易不是比特币,而是股指和原油
RWA的叙事,不是传统来抢加密的用户,而是加密去抢传统的用户。

预言机:预测市场大战背后的第二战场
预言机赛道走到 2026 年,本质上已从早期的“数据管道”,演进为支撑整个链上经济的“可验证事实层”,而预测市场是观察这片红海竞争的放大镜。

a16z 重点押注:Kalshi 周交易额逼近 30 亿美元,从“预测游戏”到金融基础设施,市场开始给“不确定性”定价
预测市场的演进:从边缘产品到“不确定性定价”基础设施
可组合 RWA 的崛起
270亿RWA资金流向大洗牌:美债“遇冷”,高收益信用类资产正凭借无许可设计悄然霸占DeFi借贷市场,一文揭秘可组合RWA的爆发逻辑
Key Takeaways A prominent whale, known as “UnRektCapital,” has strategically escalated its short position in Bitcoin while simultaneously…
MegaETH 上线 FDV 突破 20 亿美元 ,哪些生态项目值得关注?
MegaETH 生态中诸多项目的融资与团队背景丰富,进而成为未发币公链中发展最繁荣的生态,也是撸毛党目前关注的重心。
对话「木头姐」Cathie Wood:下一轮牛市即将到来
黄金和比特币的相关系数只有 0.14。在过去两轮周期里,黄金都先于比特币启动,这次也一样。
预测市场们能赢得永续合约的竞赛吗?
Polymarket与Kalshi杀入永续合约赛道。面对Hyperliquid的“交叉保证金”降维打击,预测市场能否打破流失魔咒逆风翻盘?
到底是谁在 Trade.xyz 上交易?
一个 Polymarket 用户用 3.4 万个钱包撑起了 Trade.xyz 近半“活跃地址”,却只贡献不到 1% 的交易量。真正撑起盘口的是 Jump、Selini、Wintermute 等做市机构,以及一批从 Polymarket 跨界而来的方向性交易者。本文用链上数据拆解了 Trade.xyz 的参与者结构:谁在刷,谁在做市,谁在真交易。

