微软携手 NVIDIA 助推 RTX AI PC 上的 AI 开发
最新 AI 工具和功能加速 RTX AI PC 上的微软 Windows 应用开发
生成式 AI 赋能的笔记本电脑和 PC 正在推动游戏、内容创作、携手生产力和程序开发更进一步。助推目前,微软超过 600 款 Windows 应用和游戏已在全球超过 1 亿台 GeForce RTX AI PC 上本地运行 AI,提供快速、可靠的携手低延迟体验。
在 Microsoft Ignite 大会上,助推NVIDIA 与微软联合推出多个工具,帮助 Windows 开发者在 RTX AI PC 上快速构建和优化 AI 赋能的应用,使本地 AI 更加便捷。这些新工具使应用和游戏开发者能够利用强大的微软 RTX GPU 加速 AI 智能体、应用助手和数字人等应用的携手复杂 AI 工作流。
RTX AI PC 通过多模态小语言模型为数字人赋能
我们来认识一下 James,助推一个熟知 NVIDIA 及其产品的交互式数字人。James 将 NVIDIA NIM 微服务、微软NVIDIA ACE 和 ElevenLabs 数字人技术相结合,携手可提供自然的沉浸式交互体验。
NVIDIA ACE 是助推一套数字人技术,可以让智能体、助手和虚拟形象栩栩如生。微软为了深度理解信息,携手以更强的情境感知能力做出响应,数字人必须能够像人一样在视觉上感知世界。
提升数字人交互的助推真实感,需要能够感知和理解周围环境更细微差别的技术。为此,NVIDIA 开发了多模态小语言模型,可同时处理文本和图像信息,在角色扮演方面表现出色,并针对响应速度进行了优化。
NVIDIA 即将推出的 Nemovision-4B-Instruct 模型利用最新的 NVIDIA VILA 和 NVIDIA NeMo 框架进行蒸馏、剪枝和量化,使其体积小到足以在 RTX GPU 上以开发者所需的精度运行。该模型使数字人能够理解现实世界和屏幕上的视觉图像,以做出相关的响应。多模态作为智能体工作流的基础,让我们得以窥见未来,届时数字人只需极少的用户辅助,即可进行推理并采取行动。
NVIDIA 还推出了 Mistral NeMo Minitron 128k Instruct 系列模型,这是一套专为优化的高效数字人交互而设计的长上下文小语言模型。这一系列模型提供 8B、4B 和 2B 参数版本的灵活选项,以平衡在 RTX AI PC 上运行的速度、显存用量和模型精度。模型单次推理可以处理大量数据,无需进行数据分割和重组。这些模型提供 GGUF 格式,为低功耗设备的效率进行优化,并与多种编程语言兼容。
利用面向Windows 的NVIDIA TensorRTModel Optimizer 加速生成式AI
将模型引入 PC 环境时,开发者面临着有限的显存和计算资源,这为本地运行 AI 提出了挑战。开发者希望模型可以被更多人使用,同时精度损失最小。
今天,NVIDIA 公布了 NVIDIA TensorRT Model Optimizer (ModelOpt) 的更新,为 Windows 开发者提供了针对 ONNX Runtime 部署的模型优化方案。借助最新更新,TensorRT ModelOpt 可将模型优化为 ONNX 格式,以便使用 CUDA、TensorRT 和 DirectML 等 GPU 运行后端在 ONNX 运行时环境中部署模型。
最新更新使模型可优化为 ONNX 检查点,以便通过 CUDA、TensorRT 和 DirectML 等执行提供商在 ONNX 运行时环境中部署模型,从而提高整个 PC 生态系统的精度和吞吐量。
在部署时,与 FP16 模型相比,这些模型可将显存占用减少 2.6 倍。这可提高吞吐量,同时精度损失降到最低,使其能够在更多的 PC 上运行。
详细了解从 Windows RTX AI PC 到 NVIDIA Blackwell 驱动的 Azure 服务器等 Microsoft 系统开发者如何改变用户日常与 AI 交互的方式。
- ·Shams:卡鲁索4年8100万美元续约雷霆
- ·钟睒睒不建议长期喝绿瓶水:不含矿物质 也不值钱
- ·只有苹果朋友圈才能看Live Photo 真不是微信不给安卓面子
- ·[JR热议]梦之队Pro训练赛聊天说小胖不打挑杯,你怎么看?
- ·《VR战士5 R.E.V.O.》上市日期公布 公测正在进行中
- ·钟睒睒不建议长期喝绿瓶水:不含矿物质 也不值钱
- ·[流言板]哈勒尔今日NBL比赛中推搡被驱逐,随后又和场边球迷爆发斗殴
- ·小鹏活过来了!最佳财报各项指标创新高 盈亏平衡都敢想了
- ·2025年U21欧青赛小组抽签:西班牙和意大利A组,英格兰和德国B组
- ·网友吐槽何同学道歉信:把抄袭说成文案不严谨
- ·小米SU7车位到车位智驾全自动:全程无感 丝般流畅
- ·【在现场】远藤航:明天是场艰苦的比赛,但会尽全力拿3分
- ·蓝狐再下一城两球领先西汉姆联,范尼激情庆祝
- ·TT是先飞回成都休整几天,然后再飞去伦敦么。
- ·防伪技术取得新突破!飞秒激光刻出证卡专属“指纹”
- ·销量微降1%:李斌将主动调整促销政策
- ·横板科幻平台解谜《换影循迹》确认2025年3月13日发售
- ·宝马和九号公司达成合作 将开发两轮电动车新品
- ·TT总决赛,我来支招,因为只有三天时间,首发可以先上花痴,打前面三局,如果整体打的不错,就继续上,打的不好后面全部让释怀打;首发释怀如果打的不好,教练一定纠结要不要换花痴,三天没有时间调整。
- ·[流言板]克内克特三分命中连拿6分,湖人替补阵容连续上分追至18分
- ·2.3分!吧友怒批阿尔特塔:不辞职天理难容,进攻便秘
- ·[流言板]詹宁斯:乔治可以退役了,不想成为第一选择就别投最后一球
- ·钟睒睒不建议长期喝绿瓶水:不含矿物质 也不值钱
- ·效率惊人!哈兰德国家队打进38球超越本泽马,而且少踢了58场比赛
- ·[流言板]尼克斯记:兰德尔直接回到更衣室,没和任何老队员交流
- ·摩尔线程显卡DX12驱动正式发布!特别优化《黑神话:悟空》