阿里巴巴未来三年将投入 3800 亿用于AI基建;DeepSeek启动开源周丨AIGC日报
大模型
1)DeepSeek启动开源周,首个代码库公开
刚刚,DeepSeek宣布启动“开源周”,并公开了首个开源的代码库Flash MLA。
这是一款针对英伟达Hopper架构GPU的高效多层注意力解码内核,旨在优化变长序列场景下的大模型推理性能。
该技术通过全面支持BF16精度和创新的页式键值缓存系统,显著提升了内存管理的精确性。FlashMLA在性能测试中表现出色,达到了3000GB/s的处理速度和580TFLOPS的算力。
按照计划,DeepSeek本周将公布5个开源项目。此前,DeepSeek曾表示,即将开源的代码库是他们在线服务中的基础组件,且都经过了详细记录、部署和实战测试的。
2)谷歌上线AI视频模型Veo 2 ,每秒售价50美分
今日消息,谷歌旗舰人工智能研究实验室Google DeepMind上线推出下一代视频旗舰模型Veo 2。Veo 2可以创建两分钟以上的视频片段,分辨率高达4k(4096 x 2160像素)。
DeepMind表示该模型可以生成多种风格视频,对物理和相机控制的“理解”有所提高,并能制作出“更清晰”镜头。
据该公司的定价页面,使用Veo 2每秒视频的费用为50美分,相当于每分钟30美元或每小时1800美元。
3)OpenAI 最新研究:当前 AI 模型仍无法媲美人类程序员
今日消息,尽管 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最先进的 AI 模型,仍无法与人类程序员相媲美。
研究人员在一篇新论文中指出,即使是前沿模型 —— 即那些最具创新性和突破性的 AI 系统 ——“仍然无法解决大多数”编程任务。
尽管论文指出,这三款 LLMs 通常能够“远快于人类”地完成任务,但它们却无法理解漏洞的广泛性及其背景,从而导致解决方案“错误或不够全面”。
3)月之暗面 Kimi 开源 Moonlight:30 亿 / 160 亿参数混合专家模型
今日消息,月之暗面 Kimi 昨日发布了“Muon 可扩展用于 LLM 训练”的新技术报告,并宣布推出“Moonlight”:一个在 Muon 上训练的 30 亿 / 160 亿参数混合专家模型(MoE)。使用了 5.7 万亿个 token,在更低的浮点运算次数(FLOPs)下实现了更好的性能,从而提升了帕累托效率边界。
月之暗面称,团队发现 Muon 优化器可通过添加权重衰减、仔细调整每个参数的更新幅度等技术进行扩展,并具备如下亮点:
这些技术使得 Muon 能够在大规模训练中开箱即用,无需进行超参数调优。扩展法则实验表明,与计算最优训练的 AdamW 相比,Muon 实现了约 2 倍的计算效率。
本次论文所使用的模型为 Moonlight-16B-A3B,总参数量为 15.29B,激活参数为 2.24B,其使用 Muon 优化器,在 5.7T Tokens 的训练数据下获得上述成绩。
AI应用1)微软 CEO 纳德拉:Xbox 将借助生成式 AI 技术开发多款电子游戏
今日消息,据 VGC 今日报道,微软首席执行官萨蒂亚・纳德拉表示,公司计划将其新推出的生成式 AI 模型“Muse”应用于多个电子游戏,并逐步推出 AI 参与制作的作品。
微软上周发布了 Muse,其为一款能够生成游戏视觉效果、控制器操作的生成式 AI 模型。在公告中,微软展示了 Muse 如何通过 2020 年的游戏《尖峰战队》的训练数据,来生成游戏画面。
纳德拉在本周的采访中提到 Muse 时,将其与自己首次接触其他生成式 AI 时的震撼体验相提并论。他表示,微软已经计划将这一技术应用于多个游戏项目。
1.【马斯克宣布Grok语音模式正式上线】北京时间2月23日,马斯克宣布,Grok语音模式早期测试版现已在Grok应用程序上线。“这是早期测试版本,可能会遇到一些问题(会迅速解决),但它依然非常棒。”马斯克表示。(新浪财经)
2.【高德红外黄立:下半年将对外发布人型机器人,目标是做到摸起来也像人】“亚布力中国企业家论坛第25届年会”于2025年2月21日-23日召开。在2025亚布力论坛年会闭幕式上,武汉高德红外股份有限公司董事长黄立出席并发表演讲。黄立表示,下半年将要对外发布我们自己的机器人。“现在做机器人可能有几百上千家,但我们的是独一无二的,在于驱动原理不同,我们不用电机,而是一个叫作‘人工肌肉’的专利,驱动原理和全世界都不一样,不光看起来像人,摸起来也像人,这是我们的目标。”(睿见)
3.【清华AIR联合水木分子开源DeepSeek版多模态生物医药大模型BioMedGPT-R1】清华大学人工智能产业研究院(AIR)和北京水木分子生物科技有限公司近日携手推出了升级版的生物医药多模态开源基础大模型BioMedGPT-R1。此前,在2023年,双方合作发布了开源可商用、生物医药多模态百亿参数开源基础大模型BioMedGPT,水木分子发布了自研千亿参数多模态生物医药专业大模型Chat DD-FM和新一代AI驱动药物发现工具Chat DD。这次DeepSeek版ChatDD- R1基座模型也已同步上线ChatDD,赋能生物医药企业的药物研发。(科创板日报)
4.【OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性】近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。(IT之家)
5.【全国首个垂直领域应急管理政务大模型在南京发布】2月23日消息,南京市应急管理局、南京市数据局2月21日与擎天科技联合发布全国首个垂直领域应急管理政务大模型——“宁安晴”。据南京市数据局有关人士介绍,“宁安晴”是基于南京政务云部署的DeepSeek—R1—671B满血版大模型深度定制开发,是“我的南京”政务版第一个专业部门智能体。采用南京政务云本地化部署,数据全链路加密并通过国家信息安全等级保护三级认证,确保敏感信息不出域。(财联社)