OpenAI发布号称“情商最高”的AI模型GPT-4.5;Anthropic全面开放Claude AI的GitHub集成丨AIGC日报
1.【DeepSeek开源第四弹教优化,梁文锋参与研发】2月27日,DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。这三项优化并行策略其中包括DualPipe,这是一种用于V3/R1模型训练中计算与通信重叠的双向流水线并行算法,这种算法能够完全重叠前向和后向计算通信阶段,与传统方法相比减少了“流水线气泡”(设备在某些时刻的空闲等待)。在DualPipe的开发团队署名中,包括创始人梁文锋。(界面新闻)
2.【亚马逊Alexa+语音助手将采用Anthropic的Claude模型】当地时间2月26日,亚马逊宣布使用生成式AI重建Alexa语音助手,命名为Alexa+。Alexa+服务将收费19.99美元/月,亚马逊Prime会员可免费使用。人工智能初创公司Anthropic的Claude模型将为Alexa+提供支持。(腾讯网)
3.【Anthropic全面开放Claude AI的GitHub集成】Anthropic的Claude关系负责人Alex Albert于2月25日在X平台发布推文,宣布面向免费、Pro和Teams用户,开放GitHub集成Claude。GitHub集成此前仅限Claude企业版(Claude for Enterprise),为企业用户提供更强大的代码理解和辅助能力。集成方式主要为将GitHub代码库直接同步到Claude,让Claude能够理解代码库的上下文,帮助用户测试和调试代码、理解代码库并提供更有效的代码辅助功能等。(IT之家)
4.【微软Phi-4多模态及迷你模型上线,语音视觉文本全能】微软进一步扩展Phi-4家族,推出了两款全新模型:Phi-4多模态(Phi-4-multimodal)和 Phi-4 迷你(Phi-4-mini)。Phi-4多模态模型是微软首款集成语音、视觉和文本处理的统一架构多模态语言模型,参数量达56亿。在多项基准测试中,Phi-4多模态的表现优于其他现有的先进全模态模型,例如谷歌的Gemini 2.0 Flash和Gemini 2.0 Flash Lite。Phi-4迷你模型则专注于文本任务,参数量为38亿。(IT之家)
大模型
1)OpenAI发布号称“情商最高”的AI模型GPT-4.5
当地时间 2 月 27 号下午,OpenAI 在一场简短的直播中推出了“情商最高”的模型 GPT-4.5,其内部代号为 Orion。
在官宣 GPT-4.5 消息时,OpenAI CEO 山姆·奥特曼(Sam Altman)写道:“我们的规模一直在不断增长,GPU 已经用完了。我们将在下周新加数万颗 GPU……这不是我们想要的运营方式,但很难完美预测哪些激增会导致 GPU 短缺。”
OpenAI 称其为该公司“迄今为止最大、知识最丰富的聊天模型”,但也强调,它不是一个前沿模型,在某些方面的性能不如 o1 或 o3-mini。
AI应用
1)荣耀与阿里在AI领域合作:千问、万相等多个模型已接入YOYO智能体
2 月 28 日消息,荣耀今日表示,已与阿里在 AI 领域展开合作,为全球用户提供服务。目前千问(Qwen)、万相(Wan)等多款语言、视觉理解、图像生成模型已接入荣耀 YOYO 智能体,用户可通过 Magic7 系列手机等终端体验 AI 功能。
2)远超 GPT-4o,Physical Intelligence 推出 Hi Robot,通过“自言自语”学会人类思维
美国具身智能初创公司Physical Intelligence推出“分层交互式机器人”Hi Robot系统,能将视觉 - 语言 - 行动(VLA)模型纳入分层推理过程。π0作为“系统1”执行熟练任务,高层次语义视觉 - 语言模型(VLM)充当“系统2”,通过“自言自语”推理复杂任务并拆解步骤。
Hi Robot在性能上优于GPT - 4o和平面VLA策略,指令跟随准确率比GPT - 4o高出40%,其目标是赋予机器人类似人类的“内心声音”,更好地理解环境和推理问题。
3) 2025年Figure将人形机器人用于家庭场景,进行“alpha 测试”
Figure 计划比预期更早将其人形机器人引入家庭。
公司CEO Brett Adcock 周四证实,这家位于湾区的机器人初创公司将于 2025 年晚些时候开始在家居环境中对其 Figure 02 机器人进行“alpha 测试”。
该高管表示,这一加速的时间表得益于公司名为 Helix 的“通用型”视觉-语言-行动(VLA)模型。Adcock 的评论发表于 Figure 宣布机器学习平台一周后。
Helix 旨在处理视觉数据和自然语言输入,以加速系统学习新任务的速度。本月早些时候,Figure 透露将终止与 OpenAI 备受瞩目的合作关系,转而采用如 Helix 这样的自有 AI 模型。