OpenAI悄悄上线OpenAI学院,免费提供 AI 教育资源;腾讯发布GeometryCrafter:用AI解锁开放世界视频的几何一致性之美 | AIGC日报

2025-04-02 21:40:50
收藏

1)消息称阿里将在下周发布 Qwen3

据虎嗅获悉,阿里即将在 2025 年 4 月第二周(即下周)发布新模型 Qwen3,这将是阿里在 2025 年上半年最重要的模型产品,而距离 2024 年 9 月阿里在云栖大会上发布 Qwen2.5 ,已过去了大约七个月的时间。

上月,通过 GitHub 信息显示,Qwen3 和 Qwen3 MoE 版本已经给 transformers 提了 PR。且阿里云通义千问团队早前透露,Qwen3 预计将于 2025 年第二季度正式发布。

据了解,在发布 Qwen2.5 后,阿里云内部的基础模型团队已经开始推动 Qwen3 相关项目,但 2025 年初 DeepSeek 的火爆,改变了团队的部分思路与重心。知情人士透露,DeepSeek 火爆后,推理能力已经成为大模型绕不开的关键能力,并且阿里云基础模型团队把策略中心进一步向模型的推理能力倾斜。

2)李飞飞:AI 不应两极化

据联合早报消息,「AI 教母」李飞飞日前在新加坡亚洲科技会展的一场炉边对话,分享了她所倡议的 AI 治理框架。

李飞飞认为,许多关于AI的讨论和看法,都过于两极:一方面是来自硅谷的科技乌托邦,科技只会带来好处。另一方面,是彻底的反乌托邦,认为 AI 将导致人类灭绝。基于此观点,李飞飞提出了她形容为「最无聊乏味」的治理框架:我们缺少的是一个与人为善、以人为本的框架。

3)MiniMax Audio推出Speech-02语音模型

MiniMax Audio最近推出了全新的Speech-02系列语音模型,支持超过30种语言,且一次性可输入多达20万字符。新模型不仅在语音合成的自然度上达到了99%的人声相似度,还解决了音频播放中的节奏故障问题,确保了流畅的听感。此外,新的“Read Anything”功能和“Long-Text Mode”使得用户可以更方便地获取和处理长文本内容,极大地提升了用户体验。

4)ElevenLabs发布全球首款犬类AI文本转语音模型“Text To Bark”

ElevenLabs推出了全球首款专为犬类设计的AI文本转语音模型“Text To Bark”,该技术能够将人类输入的文字转化为高度逼真的狗吠声,声称95%的狗无法分辨声音的来源。这一创新为人类与宠物之间的沟通提供了新的可能性,尽管狗可能仍无法理解具体意图。

5)腾讯发布GeometryCrafter:用AI解锁开放世界视频的几何一致性之美

腾讯近期推出的GeometryCrafter模型在开放世界视频的几何估计方面取得了重大突破,利用扩散先验技术,成功实现了动态视频内容的深度理解和处理。该模型能够在无需额外信息的情况下,提取并生成一致的几何信息,填补了该领域的空白。

6)Meta AI研究灵魂人物将于5月离职

Meta 基础人工智能研究主管(Meta FAIR 团队副总裁)乔尔·皮诺( Joelle Pineau)周二宣布,将于 5 月离职。正值 Meta 寻求在 AI 领域大力投资和竞争之际,这一高层职位出现空缺。

皮诺已在公司任职 8 年,自 2023 年初起领导 FAIR 团队,并向首席产品官克里斯·考克斯汇报工作。这位高管表示她将暂作休整,之后便会投身于一项未透露详情的“新冒险”中。

她领导的团队负责监督 Meta 的人工智能研究工作,其范围涵盖语音翻译、图像识别技术,到公司开源的大型语言模型 Llama。

7)OpenAI CEO:因算力容量问题,新产品或推迟

昨晚,OpenAI CEO Sam Altman 发文透露,近期因 GPT-4o 的图像生成器爆火,导致公司的算力容量不足,从而或将影响新产品发布的节奏,而 Altman 并未在文中明确新产品是什么;其还表示,目前 ChatGPT 的服务有时会产生速度变慢的情况。

Altman 还表示,团队正在以最快的速度努力让一切恢复正常运转,并求助称「如果有人有 10 万张 GPU 的算力容量,请与 OpenAI 联系」。有趣的是,Altman 在刚刚还发文称「大家还没有准备好迎接图像 V2(或指代图像生成器 2.0 版本)」。

8)亚马逊推出浏览器 Agent

近日,亚马逊正式公布了其通用 AI Agent「Nova Act」。据亚马逊介绍,Nova Act 能够替用户操控浏览器,同时收集、分析网页内容,并进行相对应的网页任务执行。未来,Nova Act 还将接入亚马逊旗下的生成式 AI 语音助手 Alexa+,为后者提供关键功能支持。目前,Nova Act 已开放「研究预览版」,开发者可通过预览链接获取体验。

9)ChatGPT付费用户激增至2000万,年化营收增长30%

OpenAI的ChatGPT在短短三个月内付费用户数量突破2000万,年化营收增长近30%,显示出用户对这一人工智能工具的强烈需求。尽管付费用户比例略有下降,但每周活跃用户已达到5亿。为了支持日益增长的用户群体,OpenAI计划融资400亿美元,尽管公司仍处于亏损状态,预计距离盈利还有五年。

10)OpenAI 悄悄上线 OpenAI 学院,免费提供 AI 教育资源

OpenAI 最近推出了全新的教育平台——OpenAI 学院,旨在为全球用户提供免费且高质量的人工智能学习资源。该平台涵盖从基础知识到高级技能的多种课程,适合自学者、教育工作者和开发人员。尽管没有进行大规模宣传,这一举措被认为是OpenAI在推动AI教育普及方面的重要一步,受到业内人士的广泛欢迎。

11)飞桨3.0正式发布,支持文心4.5等大模型,跨芯片适配成本降80%

百度旗下的深度学习平台飞桨最近推出了其新一代框架3.0,标志着深度学习领域的一次重要技术革新。该框架通过引入五大核心技术创新,如动静统一自动并行,显著降低了大模型的开发和训练成本,并提升了性能和适配性。飞桨3.0支持多款主流大模型,并实现了跨芯片的无缝迁移,硬件适配成本降低了80%。

12)宇树科技创始人回应「蚂蚁集团和中移动投资」

据财经杂志消息,机器人独角兽公司 —— 宇树科技计划引入新投资方,包括蚂蚁集团和中国移动,目前还在沟通具体投资份额。

公开信息显示,宇树上一轮融资是 2024 年 9 月,由北京机器人产业投资基金领投,深创投、美团龙珠、红杉中国等 14 家知名投资机构跟投;当时宇树科技估值达到 80 亿元。

知情人士透露,此次融资并非一轮完整的新融资,是定向给具体的投资方开放少部分份额;蚂蚁和宇树已就投资事宜谈判沟通了很久,此次融资估值相比 80 亿元未有提升。另据接近宇树科技的 FA(财务顾问)人士透露,此次融资估值低于 100 亿元。

对于上述信息,宇树科技创始人王兴兴通过新京报回应称,新闻不实。

13)AI编程Replit计划融资2亿美元,估值有望达到30亿美元

据知情人士透露,人工智能编程初创公司 Replit 正与投资者洽谈新一轮融资,其估值有望翻近三倍至 30 亿美元,此轮融资预计将筹集约 2 亿美元,融资谈判仍在进行中,细节可能存在变数。

关联标签
相关内容转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权或其它疑问请联系平台跟进,谢谢。