字节去年曾想收购Manus团队,因出价太低被婉拒;马斯克正尝试用AI取代美国公务员丨AIGC日报
1.【西湖大学发布新智能体,可自我进化】3月10日消息,日前,西湖大学AGI实验室张驰团队推出了AppAgentX——一款具备自我进化能力的GUI代理。它能够在不断执行任务的过程中学习并优化自身的行为模式,实现更加高效的操作。从实验结果来看,AppAgentX从单步的执行效率到总体的API token消耗,在多个GUI交互任务上展现出了显著的“降本增效”。(财联社)
2.【字节去年曾想收购Manus团队,因出价太低被婉拒】有报道称,开发出Manus的中国创业公司——Monica,在2024年年初曾经与字节进行过一轮收购谈判。当时字节出价3000万美金,但因为远远达不到创始人肖弘的心理价位,这次谈判最终不欢而散。接近Monica内部的从业者表示,字节收购的逻辑是以3000万美金的价格收购团队,将其团队和产品整合到豆包体系中,但是Monica进入字节后就会跟字节大模型战略绑定,就丧失了Monica产品上的独特优势。这也是肖弘及其团队不看好这场收购的主要原因。Monica的最新融资于2024年年底close,目前公司估值接近一亿美元。(雷锋网)
3.【智元机器人:正与阶跃星辰合作,将多模态能力赋能至机器人】3月10日消息,今日,据智元机器人方面介绍,公司已与阶跃星辰合作,后续围绕阶跃的多模态、推理和训练、工程化等底层模型能力,进行深度的合作,将阶跃星辰多模态等能力赋能到机器人上面。(科创板日报)
4.【DeepSeek-R2模型将于3月17日发布】近日,有消息称DeepSeek下一代AI模型DeepSeek-R2将于3月17日发布。据透露,DeepSeek-R2在多个关键领域实现突破,包括更出色的编程能力、多语言推理能力,以及以更低的成本提供更高的准确性。相应消息人士认为,这些特性若得以兑现,可能使其在全球AI竞赛中占据显著优势。目前,DeepSeek官方尚未正式公布R2的具体日期及技术细节等。
5.【百度上线AI社交App“月匣”】近日,百度低调推出情感陪伴类App“月匣”,主打高自由度AI对话与沉浸式剧本互动两大核心功能。不仅搭载自研的文心一言大模型,还整合了DeepSeek、豆包、MiniMax abab三大外部的大模型。相比一般的AI陪伴产品,月匣更加突出沉浸式剧本闯关的社交玩法。用户进入月匣App后,会直接来到对话界面,对话以剧本故事的方式进行。如果玩家对剧本的走向不满意,可以回溯进度,返回关键节点重选对话选项,系统会记忆用户历史选择偏好。目前,月匣的聊天对象涵盖后宫、穿越、玄幻、职场等300多个类型,用户可以像刷短视频一样切换聊天对象,聊天的记录会保存在“我的个人中心”内。此前,百度之前曾推出多个AI社交产品,包括文小言(数字人版)、万话和小侃星球。(来源:Tech星球)
6.【Manus创始人称产品基于阿里千问大模型开发】3月10日,Manus创始人季逸超在社交平台透露,Manus产品使用了不同的基于阿里千问大模型(Qwen)的微调模型。据悉,Manus是由创业公司Monica发布的首款AI Agent产品,最近在社交媒体火爆出圈。
7.【字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%】3月10日,字节跳动豆包大模型团队官宣开源一项针对MoE(混合专家模型)架构的关键优化技术COMET,据称可将大模型训练效率提升1.7倍,成本节省40%。据悉,该技术已实际应用于字节的万卡集群训练,累计帮助节省了数百万GPU小时训练算力。此前,豆包团队还曾发布新一代稀疏架构UltraMem,将模型推理成本砍掉83%。目前,COMET核心代码已开源,并计划兼容Triton等编译生态。
8.【“稚晖君”智元机器人已量产下线1000台机器人】3月10日,据智元具身研究中心常务主任任广辉介绍,截至目前,智元机器人已经量产下线1000台机器人。今年1月,蓝思科技与“稚晖君”创业项目智元机器人公司在长沙举行了灵犀X1人形机器人套餐交付仪式,成功批量交付灵犀X1人形机器人相关产品。今年1月,蓝思科技与“稚晖君”创业项目智元机器人公司在长沙举行了灵犀X1人形机器人套餐交付仪式,成功批量交付灵犀X1人形机器人相关产品。2024年10月,智元机器人宣布“灵犀X1”面向全球正式开源,软硬件全套图纸和代码上线到GitHub,开发指南上线至智元机器人官网。(来源:科创板日报)
9.【微软CopilotAI探索商业化,推出两种互动广告格式】3月11日,微软公司为增强Copilot等AI助手的聊天体验,宣布推出两种全新的互动广告格式,不仅能够根据用户输入动态调整,还能提供更沉浸的购物体验,旨在为AI助手找到有效的商业化路径。第一种广告格式名为“微软展示厅广告”(MicrosoftAdvertisingShowroomads)。这种广告模拟了实体展示厅的体验,用户可以在聊天过程中深入了解产品。例如,用户询问某款产品的详细信息后,展示厅广告会展示丰富的赞助内容,突出产品优势,并允许用户进一步提问。微软表示展示厅广告未来将接入品牌客服,用户可以直接与虚拟品牌客服互动。微软计划于今年4月与部分客户启动试点。第二种广告格式名为“动态筛选广告”(Dynamicfilters)。当用户搜索产品后,广告会根据查询内容动态展示,并支持用户根据个人偏好,轻松筛选出所需产品。据悉,动态筛选广告将于今年3月在英语市场启动试点。(来源:IT之家)
10.【谷歌GeminiEmbedding登顶MTEB,成为最强文本嵌入AI模型】近日,谷歌公司宣布推出一款基于AI的文本处理模型GeminiEmbedding,现已集成至GeminiAPI。该模型在MassiveTextEmbeddingBenchmark(MTEB)中超越了Mistral、Cohere和Qwen等竞争对手,成为当前性能最强的文本嵌入模型。GeminiEmbedding将文本转换为数值表示(向量),从而支持语义搜索、推荐系统和文档检索等功能。它在MTEB基准测试中表现出色,平均任务得分为68.32,显著高于Linq-Embed-Mistral和gte-Qwen2-7B-instruct等模型,达到State-of-the-art。
11.【OpenAI CEO新公司WorldNetwork推出聊天应用World】近日,据外媒报道,OpenAI创始人Sam Altman的新初创公司WorldNetwork正在开发一款名为“World”的“全能应用”,旨在创建一个综合性的超级应用生态系统,整合支付、聊天和微贷款等功能,并且这些功能都通过一种独特的生物识别方法进行验证:用户必须凝视篮球大小的“球体”,这些球体会扫描他们的虹膜,来证明其是人类。与已验证WorldID的用户对话,聊天气泡是蓝色的并且右上角有独特的WorldID宝石。而与未验证WorldID的账户对话,聊天气泡则是灰色的且没有宝石。截至目前,该应用已成功扫描了1100万人,但也引发了关于隐私和数据安全的疑问。(综合消息)
12.【索尼音乐下架超7.5万个AI生成音乐内容,为自家歌星“维权”】近日,索尼音乐披露,公司已对AI生成的假冒音乐展开大规模打击行动,迄今已下架超过7.5万条涉及哈里・斯泰尔斯等旗下明星的AI生成音乐。此前,英国首相基尔・斯塔默曾表示,希望让英国成为“全球AI创业和发展最理想的国家”。因此在英国政府提出的一项提案中,允许AI公司在英国免费使用包括音乐、电影、书籍和报纸在内的多种内容进行商业化训练,除非版权持有者主动申请排除,否则AI训练可默认使用其作品。该提案引发了创意行业持续数周的抗议,艺术家、音乐人、电影人和媒体机构纷纷表示担忧或反对。业内人士担忧,大量免费AI生成内容的传播,可能会威胁到正版音乐的商业模式。索尼在提交给英国政府的文件中表示,流媒体平台上的AI伪造录音已经对合法音乐人的商业利益造成直接损害。现行制度的优势在于AI开发者必须向版权持有者付费才能使用其内容进行训练。然而,政府的改革方案可能会让AI付费授权减少,而非增加。(来源:金融时报)
13.【OpenAI发布CoT思维链研究成果,监控阻止大模型恶意行为】今日消息,OpenAI今日公布了其最新研究,试图用CoT(思维链)监控的方式监控推理模型的“想法”,从而阻止AI大模型胡说八道、隐藏真实意图等行为,同时这也是监督超级模型的有效工具之一。OpenAI使用了最新发布的前沿模型o3-mini作为被监控对象,并以较弱的GPT-4o模型作为监控器。测试环境为编码任务,要求AI在代码库中实现功能以通过单元测试。结果显示,CoT监控器在检测系统性“奖励黑客”行为时表现卓越,召回率高达95%,远超仅监控行为的60%。
14.【腾讯发布Hunyuan-TurboS:首款超大型混合Transformer-MambaMoE模型震撼登场】今日消息,腾讯在X平台上推出了Hunyuan-TurboS,这是一款被称为首款超大型Hybrid-Transformer-MambaMoE模型的AI产品。它通过结合Mamba的长序列处理能力与Transformer的上下文理解能力,成功解决了传统模型在长文本处理中的瓶颈,展现出卓越的性能。
AI应用
1)降本增效:马斯克正尝试用AI取代美国公务员
今日消息,大西洋月刊报道称,马斯克领导的政府效率部正在努力缩减和重组美国公务员队伍,这一努力已进入新阶段。其理念很简单:利用生成式人工智能来自动化以前由人完成的工作。
美国政府正在与美国总务管理局(GSA)的1,500名联邦雇员一起测试一款新型聊天机器人,并可能最早于本周五向整个机构发布,这意味着超过10,000名负责超过1,000亿美元合同和服务的工作人员可以使用这款机器人。
这款聊天机器人被GSA领导层视为提升联邦工作人员生产力的工具,是政府效率部及其盟友更大行动方案的一部分。
谈到GSA的整体计划时,最近被任命为GSA信息技术部门——技术转型服务局局长的前特斯拉工程师托马斯・谢德上个月在全体员工会议上表示,该机构正在推进“人工智能优先战略”。
今日消息,DuckDuckGo最近推出了Duck.ai,一个强大的AI助手,旨在通过其深度研究功能取代Perplexity。Duck.ai不仅能够自动执行任务,还可以进行多步骤的信息检索和综合分析,生成详尽的报告。
此功能由OpenAI开发,现已向更多ChatGPT付费用户开放,极大地提高了专业人士在金融、科学等领域的研究效率。
1)GPU云企业CoreWeave宣布同OpenAI达成119亿美元重磅交易
今日消息,GPU云企业CoreWeave宣布同OpenAI签署了一份价值119亿美元(当前约861.88亿元人民币)的AI基础设施供应协议,CoreWeave将向OpenAI提供用于模型训练和交付的算力。
作为这项战略交易的一部分,CoreWeave还将向OpenAI发行价值3.5亿美元的股票(当前约25.35亿元人民币),OpenAI将由此加入CoreWeave的股东行列。
据路透社报道,本协议为期5年,CoreWeave不会从这部分股票发行中获得任何收益。
2)高通宣布将收购EdgeImpulse以增强AI及物联网功能
今日消息,高通昨晚发布公告,宣布已就收购EdgeImpulse达成协议。
高通表示,此次收购完善了物联网转型的战略方针,增强了对开发者的支持,并扩大了在AI和物联网能力方面的领导地位。
高通表示,凭借公司基于边缘AI与物联网技术的优势,推出覆盖硬件、软件、服务的全栈解决方案,加速工业场景智能化转型,其战略架构包含六大核心部分,如下:
全面的芯片组路线规划:定制化应用处理器与连接芯片组,适配消费电子、安防监控、智慧医疗、零售能源、企业级设备等多元垂直领域
统一的软件架构:为跨平台的一致性和效率而设计的软件,以降低开发和维护成本,并增强安全性。
服务套件:云服务和软件即服务功能,以促进商业化并扩展工业和嵌入式应用的功能。
开发者资源:支持物联网开发者的硬件和软件开发工具包。
生态系统合作伙伴:由分销商、独立硬件和软件供应商、设计中心和系统集成商、ODM和OEM组成的网络。
解决方案:与工业和企业客户合作开发的专用产品,利用公司的技术和工程专业知识来应对严峻的挑战。
物联网蓝图:经过精心策划的技术、生态系统合作伙伴和解决方案集合,以满足多个行业的需求。