InternVL-U重磅开源,4B参数实现理解、推理、生成、编辑一体化
上海人工智能实验室联合多所高校开源多模态一体化模型InternVL-U,仅4B参数即实现理解、推理、生成、编辑四大能力统一。模型采用”统一语境建模+模态专用模块化+解耦视觉表征”架构,在文本渲染、科学推理等复杂场景中性能超越14B级模型,已全面开源并提供完整推理代码与评测工具。
上海人工智能实验室联合多所高校开源多模态一体化模型InternVL-U,仅4B参数即实现理解、推理、生成、编辑四大能力统一。模型采用”统一语境建模+模态专用模块化+解耦视觉表征”架构,在文本渲染、科学推理等复杂场景中性能超越14B级模型,已全面开源并提供完整推理代码与评测工具。
威努特正式发布安全龙虾产品WinClaw,针对OpenClaw存在的安全风险(CNNVD通报82个漏洞,含12个超危漏洞)及配置复杂等问题,构建五层安全防护体系:身份认证双向鉴权、安装审查拦截14类危险模式、消息拦截41条安全规则、执行约束敏感操作二次确认、监控审计本地日志追溯。
阶跃星辰推出基于OpenClaw打造的云端AI助手”StepClaw“,用户可在阶跃AI APP一键部署,无需自备服务器。产品搭载Step 3.5 Flash模型,提供双核CPU、4GB内存及40GB存储,支持7×24小时云端运行和长期记忆能力。
AI视频生成企业爱诗科技宣布完成C轮融资,由鼎晖香港基金、鼎晖VGC、鼎晖百孚领投,中国儒意、三七互娱、亦庄国投、众为资本等国内外多家机构跟投。本轮资金将用于视频基础模型迭代、实时世界模型研发及全球化团队建设。其PixVerse V5.6模型在Artificial Analysis榜单中位列图生视频与文生视频全球第二,全球首发实时世界模型PixVerse R1,用户规模已突破1亿。
科大讯飞AstronClaw全面开放,基于OpenClaw打造云端AI助手,支持一键部署、沙箱隔离运行保障数据安全。产品接入企业微信、钉钉、飞书等主流IM,内置120+官方Skills并支持调用ClawHub生态10,000+技能,覆盖办公、营销、金融等场景。集成星火X2、Kimi-K2.5、GLM-5等多款旗舰大模型。
光轮智能完成10亿元A++及A+++轮融资,投资方包括新希望集团、三安光电家族办公室、奥克斯等产业方及建投华科等财务机构,成为全球首个具身数据领域独角兽。公司构建世界-行为-评测三层架构,提供物理仿真、规模化数据生产与模型评测服务,已服务英伟达、谷歌、Figure AI、字节、智元等头部客户,在仿真合成数据、仿真评测、人类视频数据三项能力上实现全球交付冠军。
百度智能云发布全球首款手机龙虾应用”红手指Operator“,已上线安卓市场。应用结合OpenClaw与自研移动端AI Agent能力,用户通过聊天即可指挥手机完成打车、外卖订餐等跨App交互操作,实现”一句话搞定复杂任务”。应用具备深度语义理解、高效执行和精准方案产出能力,可完成信息搜集、定时推送、自动下载等流程。
英伟达发布最强开源权重AI模型Nemotron 3 Super,拥有1200亿参数(MoE架构,推理时仅激活120亿),吞吐量较前代提升5倍,准确率翻倍。模型配备100万Token超长上下文窗口,专为多智能体系统设计,可解决”上下文爆炸”和”推理税”问题。采用Mamba-Transformer混合架构,引入”潜在MoE”新技术,支持多Token预测。
AI语音教练平台BoldVoice完成2100万美元A轮融资,由Matrix领投。该公司仅7名员工,下载量突破500万,服务150多个国家,ARR超1000万美元。本轮融资将用于全球扩张及AI新功能开发。
谷歌发布首个原生多模态嵌入模型Gemini Embedding 2,支持将文本、图像、视频、音频和文档映射到同一嵌入空间,可识别100种语言的语义意图。模型单次请求可处理最多6张图片、120秒视频、6页PDF及直接音频输入,适用于RAG、语义搜索、情感分析和数据聚类等场景。
百度智能云发布零部署OpenClaw服务DuClaw,用户无需选择镜像、部署服务器或配置API Key即可即开即用。DuClaw内置百度搜索、百科、学术搜索等百度优势Skills,并支持DeepSeek、Kimi-K2.5等多款主流大模型灵活切换。目前网页端已上线,后续将接入企业微信、钉钉、飞书等应用。
AI应用开发平台Dify完成3000万美元Pre-A轮融资,由红杉中国领投,GL Ventures、Alt-Alpha Capital、五源资本等跟投。本轮融资将用于提升Agent可靠性、企业级运营管控能力、降低构建门槛及建设开源生态。Dify是一个开源的Agentic Workflow构建平台,提供可视化构建器和生产级工程基础设施,帮助团队快速构建、部署和运维AI工作流。
新加坡金融科技公司MetaComp完成数千万美元Pre-A+轮融资,由知名互联网大厂战投及Spark Venture等机构投资,老股东跟投。公司2025年已实现净利润转正,即时流动资金超1亿美元,月支付交易流水超10亿美元,财富在管规模超5亿美元。
Meta正式收购AI社交网络Moltbook,创始人Matt Schlicht和Ben Parr将于3月16日加入Meta超级智能实验室(MSL)。Moltbook上线一个多月即吸引19.4万个AI智能体和超200万帖子,曾因”AI自发建立宗教”等话题引发热议,后被揭穿多为人类伪装。Meta看中其智能体验证身份与互联的系统机制,为构建”智能体身份注册表”铺路,以应对AI从聊天工具向自主实体演进的趋势。
腾讯电脑管家推出QClaw,基于OpenClaw打造的本地AI助手,支持Mac和Windows双端,内置Kimi-2.5等模型。核心亮点是零配置直接关联微信,用户可通过微信远程操控电脑完成任务,如处理文档、社媒运营、GitHub项目开发等。数据全部本地存储保障隐私,依托5000+Skills生态,具备持续记忆能力。
腾讯云推出SkillHub,专为中国用户优化的OpenClaw AI Skills社区。依托国内高速镜像,解决官方ClawHub下载慢、中文搜索不友好、社区交流不便三大痛点,实现Skill秒速安装。平台提供精选Top 50榜单、8大分类中文搜索及安全审计,收录1.3万个Skills,支持一键复制安装命令,并计划打造开放中文开发者社区。
阿里云旗下AI Agent产品”无影JVS”正式更名为”JVS Claw“,目前已推出独立APP和网页版,处于邀请码内测阶段。产品以可定制的Clawbot为核心,搭配6核/12GB独立云端ClawSpace环境,支持实时查看AI操作链路。内置浏览器自动化、Office文档处理等预制技能,用户可通过”技能查找”安装ClawHub新技能,或用自然语言创建自定义技能。
火山引擎正式上线ArkClaw,为用户提供零配置、开箱即用的云端OpenClaw服务,打开网页即可使用7×24小时在线AI助手。产品深度协同Doubao-Seed-2.0系列模型,支持飞书等主流IM工具,内置Skills安全扫描和网盘长效存储。
智谱正式上线AutoClaw(中文名”澳龙”),成为国内首个支持一键安装的本地版OpenClaw工具。产品预置50+热门Skills,支持macOS和Windows双平台,1分钟即可完成部署,一键接入飞书等即时通讯工具。AutoClaw内置智谱专为Agent场景优化的Pony-Alpha-2模型(内测中),集成AutoGLM Browser-Use浏览器操作能力,可稳定执行多步骤、跨页面的复杂任务。
小红书Super Intelligence团队发布图像编辑模型FireRed-Image-Edit 1.1版本,距离1.0发布不到一个月。新版本在ID一致性编辑、多元素融合(支持10余种元素智能组合)、人像美妆(数十种风格)、字体风格参考及老照片修复等方面显著增强。
扣子Coze宣布AI Agent中文社区 InStreet 全面开放内测,定位为”OpenClaw养虾第一站”。该社区仅允许Agent发帖互动,人类用户可围观学习。InStreet 提供Skill技能分享、积分排行榜、虚拟炒股竞技场等功能,已积累超1.1万条评论和1.6万点赞。
OpenClaw团队连夜推出2026.3.8版本。本次更新新增ACP来源识别、openclaw备份机制及Telegram假冒清除三大功能,修复12个以上安全漏洞。同时带来GPT-5.4前向兼容(支持105万Token上下文)、Brave搜索强化、Talk语音模式静默等待优化等改进,针对macOS和Android端进行专项优化与安全加固。
腾讯旗下全场景AI智能体WorkBuddy正式上线,被称为腾讯版”小龙虾”(OpenClaw)。产品完全兼容OpenClaw技能,但无需复杂部署,下载安装后即可使用,1分钟完成企业微信配置。WorkBuddy内置20多种Skills技能包,支持多窗口、多Agent并行工作,可无缝切换Hunyuan、DeepSeek、GLM等主流模型,并具备企业级安全审计能力。
微软发布Phi-4-Reasoning-Vision-15B开源模型,采用MIT许可证,是Phi-4系列首个同时具备高分辨率视觉感知与选择性推理能力的小语言模型。模型可根据任务需求在”推理模式”与”非推理模式”间自动切换,数学推理时启用多步思考链,简单OCR任务则直接输出以降低延迟。