OpenAI首款ChatGPT Atlas浏览器发布!免费下载使用
OpenAI发布首款AI原生浏览器ChatGPT Atlas。浏览器基于谷歌开源的Chromium内核打造,整合了ChatGPT对话能力,每个标签页都能直接聊天。具备浏览器上下文助手能力,可直接在浏览页面提问;内置记忆功能,记录用户浏览关键内容;“Cursor Chat”功能可选中文本进行编辑润色;Agent模式能完成网页操作,如填写表单、预订等。
OpenAI发布首款AI原生浏览器ChatGPT Atlas。浏览器基于谷歌开源的Chromium内核打造,整合了ChatGPT对话能力,每个标签页都能直接聊天。具备浏览器上下文助手能力,可直接在浏览页面提问;内置记忆功能,记录用户浏览关键内容;“Cursor Chat”功能可选中文本进行编辑润色;Agent模式能完成网页操作,如填写表单、预订等。
美团 LongCat 团队发布 VitaBench,是面向复杂问题的大模型智能体评测基准。以外卖点餐、餐厅就餐、旅游出行三大生活场景为载体,构建了包含 66 个工具的交互式评测环境。VitaBench 从深度推理、工具使用与用户交互三大维度量化任务复杂性,通过真实用户模拟器和原子化评估准则实现细粒度评估。
智谱发布 GLM Coding Plan 企业版,基于 GLM-4.6 模型,为企业提供全面智能编程解决方案。产品在国际 API 平台 OpenRouter 趋势榜中名列第一,融合多模态理解、联网搜索及智能编排能力,提供从代码生成到全链条开发协同的一站式服务。企业版具备高用量、低成本、高性能和高安全性,无缝适配 10 余款主流编程工具,支持灵活成员管理和使用数据分析。
Cherry Studio 企业 Express 版正式发布,以 5000 元买断价、不限员工席位,为企业提供一站式 AI 落地解决方案。该版本内置顶级闭源与开源模型,无需申请 API Key,解决网络问题,简化计费流程,支持私有化和云应用部署。 Studio-千慧科技
CodeBuddy IDE 1.0 正式版发布,国际版全面支持 GPT-5-Codex,新增自定义指令、Web Fetch 实时获取网络信息等功能,MCP 市场正式开放,支持完整 DiffView 功能。
Anthropic发布Claude Code 网页版 ,用户无需部署即可在浏览器中使用其代码生成功能。核心功能包括连接 GitHub 仓库、自动写代码、并行处理多个任务、实时查看进度以及完成后自动创建 PR。
Vidu Q2 参考生视频全球上线,本次升级聚焦于高一致性,速度更快,价格更优惠三大核心,满足专业及半专业创作者日益增长的高想象力内容创作需求。目前Vidu Q2参考生视频已在全球同步上线,用户可以在Vidu网页端,或各大应用商店搜索Vidu AI APP,体验最新功能。 AI
百度自研多模态文档解析模型PaddleOCR-VL发布仅16小时就登顶HuggingFace Trending全球第一。模型参数仅0.9B,轻量高效,能精准识别文本、手写汉字、表格等多种复杂元素,支持109种语言。
宇树发布第四款人形机器人H2,高180cm,重70kg。相比前代H1,H2在运动流畅性和仿生特征上有显著提升。H2拥有31个关节,分布在双臂、双腿和躯干,能完成芭蕾舞、中国武术等高难度动作。还被赋予了类似人类的面部特征,外观和运动姿态更接近人类。
DeepSeek推出全新视觉文本压缩模型DeepSeek-OCR。模型参数仅3B,采用混合专家架构,视觉token数量减少20倍,压缩比达20倍,20个节点每天可处理3300万页数据。在Fox benchmark测试中,各文本长度区间准确率超85%。支持多种分辨率配置、多语言处理、复杂图表解析等多模态能力,可在多轮对话中实现10倍压缩效率。
AI视频企业爱诗科技宣布完成1亿元人民币B+轮融资,由复星锐正、同创伟业、顺禧基金等共同投资。爱诗科技旗下产品PixVerse与拍我AI服务于C端大众与专业创作者,用户规模已突破一亿,ARR超过4000万美元,MAU超过1600万。
Manus宣布推出Manus 1.5版本。在任务执行速度、可靠性和输出质量方面显著提升,任务平均完成时间缩短至不足4分钟,速度提升近四倍。Manus 1.5提供两种模型:Manus-1.5适用于高复杂度任务,Manus-1.5-Lite则针对成本效率优化。新版本具备全栈Web应用开发功能,用户可通过对话完成从开发到部署的全过程。
美团LongCat团队开源了语音编解码方案LongCat-Audio-Codec。专为语音大语言模型(Speech LLM)设计,通过语义与声学双Token并行提取机制,兼顾语音的语义和声学特征,解决了传统方案中语义与声学信息难以平衡的问题。低延迟流式解码器支持实时交互,满足车载语音助手、实时翻译等场景的需求。
斯坦福大学教授李飞飞的创业公司World Labs推出了实时生成式世界模型RTFM。模型可在单个H100 GPU上运行,输入2D图像后,能生成不同视角下的新2D图像,实现3D一致性和持久性。RTFM基于大规模视频数据训练,无需显式构建3D表示,而是通过端到端学习模拟3D几何、反射等特征。
智元机器人发布新一代工业级交互式具身作业机器人——智元精灵G2。机器人以工业标准打造,搭载NVIDIA Jetson Thor芯片,配备高精度力控双臂和19自由度的灵巧手,具备3D触觉感知和5自由度腰腿搭配全向底盘。支持多人连续语音对话与知识库问答,采用双电池热插拔换电技术,配备360环视鱼眼和前后双激光雷达,可主动避障。
阿里推出全新AI编程工具Qoder CLI,专为命令行环境打造的AI Coding Agent。集成顶尖编程模型,设计轻量级Agent框架,具备强大代码生成与理解能力,同时降低内存消耗和命令响应时间,提升开发效率。Qoder CLI无需复杂初始化,安装即用,支持文件编辑、命令运行等功能,并可通过MCP扩展或自定义开发工具。
Anthropic发布了Claude Haiku 4.5模型。模型在保持高性能的同时,速度翻倍且价格大幅降低。在SWE-bench Verified测试集中,Haiku 4.5取得了73%的成绩,与Claude Sonnet 4和OpenAI的GPT-5处于同一水平线,在某些任务上甚至超过Sonnet 4。
火山引擎全新发布和升级了四款豆包大模型,包括豆包大模型1.6升级版、豆包大模型1.6 lite、豆包语音合成模型2.0和豆包声音复刻模型2.0。豆包大模型1.6升级版原生支持四种思考长度,是国内首个原生支持“分档调节思考长度”的模型,可平衡效果、时延和成本。豆包大模型1.6 lite更轻量、推理速度更快、性价比更高。
Qwen Chat Memory正式上线,赋予了Qwen“长记忆”能力。能理解上下文、保留重要信息并回忆过往对话,使交流更具延续性。让Qwen在对话中主动关联过往互动,更好地理解用户需求,为用户提供更个性化的服务。
讯飞星火“深度研究”功能全新升级,实现底层思维链路、信息融合与内容呈现的全方面进化。功能通过多轮思考和搜索迭代,深度理解用户意图,提升内容质量;支持输出高质量图片,新增HTML网页导出与一键转PPT功能;结合外部搜索信源和本地文档,实现个性化思考。
谷歌发布AI视频生成模型Veo 3.1,带来更丰富的音频、叙事控制及逼真的质感还原。Veo 3.1在Veo 3基础上,提升提示词遵循度,增强视听质量。其驱动的AI电影创作工具Flow更新,支持原生音频生成,用户可将静态图像转视频、整合多图像元素、延展视频时长等,实现更精细的视频编辑与颗粒化控制。
NotebookLM视频概览功能发布更新升级,新增了六种由 Nano Banana 提供配图支持的视觉风格:Watercolor、Papercraft、Anime、Whiteboard、Retro Print 和 Heritage。更新彻底告别了以往固定主体动态颜色的限制,效果提升明细。目前仅支持 Pro 用户。
阿里通义千问团队推出Qwen3-VL系列4B与8B版本,提供Instruct和Thinking版本。新版本资源门槛低,核心能力不减配,在多模态性能上表现优异,多个基准测试中超越谷歌Gemini 2.5 Flash Lite、OpenAI GPT-5 Nano等同级别顶尖模型,甚至媲美阿里此前旗舰模型Qwen2.5-VL-72B。
腾讯优图实验室开源了高性能通用文本嵌入模型Youtu-Embedding。模型面向企业级应用,可胜任文本检索、意图理解等六大任务,在中文文本嵌入评测基准CMTEB上以77.46分登顶。采用“LLM基础预训练→弱监督对齐→协同-判别式微调”的三阶段训练,结合创新微调框架与精细化数据工程,解决了多任务学习难题。