月之暗面全新的注意力架构Kimi Linear横空出世
月之暗面推出全新注意力架构Kimi Linear,有望成为下一代Agent LLM基石技术。架构核心是Kimi Delta Attention(KDA),通过精细化门控机制和硬件高效算法,实现性能与效率大幅提升。
月之暗面推出全新注意力架构Kimi Linear,有望成为下一代Agent LLM基石技术。架构核心是Kimi Delta Attention(KDA),通过精细化门控机制和硬件高效算法,实现性能与效率大幅提升。
美团LongCat团队发布WOWService大模型交互系统技术报告,针对本地生活服务领域大模型落地的“三重困境”,提出四大核心技术框架。系统融合多智能体协同、强化学习等技术,通过人机协同标注等方式降低成本,已在美团智能客服等数十个业务场景落地。
MiniMax发布最新音乐模型Music 2.0。模型在音乐理解与表达上实现飞跃,能精准捕捉人声情绪与器乐张力。支持多种唱法和情感风格,可精准控制人声音色,实现一声千变。在旋律创作上,可生成结构完整、抓耳的歌曲,能独立控制多种乐器,编曲层次丰富。音质全面升级,带来沉浸式听觉体验。
英国AI视频生成独角兽Synthesia完成2亿美元(约14亿元人民币)融资,估值达40亿美元(约284亿元人民币),由谷歌风投领投,英伟达可能参与。Synthesia成立于2017年,专注于为企业生成虚拟形象视频,用于营销、培训等,已有6万家企业使用其平台,覆盖约70%的全球财富100强企业。
智谱清言推出全新「研究模式」,帮助用户高效深入地开展研究。模式可围绕问题全网搜索并整合分析,自动生成结构化、可引用的研究报告,适用于学术研究、商业洞察、生活决策和热点追踪等多种场景。
Adobe发布其最先进的图像生成与编辑模型Firefly Image 5,支持400万像素原生输出,具备文本指令编辑、分层图像编辑等功能,还新增视频和音频生成工具。Adobe还为Photoshop、Premiere Pro和Lightroom等应用推出全新生成式AI工具,并支持更多第三方模型。
AI编程平台Cursor发布2.0版本及自研编程模型Composer。Composer专为低延迟编程设计,速度达同等模型4倍,每秒输出超200个token,智能水平超开源编程模型。新版本界面以Agent为核心,支持并行运行最多8个Agent,可并行处理任务并择优选择。新增原生浏览器工具,实现代码修改“指哪儿改哪儿”,代码审查功能升级,聚合修改细节。
MiniMax Speech 2.6发布,全面升级Voice Agent场景。模型端到端延迟低于250毫秒,支持多种语言的网址、邮箱等非标准文本格式直接转换,提供Fluent LoRA功能,即使原始素材不完美,也能生成流利自然的语音。
Google Labs推出AI营销工具Pomelli,帮助中小型企业快速创建符合品牌气质的社交媒体活动。用户只需提供公司网站,Pomelli会自动提取品牌信息,建立“商业DNA”,并生成活动创意和视觉素材。用户可编辑调整后直接使用。
OpenAI完成资本结构重组,上市道路铺平。非营利主体更名为OpenAI Foundation,掌控营利实体26%股份,目前估值约1300亿美元。员工和投资者持有47%股份,微软持有32.5%股份。OpenAI还同意购买2500万美元微软Azure云服务,微软股价一度上涨3.5%。
GitHub推出Agent HQ平台,统一管理AI编程智能体并集成至工作流中。Agent HQ核心为Mission Control指挥中心,可协调多智能体任务分配与管理,支持跨平台操作。其Plan Mode功能可提升代码质量。开发者可通过AGENTS.md创建自定义智能体。
腾讯混元推出国内首个交互式AI播客,用户可在收听过程中随时打断并提问。播客基于大模型意图识别、长上下文理解等能力,结合上下文和背景信息给出准确答案。用户能自主选择播客风格、主持人数及音色,支持快速创作播客内容。
Flowith正式发布FlowithOS,为AI Agent打造的全新操作系统。解决AI普遍存在的“思考与执行脱节”问题,如跨网页、跨环境执行困难等。FlowithOS通过整合浏览器,为AI Agent提供思考与行动的环境。附:FlowithOS邀请码
埃隆·马斯克旗下的xAI团队推出Grokipedia,AI驱动的百科全书正式上线测试版。平台收录超88.5万篇文章,主打“无偏见”特性,通过Grok AI模型自动审核内容真实性,部分条目源自维基百科但标注为“改编内容”。
MiniMax发布视频模型Hailuo 2.3,升级动态表现力,肢体动作、风格化、微表情效果显著提升,运动指令响应优化。支持多种画风,真人面部表演更自然,物体运动响应出色。性能提升的同时保持原价格,新增Hailuo 2.3 Fast模型,降低成本。
法国 AI 初创公司 Mistral AI 推出企业级 AI 应用开发平台Mistral AI Studio,帮助企业将 AI 从原型开发过渡到可靠、可扩展的生产系统。平台具备深度可观察性、Agent 运行时和 AI 注册表三大核心功能,支持混合、本地和 VPC 部署,满足企业对 AI 应用的安全、合规和隐私要求。
ChatExcel推出全新升级版ChatDB,用户无需SQL基础和复杂BI工具,仅通过对话即可连接数据库,快速处理百万数据并生成可视化报告。登录chatexcel.com,进入工作台即可使用ChatDB模块,连接数据库后,可一键提取、分析数据,并生成数据看板。
MiniMax公司发布最新大语言模型MiniMax M2。目前基于M2的agent免费使用,支持开发代码、研究、制作PPT等多种功能,还可接入日常编程工具。从测试数据来看,其coding能力接近Claude 4.5 Sonnet,工具使用流畅。用户可通过设置MiniMax-M2-Preview使用该模型
月之暗面科技有限公司推出开源 Agentic Coding 工具 Kimi CLI 技术预览版,采用 Shell-like UI,支持 ACP 协议。可在 GitHub 交流反馈。
美团开源了 LongCat-Video 的通用视频生成模型,参数量达 13.6B。模型能实现文生视频、图生视频以及视频续写等功能,能在几分钟内生成 720p、30fps 的长视频,画面连贯、人物稳定、物理逻辑合理。
谷歌Gemini的免费互动工作区Canvas推出新功能,可基于一个提示词或上传的文件(文档、电子表格、研究论文等)生成PPT幻灯片,并自动配上主题和相关图片。用户能将生成的幻灯片直接导出到Google Slides进行编辑、优化或团队协作。
昆仑万维集团旗下的Skywork AI推出网页复刻功能,用户仅需提供网页链接、上传文件或输入文字描述,AI便能在数分钟内生成功能完备、结构清晰、风格相近的网页原型。通过深度算法解析网页逻辑与层级,实现结构级复构,而非简单复制外观。
火山引擎发布豆包视频生成模型1.0 Pro Fast(Doubao – Seedance – 1.0 – pro – fast),模型在火山引擎的Seedance 1.0 Pro模型基础上,生成速度提升约3倍,价格直降72%。其生成720P的5秒视频仅需10秒,生成5秒1080P视频成本仅1.03元。
豆包编程完成重大升级,让零基础用户也能轻松开发网站和应用。此次升级引入多模态输入功能,支持文字、图片、文件、画板等多种输入形式,AI可自动理解并补全逻辑。新增Agent多工具协作系统,自动联网搜索素材、配图、检查代码,确保生成内容的准确性和可用性。