阶跃星辰 Step 3.5 Flash 预训练/中训练/训练框架全部开源!
阶跃星辰宣布Step 3.5 Flash预训练/中训练/训练框架全部开源,包括Base权重、Midtrain权重及Steptron训练框架。该模型是阶跃迄今能力最强的开源基础模型,具备强大推理与Agent智能,专为Agent而生。
阶跃星辰宣布Step 3.5 Flash预训练/中训练/训练框架全部开源,包括Base权重、Midtrain权重及Steptron训练框架。该模型是阶跃迄今能力最强的开源基础模型,具备强大推理与Agent智能,专为Agent而生。
谷歌发布轻量级AI模型Gemini 3.1 Flash-Lite,称其为Gemini 3系列中速度最快、最具成本效益的模型。模型首字响应速度较2.5 Flash提升2.5倍,整体输出速度提升45%,定价为每百万输入Tokens 0.25美元、输出1.50美元。模型在Arena.ai获1432分Elo得分,GPQA Diamond测试达86.9%,多项指标超越前代。
AI创作平台Flowith宣布完成千万美元种子轮及种子+轮融资,种子轮由祥峰投资等机构参与,种子+轮由红杉中国种子基金、江远投资联合领投。Flowith致力于打造Agentic AI时代的”行动派”操作系统,已推出多线程画布交互、云端无限Agent及首款本地化AI全链路创作助手FlowithOS。 Potentials
通义实验室发布两款语音生成模型Fun-CosyVoice3.5与Fun-AudioGen-VD,首创FreeStyle指令控制范式,用户可通过自然语言描述语气、情绪、场景等细节,无需依赖固定标签。Fun-CosyVoice3.5支持多语种复刻与精细化表达控制,新增泰语、印尼语等4个小语种,生僻字读错率降至5.3%;Fun-AudioGen-VD则实现端到端声音设计,可生成角色化音色并模拟环境声学效果。
小红书团队发布并开源端到端文档识别模型FireRed-OCR,基于Qwen3-VL架构,首创”三阶段渐进优化”策略与”几何+语义”数据工厂,解决通用VLM处理复杂文档时的”结构性幻觉”问题。模型在权威评测OmniDocBench v1.5中取得端到端方案SOTA,综合评分92.9%领先Gemini-3.0 Pro等模型。
阿里千问宣布开源4款Qwen3.5小尺寸模型:Qwen3.5-0.8B/2B/4B/9B。该系列采用原生多模态训练和最新架构,覆盖从端侧到服务器的轻量级AI需求。其中0.8B/2B适合移动设备和IoT边缘部署;4B定位为轻量级Agent基座;9B性能媲美gpt-oss-120B。
具身智能公司银河通用宣布完成25亿元新一轮融资,由国家人工智能产业基金(大基金三期)、中国石化、中信投资控股、中国银行、上汽集团等多家国资及产业资本领投,刷新行业单轮融资纪录。本轮国资密集入局,标志着具身智能融资进入”重装时代”。
人形机器人企业松延动力宣布完成B轮融资,累计规模近10亿元,由宁德时代系晨道资本领投,国科投资、京国盛基金、九合创投等跟投。这是公司第9轮融资,标志着人形机器人行业从技术验证迈向商业化闭环。本轮融资将加速家庭消费场景落地与产业链整合。
Tabbit AI浏览器正式发布,主打”工作交给Tabbit,时间留给自己”理念。产品通过智能代理模式(Agent)实现跨系统数据流转、日常事务托管、深度调研及数据聚合等自动化操作;支持”妙招”快捷指令沉淀工作流,以及无代码脚本定制网页功能。
天际资本近日独家投资了Lemon AI数千万人民币Pre-A轮融资。该公司为企业提供“全栈开源+本地化部署”的AI安全落地方案,企业可在自有Docker环境中调用主流开源大模型,数据不出本地,以解决金融、医疗等行业的数据安全顾虑。
面壁智能在2026年农历新年(马年)后完成数亿元融资,由中国电信领投,中信金石、中信私募跟投。中国电信将发挥云网端优势,与面壁智能在“高效大模型”领域的算法落地经验结合,深化业务协同。本轮融资标志着面壁智能正式开启与国家级信息基础设施方的战略合作。
AgentScope团队宣布其个人智能助理产品CoPaw正式开源,采用Apache 2.0许可协议,支持免费商用。此次开源版本聚焦易用性、本地部署、记忆管理与可扩展性四大方向进行全面升级,核心在于降低使用门槛并打开能力上限。CoPaw现支持通过自定义供应商、Ollama、llama.cpp、MLX等多种方式接入本地或自建模型,实现全链路数据本地化。
OpenAI获得新一轮高达1100亿美元的融资,投资方包括亚马逊、英伟达和软银,投资额分别为500亿、300亿和300亿美元。此轮融资前,公司的估值已达到7300亿美元。OpenAI还与亚马逊建立了战略伙伴关系,并同英伟达就下一代推理计算技术达成了协议。该轮融资预计还将吸引更多金融投资者参与。
Skywork AI发布全新多模态视频基础模型SkyReels V4。模型采用创新的双流多模态扩散Transformer(MMDiT)架构,是全球首个能同时处理多模态输入、联合生成视频与音频、并统一完成视频生成、修复、编辑三大任务的模型。支持文本、图像、视频、音频、掩码等丰富输入,可输出1080p分辨率、32FPS、长达15秒的高质量音视频同步内容。
华为云在线上发布会上正式发布了华为云码道(CodeArts)代码智能体的公测版。是一个集成代码大模型、IDE与自主开发模式的AI编码解决方案。覆盖代码生成、单元测试、研发知识问答、规范驱动开发等场景,支持IDE、VS Code等多种开发环境。
Google 旗下 DeepMind 正式发布新一代图像生成模型 Nano Banana 2(Gemini 3.1 Flash Image)。模型在图像质量与生成速度上取得平衡,核心在于利用 Gemini 的知识库与实时网络搜索,大幅提升了对复杂中文提示、空间比例、真实世界常识(如地标、古诗词意境)及多对象一致性的理解能力。
自变量机器人宣布完成数亿元新融资,由上汽金控、中金上汽基金等领投,老股东跟投。公司成立于2023年,聚焦自研通用具身智能大模型WALL-A,推出了量子一号、量子二号两款机器人本体,其中量子二号拥有高自由度灵巧手。本轮融资将用于深化产业协同,推动具身智能在汽车等场景的落地。
Perplexity 推出全新聊天界面“Perplexity Computer”,将多种具备自主执行能力的AI模型整合为一套系统。系统基于浏览器运行,可调用来自不同厂商的模型,自主完成包括网络搜索、文档生成、数据处理等在内的完整工作流程。
MiniMax发布Agent功能升级,推出Expert 2.0和MaxClaw两大核心产品。Expert 2.0允许用户用自然语言描述创建细分领域的专家Agent,已覆盖技术开发、商业金融等领域,累计创建超1.6万专家。MaxClaw是基于OpenClaw构建的云端AI助手,开箱即用,无需手动部署,为订阅会员提供50G云储存,打通了飞书、钉钉等多个IM渠道。
谷歌实验室宣布,生成式AI音乐创作平台ProducerAI正式推出。平台深度融合了Gemini、Lyria 3、Veo等大模型,为音乐人提供从作词、编曲到混音的全链路支持。用户通过简单文字指令即可生成不同流派的歌曲,进行后期处理。平台为所有音频输出嵌入了SynthID隐形水印。
谷歌正式发布其新一代旗舰模型Gemini 3.1 Pro,在12项基准测试中超越Claude Opus 4.6、GPT-5.2等主流模型,尤其是在衡量推理能力的ARC-AGI-2测试中获得77.1%的高分。模型在复杂任务处理上进步显著,社区实测可生成WebOS操作系统、交互式3D沙盒,能创作生动的SVG动画。
Anthropic推出“Claude Code Security”AI代码安全扫描工具,以研究预览版形式向企业及团队用户开放。工具基于其旗舰模型Claude Opus 4.6,采用模拟人类安全研究员的推理方式,能追踪数据流、发现业务逻辑缺陷和访问控制绕过等传统静态分析难以捕捉的复杂漏洞。
智平方宣布完成B轮融资,规模超10亿元人民币,估值超过百亿,一年内累计完成12轮融资,成为融资最快的具身智能企业。本轮融资方阵容强大,百度、中国中车等产业与资本巨头集体加注。
李飞飞创立的World Labs近期完成10亿美元巨额融资,公司估值飙升至50亿美元。投资者包括Autodesk、英伟达、AMD、a16z等顶级巨头。公司今年1月推出了“World API”,为企业提供大型世界模型的API接入,并与Autodesk等公司展开B2B合作,探索商业化路径。