Skywork推出SkyBot——最适合小白用户的OpenClaw工具
天工Skywork推出SkyBot,号称全球最适合小白用户的OpenClaw工具。该产品将火爆的AI代理OpenClaw进行云端化改造,用户无需配置硬件或命令行,点击即可领取7×24小时云端AI助理。
天工Skywork推出SkyBot,号称全球最适合小白用户的OpenClaw工具。该产品将火爆的AI代理OpenClaw进行云端化改造,用户无需配置硬件或命令行,点击即可领取7×24小时云端AI助理。
北京生数科技宣布完成超6亿元A+轮融资,创下国内视频生成领域单笔融资新纪录。公司由清华大学背景团队创立,其Vidu Q3视频生成模型在专业影视制作场景中表现突出,位列全球第二,客户覆盖索尼、腾讯、字节跳动等企业。
AI营销平台PallasAI完成数千万元融资,由有赞独家投资。公司推出行业首款标准化GEO AI Agent产品,通过可见性评分、营销图谱和Agent内容协作三大功能,帮助中小企业量化品牌在AI生态中的曝光度。 Park
Anthropic发布新一代AI模型Claude Opus 4.6,具备100万token上下文窗口和自适应思考能力。在编程、金融分析、办公软件操作等领域表现卓越:16个AI代理两周内写出可编译Linux的C编译器,自主发现500多个零日漏洞,在GDPval-AA评测中超越GPT-5.2。
OpenAI推出新一代编程模型GPT-5.3-Codex,宣称为全球最强智能体编程模型。模型在SWE-Bench Pro和Terminal-Bench 2.0测试中取得SOTA成绩,编程得分较Claude Opus 4.6高11.9%。具备调试、部署及办公软件操作能力,速度提升25%,能参与自身开发优化。
Mistral AI 推出的新一代语音转文本模型Voxtral Transcribe 2,包含两个版本。Voxtral Mini 支持 13 种语言的高精度转录,具备说话人分离、词级时间戳和上下文偏置功能,适合批量转录。Voxtral Realtime 专为实时场景设计,延迟低至 200 毫秒以下,适合语音助手等交互应用。
上海AI实验室开源了万亿参数科学多模态大模型Intern-S1-Pro。模型采用MoE架构,总参数1万亿,激活参数220亿。基于“通专融合”SAGE技术,具备奥赛级数理推理能力,可精准解析多模态科学内容,覆盖化学、材料、生命、地球、物理等学科。
面壁智能开源新一代全模态模型MiniCPM-o 4.5,模型具备”边看、边听、主动说”的全双工交互能力,让人机交互从回合制升级为即时自由对话。通过9B参数实现全模态SOTA性能,在视觉理解、文档解析、语音生成等方面表现优异,支持实时感知与主动响应。
可灵AI正式升级至3.0版本,推出可灵3.0模型系列。实现多模态输入输出一体化,重新定义AI视频工作流。视频3.0模型在叙事与控制方面深度进化,新增智能分镜功能,可自动调度景别与机位,视频3.0 Omni进一步提升了主体相似度与复杂指令响应能力,图片3.0 Omni新增深度叙事与组图批量创作功能。
昆仑天工全球发布“Skywork桌面版”AI应用,支持Windows系统本地化运行,无需上传文件至云端。可跨格式理解并处理电脑中的文档、图片、视频等文件,实现多任务并行与内容生成。用户可选择Claude或Gemini模型,并自动调用百余项内置技能。
通义开源Qwen3-Coder-Next编程智能体模型,采用80B总参数的MoE架构,每次推理仅激活3B参数,显著降低算力需求。在SWE-Bench Verified基准上取得超70%的问题解决率,性能接近更大规模的稠密模型。
猎豹公司推出首款国产Clawbot工具“元气AI Bot”,支持在普通Windows电脑本地部署,用户可通过手机飞书或钉钉远程控制,用自然语言指令让AI自动操作电脑,如打开软件、查看邮件、浏览网页等。工具集成系统清理、AI写作、PPT生成等办公辅助功能,推出多款个性化AI伙伴角色。
马斯克旗下的人工智能公司xAI正式发布Grok Imagine 1.0版本,是该AI视频生成工具的重大升级。新版本支持生成10秒时长、720p分辨率的视频,显著提升了音频质量,实现了音画同步与情感化配音功能。
马斯克正式宣布SpaceX完成对xAI的收购,合并后公司估值达1.25万亿美元,每股发行价526.59美元。马斯克在内部信中表示,此次整合将打造”地球上最具雄心的垂直创新引擎”,涵盖AI、火箭技术、太空互联网等多领域。合并后,SpaceX将推进在太空部署数据中心的计划,利用太空太阳能资源降低AI算力成本。
智谱AI正式发布并开源专业级OCR模型GLM-OCR,以仅0.9B参数实现”小尺寸、高精度”的文档解析能力。模型在权威评测OmniDocBench V1.5中以94.6分登顶,在文本识别、公式识别、表格解析及信息抽取等任务中均取得SOTA表现。特别针对手写体、复杂表格、代码文档等高难场景进行优化,支持PDF和图像批量处理,吞吐量达1.86页/秒。
Qoder智能编程平台上线首个定制模型Qwen-Coder-Qoder,5个月内完成”模型-智能体-产品”全形态布局。该模型基于Qwen-Coder基座,针对Qoder的Agent框架进行深度优化,在真实软件工程评测集上任务解决率超过Cursor Composer-1,Windows系统终端命令准确率领先50%。
Vidu Q3 全球震撼来袭,作为全球首个支持16秒音视频直出的AI视频生成模型,专为漫剧、短剧、影视剧创作设计。模型实现声画同步高清直出,支持多镜头自由切换、多语言对话与文字渲染,具备电影级视听张力,让AI视频进入”一键成片”时代。 AI
跨赴科技近日完成数千万元Pre-A+轮融资,由哈勃投资和正扬投资领投,老股东奇绩创坛跟投,距上一轮融资仅四个月。核心产品“CodeFlying码上飞”年度经常性收入已突破1000万元,海外业务快速增长。
阶跃星辰发布新一代开源基座模型 Step 3.5 Flash,专为 Agent 场景设计。模型采用稀疏 MoE 架构,具备 1960 亿参数,每个 token 仅激活约 110 亿参数,支持 256K 上下文长度。核心优势包括推理速度最高达 350 TPS,在 Agent 任务和数学推理上媲美闭源模型,并通过 MTP-3 技术实现单次预测 3 个 token,显著提升效率。
宇树科技宣布开源视觉-语言-动作大模型UnifoLM-VLA-0。模型基于Qwen2.5-VL-7B架构,通过340小时真机数据训练,融合2D/3D空间感知与动力学预测能力,突破传统VLM在物理交互中的局限。
苹果公司以近20亿美元收购以色列AI初创企业Q.ai,为其自2014年收购Beats以来规模第二大的交易。Q.ai核心技术为通过分析面部微表情与肌肉运动识别“无声语音”,用户无需发声即可通过唇动输入指令。该技术有望集成至AirPods、iPhone及计划于2026年推出的AI眼镜中,实现私密、无干扰的交互体验。
OpenAI宣布将于2月13日从ChatGPT平台下线GPT-4o、GPT-4.1系列等旧模型。此举引发用户强烈反响,部分用户称GPT-4o的“温暖对话风格”具有不可替代的情感价值,尤其满足创意交流与情绪陪伴需求。OpenAI表示将集中资源优化主流模型,并在GPT-5.2中改进个性与创造力。API服务暂不受影响。
阿里云千问团队开源Qwen3-ASR系列语音识别模型,包含1.7B/0.6B参数版本及强制对齐模型。该系列支持52种语言与方言识别,覆盖中文22种地方口音及多国英语变体,在嘈杂环境、歌唱场景下均表现稳定。
商汤科技开源多模态自主推理模型SenseNova-MARS(8B/32B双版本),模型在MMSearch、HR-MMSearch等核心基准测试中以69.74分综合得分超越Gemini-3-Pro(69.06分)与GPT-5.2(67.64分),成为首个支持动态视觉推理与图文搜索深度融合的开源Agentic VLM。