腾讯混元开源手机端离线翻译模型Hy-MT1.5-1.8B-1.25bit
腾讯混元开源手机端离线翻译模型Hy-MT1.5-1.8B-1.25bit,将支持33种语言、1056个翻译方向的翻译大模型极致压缩至 440MB,无需联网可在手机本地运行。模型基于1.8B参数的Hy-MT1.5打造,采用Sherry稀疏量化技术(ACL 2026录用),翻译质量超越谷歌翻译等主流系统。
腾讯混元开源手机端离线翻译模型Hy-MT1.5-1.8B-1.25bit,将支持33种语言、1056个翻译方向的翻译大模型极致压缩至 440MB,无需联网可在手机本地运行。模型基于1.8B参数的Hy-MT1.5打造,采用Sherry稀疏量化技术(ACL 2026录用),翻译质量超越谷歌翻译等主流系统。
百灵大模型Ling-2.6-1T正式开源面向复杂任务的万亿级综合旗舰模型。模型依托 MLA 与 Linear Attention 混合架构,以极低 Token 消耗实现高智效比,综合智能与 GPT-5.4(Non-Reasoning)同档。在 AIME26、SWE-bench Verified、BFCL-V4 等多个执行类基准上达到开源 SOTA,具备强 Agent 执行、代码生成与长上下文理解能力。
阿里正式推出数字员工平台QoderWake及Qoder移动端。QoderWake采用Harness-First架构,具备多维度自进化能力,可将经验沉淀到记忆、技能等五个维度,解决通用Agent”做完即忘”问题。目前已上线”数字程序员”,在阿里内部实现全流程无人值守的根因分析与代码修复,将单条问题分析耗时从30分钟缩短至2分钟。
DeepSeek多模态”识图模式”已开启灰度测试,部分用户可在首页看到新入口。上传图片后,DeepSeek能像人一样理解画面中的物体与场景。实测显示,识图模式可准确判断动物品种、通过建筑与文字线索识别杭州灵隐寺给出精确坐标,还能识破视觉陷阱图片。
科大讯飞星火X2-Flash正式推出并开放API。模型采用MoE架构,总参数30B,支持256K超长上下文,基于华为昇腾910B国产算力集群训练。在智能体与代码能力上大幅提升,经实测效果接近万亿级参数模型,Token消耗成本不到主流大模型的三分之一。模型已接入AstronClaw、Loomy等平台,兼容OpenClaw等主流Agent框架。
阶跃星辰正式推出新一代图像生成编辑模型 Step Image Edit 2。模型仅3.5B参数,在实际表现中超越12B-20B级开源图像编辑大模型,单次生图只需0.5-2秒,在KRIS-Bench榜单轻量级图像编辑模型综合排名第一。模型支持图像生成与编辑、中英文渲染、局部编辑、视觉推理、风格迁移等功能,覆盖IP创作、海报设计、人像美颜等场景。
前谷歌DeepMind首席科学家、AlphaGo核心研发者David Silver创立的英国AI公司Ineffable完成11亿美元种子轮融资,估值达51亿美元,本轮融资由红杉资本与光速创投领投,英伟达、谷歌等参投,创欧洲史上最大种子轮纪录。公司致力于打造无需人类数据、通过自主实践探索知识的”超级学习系统”。
蚂蚁集团旗下百灵大模型宣布 Ling-2.6-flash 正式开源,同步提供 BF16、FP8、INT4 等多精度版本,模型已上线 Hugging Face 与 ModelScope。模型总参数 104B、激活参数 7.4B,两周前曾以 Elephant Alpha 匿名身份登陆 OpenRouter,迅速获得开发者社区与行业用户的广泛关注。
商汤正式开源日日新SenseNova U1系列原生理解生成统一模型。模型基于自研NEO-unify架构,摒弃传统拼接式设计,在单一架构内统一多模态理解、推理与生成。本次开源轻量版SenseNova U1 Lite,包含8B稠密网络与A3B MoE网络两个规格。在图像理解、生成编辑及视觉推理等多项基准测试中,达到同量级开源模型SOTA水平。
阿里 QoderWork 正式上线「专家套件」功能,首批发布覆盖金融、法律、营销、财税、咨询、产品六大领域的 10 个预制套件,将专业知识、工作流程与数据连接器打包集成至 AI,用户无需编写 Skill 可一键调用、开箱即用。同时支持企业与用户自定义封装专属套件,实现业务配置与使用分离。
阿里通义实验室推出全新强化学习框架EAPO(Evidence-Augmented Policy Optimization),引入”证据奖励”机制,将监督从答案下沉到证据提取过程,解决大模型长文本推理中”搜对却答错”的幻觉问题。框架基于Qwen3-30B的模型在多个权威长文本基准测试中表现优异,反超120B参数的GPT-OSS和Claude-Sonnet-4等大模型。
百度AI DAY推出通用智能体GenFlow4.0,目前通用智能体GenFlow的月活用户已经突破1亿。新版本全面升级Office Agent,一句话即可生成PPT、处理Excel数据、撰写Word长文档;记忆中心支持自主规划与个性化记忆。同时深度兼容OpenClaw,实现手机电脑无缝协作与Skills跨平台迁移。
微软与OpenAI修订合作协议,解除云合作独家限制,OpenAI产品仍优先在Azure发布,且可通过任何云提供商向客户提供服务。知识产权授权从独家变为非独家,延至2032年。微软不再向OpenAI支付分成,OpenAI向微软的分成延续至2030年但设总额上限,与技术进展脱钩。微软同时获得独立追求AGI的权利。
小红书首次公布「AI治理主张」,明确三大原则:欢迎创作者使用AI作为创意放大器;鼓励对AI生成内容主动标识,未标注者平台将统一添加标识;严守真实底线,坚决反对AI造假与侵权。平台将持续建设AI内容识别治理能力,同时上线AI笔记贴条提示的申诉通道,保障创作者权益,守护社区真实、公平、温暖的底色。
GitHub Copilot宣布6月1日起转向按量计费,以AI Credits替代固定额度,按Token消耗计费。基础订阅价不变:Pro每月10美元、Pro+每月39美元,均含等值Credits,代码补全不消耗额度。企业版支持共享额度池,Business和Enterprise客户6至8月可获额外促销额度。年度用户维持原计费至期满。
芒果传媒与爱诗科技签署战略合作协议,合作将以芒果全景工作站为载体,将爱诗科技AI视频大模型能力系统性接入芒果内容生态,推动AI技术在音视频创制、AI影游、IP开发等核心业务场景落地。双方将围绕内容生产、互动娱乐及内容全球化三大方向展开深度合作,探索AI视频在短剧、动画、综艺视觉及实时互动内容中的产业化应用。 AIsphere
阶跃星辰与腾讯云达成战略合作,双方将整合阶跃星辰端到端语音大模型与多模态理解技术,结合腾讯云基础设施及内容生态优势,共同加速大模型上车进程。合作聚焦智能座舱场景,打造免唤醒、连续对话、情绪识别的主动式AI交互体验,联动腾讯音乐、视频、地图等服务,实现车内服务闭环。
灵光App上线「体验世界模型」功能,首次将世界模型能力引入手机端。用户只需上传一张图片,选择「生成图中世界」或输入探索指令,可一键生成可交互的3D虚拟世界。进入场景后,可通过摇杆控制移动用第一人称视角自由漫步,像玩游戏一样沉浸式探索。
阿里巴巴旗下堆友平台上线 HappyHorse 1.0 视频模型,限时折扣低至 12 堆豆/秒,5 秒视频不到 1 元。用户登录官网点击「视频生成」入口即可体验,模型支持 3D 动画广告、无人机运镜、多人实景互动及氛围感镜头等场景,面向设计师、AI 爱好者等群体提供高性价比的视频创作能力。
LibTV 全网首发新一代视频模型 HappyHorse 1.0,支持文生视频、图生视频及参考图生成三种模式,可输出 15 秒 1080P 多镜头叙事视频。模型具备自然语言视频编辑、电影级画面质感、智能分镜编排、音画同步生成及多风格还原能力,在人物动作自然度、微表情刻画和对话真实感方面显著提升。
具身智能企业星动纪元完成超2亿美元新一轮融资,由顺丰集团领投,红杉中国、IDG资本、中金资本等联合注资,多家产业方共同参与。星动纪元实现了具身行业首个PMF,已携手中国邮政、顺丰等落地10余个物流中心,部分场景作业效率超人类85%,将于2026年Q2开启千台级机器人批量交付。
小米机器人事业部开源 Xiaomi-Robotics-0 真机后训练全流程。基于预训练基座,用20小时任务数据可完成耳机收纳等高精度操作。团队通过异步推理、动作前缀及自适应加权、Λ型掩码、随机遮蔽三重策略,破解模型”偷懒效应”,实现动作连贯与视觉灵敏的平衡。
DeepSeek官方宣布全系API服务输入缓存命中价格降至原有价格的1/10。DeepSeek-V4-Pro缓存命中输入降至0.025元,DeepSeek-V4-Flash降至0.02元。Pro模型在5月5日前可叠加2.5折限时优惠。本次大幅降价为降低开发者调用成本,提升长上下文场景下的API使用性价比。
阿里云推出企业级智能体构建平台JVS Crew,以”被集成”为设计理念,帮助企业快速在现有App或SaaS中嵌入生产级AI Agent能力。平台补齐OpenClaw在企业级场景的短板,通过身份、内容、执行三道安全墙实现自主可控,提供全托管跨会话记忆、端到端可观测Trace及四级预算成本管控。 Crew