Uni-1.1是Luma AI推出的新一代图像生成模型及API服务,采用decoder-only自回归Transformer架构,将文本推理与像素生成整合为统一流程。
Uni-1.1是Luma AI推出的新一代图像生成模型及API服务,采用decoder-only自回归Transformer架构,将文本推理与像素生成整合为统一流程。
DeepSeek-TUI 是完全运行在终端中的编程智能体,由 Hayden Brown 基于 Rust 构建,专为 DeepSeek V4 系列模型(deepseek-v4-pro / deepseek-v4-flash)原生设...
GPT-5.5 Instant是OpenAI发布的ChatGPT新一代默认模型,取代GPT-5.3 Instant,免费向所有用户开放。模型融合5.5的基础智力与极速响应,高风险领域幻觉减少52....
OpenWhip 是基于 Electron 的开源桌面小工具,专为 Claude Code 用户设计。当 AI 陷入死循环、反复修改同一行代码或长时间无响应时,用户点击托盘鞭子图标,...
Cube Sandbox 是腾讯云开源的 AI Agent 沙箱执行环境底座,基于 RustVMM 与 KVM 构建,兼具硬件级安全隔离与亚百毫秒启动速度。每个 Agent 运行在独立内核中...
OfficeCLI 是 iOfficeAI 团队推出的全球首个专为 AI 智能体设计的开源命令行 Office 套件。让任何 AI Agent 只需一行代码即可完全掌控 Word、Excel 和 PowerP...
Career-Ops 是基于 Claude Code 构建的开源 AI 驱动求职系统,非传统意义上的'海投工具',是智能过滤器,通过结构化评估帮助求职者在海量职位中筛选出真正值...
Flipbook 是前 OpenAI 工程师 Zain Shah 与 YC 校友团队推出的 AI 无限视觉浏览器,所有页面完全实时按需生成。Flipbook彻底摒弃 HTML、CSS 与 JavaScript 代...
gnhf(全称 good night, have fun)是开源的 AI Agent 自主编排器,核心理念是让开发者在睡前给 AI 设定一个目标,让它在你休息时持续迭代工作。每次只做一个...
LongCat-2.0-Preview 是美团推出的万亿参数级大模型预览版,采用 MoE 架构,总参数达 1.6T、激活参数约 48B,支持 1M 超长上下文。
Vibe-Trading 是香港大学数据科学实验室(HKUDS)开源的AI驱动多智能体金融工作空间,将自然语言指令转化为可执行的交易策略、研究洞察和组合分析。项目覆盖A...
Qwen-Scope 是阿里通义千问团队开源的大模型可解释性工具套件,基于稀疏自编码器(SAE)技术,在 Qwen3/Qwen3.5 系列模型隐藏层提取可解释特征。
MindDR 1.5 是理想汽车信息智能体团队推出的多智能体深度研究框架,用仅约 30B 参数规模在 DeepResearch Bench 取得 52.54 分,达到业界领先水平。
Hy-MT1.5-1.8B-1.25bit 是腾讯混元团队推出的极致量化压缩版手机端离线翻译大模型。模型基于混元翻译大模型 Hy-MT1.5-1.8B(18亿参数)打造,通过创新的 Sher...
FlashQLA 是通义实验室开源的基于 TileLang 实现的高性能线性注意力算子库。FlashQLA 通过算子融合、Gate 驱动卡内序列并行及 Warp-Specialized 优化,在 Hop...
Ling-2.6-1T 是百灵大模型(InclusionAI)最新开源的万亿参数综合旗舰模型,专为 Agent、Coding 和复杂工作流设计。模型采用 MLA 与 Linear Attention 混合架...
One-Eval 是北京大学 OpenDCAI 团队开源的自动化 Agent 驱动大模型评测框架,基于 DataFlow 与 LangGraph 构建,主打 NL2Eval(自然语言转评测)能力。
Step Image Edit 2 是阶跃星辰推出的新一代轻量级图像生成编辑模型,参数量仅 3.5B,能在实际表现中超越 12B-20B 级开源大模型。模型单次生图耗时 0.5-2 秒,...
星火X2-Flash是科大讯飞发布的MoE架构大语言模型,总参数30B,支持256K超长上下文,基于华为昇腾910B国产算力集群训练。
SenseNova U1是商汤日日新基于NEO-Unify架构推出的原生统一多模态模型,在单一架构内实现理解、推理与生成。模型摒弃传统视觉编码器和VAE,构建统一表征空间...
Nemotron 3 Nano Omni 是 NVIDIA Nemotron 3 模型系列,是专为 Agent 系统设计的开源高效多模态推理模型。模型采用 30B-A3B 混合 MoE 架构,将视觉、音频、文...
Agent Skills 是谷歌 Gemini 团队主管 Addy Osmani 开源的 AI 编程 Agent 技能包。Agent Skills 将 Google 资深工程师的工作流与工程规范封装为 20 个 Skill...
EAPO是阿里通义实验室推出的长文本推理强化学习框架,通过引入'证据奖励'机制,将监督信号从最终答案下沉到证据提取过程。
Tolaria 是面向 AI 时代的开源本地笔记工具,由 Refactoring 作者 Luca 基于 5 年全职写作、9000+ 笔记的管理经验打造。工具融合 Notion 的块编辑体验与 Obsi...