日日新 V6.5是商汤科技推出的日日新新型多模态推理大模型。模型独创图文交错思维链,图像用本体形式参与推理,显著提升跨模态推理精度,超越Gemini 2.5 Pro。
日日新 V6.5是商汤科技推出的日日新新型多模态推理大模型。模型独创图文交错思维链,图像用本体形式参与推理,显著提升跨模态推理精度,超越Gemini 2.5 Pro。
GLM-4.5 是智谱推出的新一代旗舰模型,专为智能体应用打造,是首款原生融合推理、代码和智能体能力的开源 SOTA 模型。采用混合专家(MoE)架构,有两个版本:...
通义万相2.2(Wan2.2)是阿里巴巴开源的先进AI视频生成模型。共开源文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-IT2V-...
WebShaper 是阿里巴巴通义实验室推出的创新的 AI 训练数据合成系统。通过形式化建模和智能体扩展机制,为 AI 智能体(Agent)的训练提供了高质量、可扩展的数...
Skywork UniPic 是昆仑万维开源的多模态统一预训练模型,具备图像理解、文本生成图像及图像编辑三大核心能力。模型基于自回归范式,融合 MAR 编码器和 SigLIP...
Qwen3-30B-A3B-Instruct-2507 是阿里通义开源的Qwen3-30B-A3B非思考模式语言模型,总参数量达305亿,激活参数为33亿,具备48层结构和262,144的上下文长度。
SeedEdit 3.0 是字节跳动Seed团队推出的图像编辑模型,支持用自然语言指令实现对图像的快速、高质量编辑。模型依托强大的文生图模型 Seedream 3.0,能精准理...
Agent Lightning 是微软研究团队推出的灵活可扩展的智能Agent优化框架。框架能无缝集成到任何现有的Agent框架中(如 OpenAI Agents SDK、LangChain 等),基...
HYPIR(Harnessing Diffusion-Yielded Score Priors for Image Restoration)是中国科学院深圳先进技术研究院数字所董超研究员团队推出的先进的图像复原大模...
Qwen3-30B-A3B-Thinking-2507 是阿里通义开源的推理模型,专为复杂推理任务设计。模型拥有305亿参数,其中33亿被激活,支持256K原生上下文长度,能扩展至1M t...
abogen 是强大的文本转语音工具,支持将 ePub、PDF 或文本文件快速转换为高质量音频,能生成同步字幕。abogen 基于 Kokoro-82M 模型,支持多种语言和语音风格...
FLUX.1 Krea [dev] 是 Black Forest Labs 与 Krea AI 合作推出的最新文本到图像生成模型,支持生成更逼真、更多样化的图像,实现照片级真实感水平。
Qwen3-Coder-Flash 是阿里通义千问团队推出的高性能编程模型,全称 Qwen3-Coder-30B-A3B-Instruct。模型具备卓越的 Agentic 能力,擅长代理式编程、工具调用...
Seed Diffusion是字节跳动Seed团队推出的实验性扩散语言模型,专注于代码生成任务。模型通过两阶段扩散训练、约束顺序学习和强化高效并行解码等关键技术,实...
DispatchMail 是开源的、本地运行的 AI 邮件助手,支持通过AI技术自动化收件箱管理。工具能实时监控邮件,用 OpenAI 的 AI Agent根据用户自定义的提示词对邮...
iFlow CLI 是心流AI团队推出的能运行在终端的 AI 智能体,专为开发者和高效工作者设计。iFlow CLI支持自然语言交互,能快速分析代码、生成文档、调试程序、管...
Gemini 2.5 Deep Think 是谷歌推出的 AI 模型,专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞赛(IMO)金牌的模型的变体,通过并行思考技术(Para...
InteriorGS 是群核科技推出的高质量的3D高斯语义数据集,包含1000个3D高斯语义场景,涵盖80多种室内环境,如家庭、便利店、婚宴厅和博物馆。数据集包含755个...
FastDeploy 是百度基于飞桨(PaddlePaddle)框架开发的高性能推理与部署工具,专为大语言模型(LLMs)和视觉语言模型(VLMs)设计。FastDeploy 支持多种硬件...
DragonV2.1(DragonV2.1Neural) 是微软推出的最新零样本文本到语音(TTS)模型。模型基于 Transformer 架构,支持多语言和零样本语音克隆,仅需 5-90 秒的语...
Wuhr AI Ops是智能化运维管理平台,通过AI技术简化复杂的运维任务。平台集成多模态AI助手,支持自然语言交互执行运维命令,能一键切换K8s集群和Linux系统命令...
Skywork MindLink是昆仑万维推出开源的推理大模型。具有自适应推理机制,可根据任务复杂度灵活切换推理模式,简单任务快速生成,复杂任务深度推理,兼顾效率...
ScreenCoder 是开源的智能 UI 截图转代码系统,支持将任何设计截图快速转换为整洁、可编辑的 HTML/CSS 代码。ScreenCoder用模块化多智能体架构,结合视觉理解...
RedOne 是小红书推出的首个面向社交网络服务(SNS)领域的定制化大语言模型(LLM)。模型通过三阶段训练策略,注入社交文化知识,强化多任务能力,并对齐平台...