Neovate Code 是蚂蚁集团开源的智能编程助手,专注于提升开发效率。工具能深度理解代码库,遵循既有编码习惯,精准完成代码生成、Bug修复和重构等任务。
Neovate Code 是蚂蚁集团开源的智能编程助手,专注于提升开发效率。工具能深度理解代码库,遵循既有编码习惯,精准完成代码生成、Bug修复和重构等任务。
Vidu Q2是生数科技推出的新一代图生视频大模型,实现了AI视频生成技术从“视频生成”到“演技生成”的跨越,标志着AI视频进入追求“神似”的新纪元。Vidu Q2能生成...
AudioFly 是科大讯飞开源的文本生成音效的AI模型。模型用潜在扩散模型架构,拥有10亿参数,通过大量开放数据集(如AudioSet、AudioCaps、TUT)及内部专有数据...
SimpleFold 是苹果公司推出的轻量级蛋白质折叠预测 AI 模型。模型基于流匹配(Flow Matching)技术,跳过多序列比对(MSA)等复杂模块,直接从随机噪声生成蛋...
FLM-Audio 是北京智源人工智能研究院联合 Spin Matrix 与新加坡南洋理工大学共同发布的原生全双工音频对话大模型,支持中文和英文。采用原生全双工架构,可在...
Spark Chemistry-X1-13B 是科大讯飞开源的化学专业大型语言模型。模型基于讯飞星火X1-0420大模型,经过多种化学任务数据集的微调,具备卓越的复杂化学问题解...
GDPval 是 OpenAI 推出的全新评估框架,用在衡量 AI 模型在真实经济价值任务上的表现。GDPval 从美国 GDP 贡献最大的 9 个行业中选取 44 种职业,设计 1320 ...
混元3D-Omni(Hunyuan3D-Omni)是腾讯混元3D团队提出的3D资产生成框架,通过多种控制信号实现精准的3D模型生成。基于Hunyuan3D 2.1架构,引入了统一的控制编...
混元3D-Part是腾讯推出的3D生成模型,由P3 - SAM和X - Part组成,首次实现高精度、可控的组件式3D生成,支持50 + 组件自动生成。用户可先用混元3D 2.5或3.0生...
StableAvatar 是复旦大学、微软亚洲研究院等推出的创新音频驱动虚拟形象视频生成模型。模型通过端到端的视频扩散变换器,结合时间步感知音频适配器、音频原生...
CoF(Chain-of-Frames,帧链)是DeepMind推出的新概念,类比于语言模型中的“链式思维”(Chain-of-Thought,CoT)。
Manzano是苹果公司推出的新型多模态大语言模型(LLM),能同时实现图像理解和图像生成的统一。模型通过混合视觉分词器(hybrid vision tokenizer)将图像转化...
KAT-Dev-32B 是快手 Kwaipilot 团队发布的开源代码智能大模型,拥有 32 亿参数。在 SWE-Bench Verified 基准测试中取得了 62.4% 的解决率,排名第 5。模型经...
KAT-Coder 是快手旗下 Kwaipilot 团队发布的闭源旗舰代码生成模型,具备强大的编程能力。能高效完成功能开发、缺陷分析、单测生成等任务,支持多种编程语言,...
JoySafety 是京东开源的大模型安全框架,为企业提供成熟、可靠、免费的大模型安全防护方案。模型基于多种原子能力模块(如 BERT、FastText、Transformer 等)...
Lynx 是字节跳动推出的高保真个性化视频生成模型,仅需单张人像照片,能生成身份一致的视频。基于扩散 Transformer(DiT)基础模型构建,引入 ID-adapter 和 ...
DeepSeek-V3.2-Exp是DeepSeek-AI推出的实验性人工智能模型,通过引入DeepSeek Sparse Attention(DSA)机制,显著提升长文本处理的效率。模型基于DeepSeek-V3...
OpenPPT 是开源的PPT工具,核心服务基于ChatPPT能提供高效、便捷的 PPT 制作体验。工具支持多平台使用,包括 Windows、macOS 和 Linux,让用户能在不同设备上...
Claude Sonnet 4.5 是 Anthropic 最新推出的最强编程模型。模型在编程、计算机操作、推理和数学等多个领域表现出色,在 SWE-bench Verified 测试中登顶,能专...
Ring-1T是蚂蚁集团开源的万亿参数思考大模型,基于 Ling 2.0 MoE 架构,在 20T 语料上预训练,通过自研强化学习系统 ASystem 进行推理能力训练。支持128k上下...
GLM-4.6 是智谱推出的新一代基座大模型,总参数量达 355B,激活参数 32B。模型在真实编程、长上下文处理、推理能力、信息搜索、写作能力及智能体应用等方面实...
豆包大模型1.6-vision是火山引擎推出的具备工具调用能力的视觉深度思考模型。模型拥有强大的通用多模态理解和推理能力,支持Responses API,能自主调用工具如...
RoboBrain-X0是北京智源人工智能研究院开源的全球首个支持零样本跨本体泛化的具身模型。能在无需微调的情况下,驱动多种不同构造的真实机器人完成基础操作任...
聆音(EchoCare)是中国科学院香港创新研究院人工智能与机器人创新中心(CAIR)推出的超声大模型。模型依托450万张超声影像数据集EchoAtlas进行训练,数据集...