Codexia是强大的跨平台AI编码桌面应用程序,支持为OpenAI Codex CLI提供图形界面和工具集,增强开发体验。
Codexia是强大的跨平台AI编码桌面应用程序,支持为OpenAI Codex CLI提供图形界面和工具集,增强开发体验。
Kronos 是首个面向金融市场的 K 线图基础模型,由清华大学与微软亚洲研究院联合开源。通过分析股票、加密货币等资产的 K 线数据,包括开盘价、最高价、最低价...
OneSearch 是快手推出的电商搜索端到端生成式框架,优化传统电商搜索的级联式架构,提升搜索精准度和用户体验。三大创新点包括:关键词增强层次量化编码(KHQ...
LSP(Language Self-Play)是Meta提出的一种强化学习方法,解决大型语言模型对大量高质量训练数据的依赖问题。LSP的核心思想是利用自我博弈的方式,让同一模...
TrafficVLM是高德导航推出的基于大模型技术的交通视觉语言模型,通过交通孪生还原能力,将海量实时交通数据转化为动态孪生视频流,构建出与现实世界同步的“数...
DeepSeek-R1-Safe 是浙江大学网络空间安全学院和华为合作推出的基于DeepSeek衍生的安全大模型。模型基于华为昇腾芯片和 MindSpeedLLM 框架,通过构建安全语料...
Granite-Docling-258M 是 IBM 推出的轻量级视觉语言模型,专为高效文档转换设计。模型能将文档转换为机器可读格式,同时完整保留布局、表格、公式等元素。
LongCat-Flash-Thinking 是美团团队推出的拥有 5600 亿参数的大型推理模型,基于专家混合(MoE)架构,支持根据需求动态激活 186 亿到 313 亿参数,兼顾计算...
LatticeWorld 是网易、香港城市大学、北京航空航天大学和清华大学等机构推出的将大语言模型与工业级 3D 渲染引擎虚幻引擎 5 (Unreal Engine 5,UE5)结合的...
DeepSeek-V3.1-Terminus 是 DeepSeek 团队推出的人工智能语言模型,是 DeepSeek-V3.1 的升级版本,主要优化语言一致性和 Agent 能力,解决中英文混杂及异常字...
Qwen3-Omni是阿里通义团队推出的业界首个原生端到端全模态AI模型,能无缝处理文本、图像、音频和视频等多种模态数据。模型在36项音频及音视频基准测试中22项...
Qwen3-TTS-Flash 是阿里通义推出的支持多音色、多语言和多方言的旗舰语音合成模型。模型具备卓越的中英语音稳定性,出色的多语言性能,及高表现力的拟人音色...
Qianfan-VL是百度智能云千帆推出的面向企业级多模态应用场景的视觉理解大模型。模型包含3B、8B和70B三种尺寸版本,具备出色的通用能力和针对OCR、教育等垂直...
Doubao-Seed-Translation 是字节跳动团队推出的先进多语言翻译模型,支持 28 种语言互译,涵盖中英、日韩、德法等多种常用语言。
presentation-ai 是ALLWEONE团队推出的开源 AI 演示文稿生成工具,能根据用户输入的主题自动生成完整的 PPT 大纲和精美的幻灯片,支持多种语言、主题风格和自...
Qwen3Guard 是阿里通义团队推出的 Qwen 家族中首款专为安全防护设计的护栏模型,基于强大的 Qwen3 基础架构打造。模型针对安全分类任务进行专项微调,能高效...
Qwen3-Max 是 Qwen 团队推出的超大规模语言模型,参数量超过 1T,预训练使用 36T tokens。Qwen3-Max是目前 Qwen 系列中规模最大、能力最强的模型,具备卓越的...
Qwen3-VL 是阿里通义推出的 Qwen 系列中最强大的视觉语言模型,具备卓越的多模态能力。模型能理解纯文本、图像和视频,支持长上下文、空间感知、代码生成等功...
Qwen3-LiveTranslate 是阿里通义团队推出的基于大语言模型的多语言实时音视频同传模型。模型支持 18 种语言及多种方言的翻译,具备视觉增强技术,可结合口型...
通义万相2.5(Wan2.5)是阿里推出的最新多模态生成模型,为通义万相 2.5 preview 版(Wan2.5-Preview),涵盖文生视频、图生视频、文生图和图像编辑四大功能...
MiroFlow v0.2是MiroMind推出的开源研究智能体框架,能将任何大型语言模型(LLM)升级至OpenAI深度研究级别的能力,专注于可靠完成复杂的工具使用任务。
LucaVirus 是阿里巴巴云 LucaGroup 研发的专为病毒设计的统一核酸 - 蛋白质语言模型。在 254 亿个核苷酸和氨基酸标记上训练,涵盖几乎所有已知病毒。模型可学...
Audio2Face 是 NVIDIA 推出的AI面部动画生成模型,通过音频输入能生成逼真的面部动画。模型能分析音频中的音素和语调,驱动角色的嘴唇动作和表情,实现精准的...
CWM(Code World Model)是Meta开源的320亿参数的代码世界模型,是全球首个将世界模型系统性引入代码生成的语言模型,支持代码生成和理解。