Migician是北京交通大学、华中科技大学和清华大学的研究团队联合推出的多模态大语言模型(MLLM),专门用在自由形式的多图像定位(Multi-Image Grounding, MI...
Migician是北京交通大学、华中科技大学和清华大学的研究团队联合推出的多模态大语言模型(MLLM),专门用在自由形式的多图像定位(Multi-Image Grounding, MI...
ComfyUI-Copilot 是阿里巴巴国际数字商业集团(AIDC-AI)推出基于 ComfyUI 框架深度开发的 AI 智能助手。ComfyUI-Copilot给予自然语言交互,为用户提供节点推...
Auto-Deep-Research 是香港大学黄超教授实验室开源的全自动个人 AI 助理,作为 OpenAI Deep Research 的开源替代方案。基于 AutoAgent 框架开发,专注于深度...
OOMOL (悟墨)是基于 VSCode 打造的现代化集成开发环境(IDE),专为工作流自动化而设计。通过拖拽式图形化界面,让用户能直观地搭建复杂的工作流,无需编程...
Evo 2 是美国弧形研究所、英伟达、斯坦福大学等机构合作推出的DNA语言模型,用于基因组建模和设计,覆盖生命的所有领域。Evo 2 基于 StripedHyena 2 架构开发...
Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语言文本到语音(TTS)模型,专门用于印度语言和英语的语音合成。Indic Parler-TTS 是 Parl...
GRUtopia 2.0(桃源2.0)是上海人工智能实验室发布的通用具身智能仿真平台。平台在GRUtopia 1.0的基础上进行了全面升级,具备三大核心创新:通用模块化框架、...
BioMedGPT-R1 是清华大学AI产业研究院(AIR)与北京水木分子生物科技有限公司联合推出的升级版多模态生物医药开源大模型。BioMedGPT-R1基于 DeepSeek R1 技术...
SigLIP 2 是Google DeepMind 提出先进的多语言视觉-语言模型 ,是 SigLIP 的升级版本,提升图像与文本之间的对齐能力。通过改进的训练方法和架构,显著增强了...
AvatarGO 是南洋理工大学S-Lab、上海 AI Lab,香港大学联合推出的新型框架,用在从文本输入直接生成可动画化的 4D 人体与物体交互场景。通过零样本(zero-sho...
Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型,具有 160 亿总参数和 30 亿激活参数。模型使用了优化后的 Muon 优化器进行训练...
FlashMLA 是 DeepSeek 开源的针对 NVIDIA Hopper 架构 GPU 优化的高效 MLA(Multi-Head Linear Attention)解码内核,专为处理可变长度序列设计。通过优化 KV...
MagicArticulate 是南洋理工大学和字节跳动Seed实验室推出的自动将静态 3D 模型转换为可动画化资产的框架。MagicArticulate基于自回归生成骨架,预测蒙皮权重...
TANGLED是上海科技大学、Deemos Technology和华中科技大学联合推出的3D发型生成方法,支持从任意风格和视角的图像中生成高质量的3D发丝。TANGLED基于三个核心...
Llasa TTS 是香港科技大学基于 LLaMA 架构推出的开源文本转语音(TTS)模型,支持高质量语音合成和克隆。Llasa TTS 基于单层向量量化(VQ)编解码器和单个 Tr...
AingDesk 是开源的客户端软件,帮助用户快速将上百款 AI 模型部署到个人电脑上。通过一键部署功能,简化复杂的模型安装过程,没有技术背景的用户也能轻松上手...
LazyLLM 是开源的低代码平台,帮助开发者快速、低成本地构建多智能体大语言模型应用。通过极简的开发流程,支持一键式部署和跨平台操作,降低了 AI 应用开发...
memobase 是开源的基于用户画像的长期记忆系统,专为生成式人工智能(GenAI)应用设计。memobase能为虚拟助手、教育工具等应用提供用户记忆功能,帮助AI记住...
MeteoRA 是南京大学计算机科学与技术系的研究团队推出的用于大型语言模型(LLM)的多任务嵌入框架,将多个任务特定的 LoRA(低秩适配器)集成到一个基础模型...
MME-CoT 是香港中文大学(深圳)、香港中文大学、字节跳动、南京大学、上海人工智能实验室、宾夕法尼亚大学、清华大学等机构共同推出的用于评估大型多模态模...
Claude 3.7 Sonnet 是 Anthropic 公司推出的全球首款混合推理模型,具备“标准模式”和“扩展思考模式”两种运行方式。标准模式下,Claude 3.7 Sonnet能快速生成...
DeepEP 是 DeepSeek 开源的首个专为混合专家模型(MoE)训练和推理设计的开源 EP(专家并行)通信库。提供了高吞吐量和低延迟的全对全 GPU 内核,支持节点内...
QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型,是 Qwen 系列的一部分。QwQ-Max-Preview作为预览版本推出,QwQ-Max即将正式发布并全面开源。QwQ-Max专...
FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成(IPT2V)框架,基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器(D...