AReaL-boba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架。AReaL-boba是 AReaL 的升级版本,降低了强化学习训练门槛,用户能轻松训练推理模型。
AReaL-boba 是蚂蚁技术研究院和清华大学联合推出的开源强化学习训练框架。AReaL-boba是 AReaL 的升级版本,降低了强化学习训练门槛,用户能轻松训练推理模型。
Qlib 是微软亚洲研究院推出的面向金融行业的AI量化投资工具,帮助量化研究者探索 AI 技术在投资领域的潜力。Qlib提供高性能的数据处理基础设施,支持从数据获...
OpenDeepSearch 是开源的深度搜索工具,基于开源推理模型和推理代理提升搜索性能,专为 Hugging Face 的 SmolAgents 无缝集成进行优化,支持深度网络搜索和...
Hi3DGen 是香港中文大学(深圳)、字节跳动和清华大学的研究人员共同推出的高保真3D几何生成框架。能从2D图像生成高保真3D模型,通过基于法线图作为中间表示...
GLM-Z1-Air 是智谱公司推出的基于 GLM-4-Air-0414 的深度思考模型。GLM-Z1-Air在预训练阶段引入更多推理类数据,在对齐阶段深度优化通用能力,展现出强大的数...
AI-ClothingTryOn 是基于 Python 的桌面应用程序,用 Google Gemini AI 技术实现虚拟试衣功能。AI-ClothingTryOn支持分别上传人物照片和服装照片,基于 AI 技...
GLM-4-Air-0414是智谱公司推出的拥有320亿参数的基座模型,是AutoGLM沉思背后的模型。GLM-4-Air-0414在预训练阶段加入更多代码类、推理类数据,针对智能体能...
Second Me 是心识宇宙(Mindverse)推出的开源AI身份模型,支持创建完全私有且深度个性化的AI代理,代表用户的“真实自我”。Second Me 提供 Chat Mode 和 Brid...
FinGPT 是开源的金融领域大型预训练语言模型,基于自然语言处理技术推动金融创新。通过强化学习和人类反馈(RLHF)技术,能学习个人偏好,提供个性化的投资建...
GLM-Z1-Rumination 是智谱推出的沉思模型,基于 GLM-Z1 进一步优化而成,具体参数为GLM-Z1-Rumination-32B-0414 。GLM-Z1-Rumination基于扩展强化学习训练,...
Runway Gen-4 是 AI 初创公司 Runway推出的高保真AI视频生成模型。支持在多个场景中保持人物、物体和环境的一致性,无需额外精调或训练。用户提供一张参考图...
Neo-1 是 VantAI 推出的全球首个将从头分子生成与原子级结构预测统一的AI模型。能预测生物分子结构,生成全新的分子,在设计分子胶等新型治疗药物方面表现出...
Amazon Nova Act是亚马逊 AGI Labs推出的通用AI代理,用于在网页浏览器中执行任务。Amazon Nova Act支持开发者基于配套的 SDK 构建智能体应用原型,完成如提...
Amodal3R 是条件式 3D 生成模型,能从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观。模型基于“基础”3D 生成模型 TRELLIS 构建,通过引入掩码加权...
AutoAgent 是香港大学推出的零代码、自动化 LLM 智能体框架。基于自然语言交互,让用户无需编程即可创建智能助手,适用于智能搜索、数据分析、报告生成等场景...
Text to Bark 是 ElevenLabs 推出的全球首个AI“狗语”文本转语音模型。用户输入文字选择犬种,模型能生成高度逼真的狗吠声,95%的狗无法分辨其与真实吠声。模...
Cua 是 trycua 团队推出的开源AI Agent项目,为 macOS 用户提供高性能的虚拟化和 AI 代理功能。Cua基于苹果的 Virtualization.Framework,支持在 Apple Silic...
SWEET-RL是Meta推出的多轮强化学习框架,专门用在训练大型语言模型(LLM)代理进行协作推理任务。SWEET-R基于训练时的额外信息(如参考解决方案)优化“批评者...
OThink-MR1是OPPO研究院和香港科技大学(广州)联合推出的多模态语言模型优化框架。基于动态调整Kullback-Leibler(KL)散度策略(GRPO-D)和奖励模型,提升...
DeepSite 是基于 DeepSeek-V3 模型的在线开发工具,用户无需配置环境或安装软件,在网页上直接输入需求,快速生成游戏、应用或网页的代码,支持实时预览效果。
EasyControl Ghibli 是基于 EasyControl 框架开发的 AI 模型,已上线 Hugging Face 平台,专注于将普通图像转换为吉卜力风格的图像。仅用100张亚洲人脸照片及...
Dolphin是清华大学电子工程系语音与音频技术实验室联合海天瑞声共同推出的面向东方语言的语音大模型。支持40个东方语种的语音识别,中文语种涵盖22种方言(含...
WorldScore 是斯坦福大学提出的用于世界生成模型的统一评估基准。将世界生成分解为一系列的下一个场景生成任务,通过明确的基于相机轨迹的布局规范来实现不同...
PaperBench是OpenAI开源的AI智能体评测基准,支持评估智能体复现顶级学术论文的能力。PaperBench要求智能体从理解论文内容到编写代码、执行实验,全面展现从...