Step-Audio-AQAA 是 StepFun 团队推出的端到端大型音频语言模型,专门用于音频查询-音频回答(AQAA)任务。能直接处理音频输入生成自然、准确的语音回答,无...
Step-Audio-AQAA 是 StepFun 团队推出的端到端大型音频语言模型,专门用于音频查询-音频回答(AQAA)任务。能直接处理音频输入生成自然、准确的语音回答,无...
MuseSteamer是百度推出的多模态AI视频生成大模型。模型能根据输入的图片或文字提示,生成高质量的动态视频,支持电影级画质和音效一体化生成。
DeepSWE是Together.ai联合Agentica开源的AI Agent框架,基于Qwen3-32B模型,用强化学习训练而成。DeepSWE在SWE-Bench-Verified基准测试中表现出色,测试时扩...
Nxtscape 是基于 Chromium 的开源浏览器,主打本地 AI Agent和隐私保护。Nxtscape支持用户在设备上直接运行 AI 自动化任务(如填表、会议调度),数据不离开...
Skywork-Reward-V2是昆仑万维开源的第二代奖励模型系列,包含基于不同基座模型和大小的8个模型,参数规模从6亿到80亿不等。Skywork-Reward-V2系列模型在七大...
易采集EasySpider是开源、免费且无广告的可视化网络爬虫工具。工具支持跨平台运行(Windows、MacOS、Linux),基于图形化界面,用户无需编写代码能可快速设计...
Kyutai TTS 是法国人工智能研究机构 Kyutai Labs 推出的流式文本转语音(TTS)技术。是创新的语音合成系统,能实时将文本转换为自然流畅的语音,无需等待完整...
DeepSeek R1T2 (DeepSeek-TNG R1T2 Chimera)是TNG基于 DeepSeek 原始模型开发的改进型人工智能语言模型。采用 Tri-Mind 架构,融合了 DeepSeek R1-0528、R1...
Chrome MCP Server是基于Chrome扩展的模型上下文协议(MCP)服务器,将Chrome浏览器的功能暴露给AI助手,如Claude。支持AI直接控制用户的日常Chrome浏览器,...
MOSS-TTSD(Text to Spoken Dialogue)是开源的口语对话语音生成模型,由清华大学语音与语言实验室(Tencent AI Lab)开发。能将文本对话脚本转化为自然流畅...
工作性价比计算器(这b班上得值不值·测算版)支持全面评估工作的实际价值,不仅仅局限于薪资水平。工具综合考虑年薪、工作时长、通勤时间、工作环境、个人学...
Agent Zero 是开源的、动态的、可扩展的人工智能框架,成为用户个性化的智能助手。不是预设功能的工具,通过用户的指令和任务动态学习和成长。Agent Zero 具...
NativeMind是开源的完全在本地设备运行的AI助手。NativeMind支持DeepSeek、Qwen、Llama等多种模型,基于Ollama集成能无缝加载和切换。NativeMind功能包括智能...
WebSailor 是阿里通义实验室开源的网络智能体,专注于复杂信息检索与推理任务。通过创新的数据合成方法(如 SailorFog-QA)和训练技术(如拒绝采样微调和 DUP...
Furion 是基于 .NET 的免费开源开发框架,简化开发流程,提高开发效率。支持多种运行环境,包括 Windows、Linux、Mac OS 和 Docker,适用于开发 Web API、Web...
Hunyuan3D-PolyGen是腾讯混元团队推出的业界首个美术级3D生成大模型。结合自研的高压缩率表征技术(BPT),能生成面数高达上万面的复杂几何模型,支持三边面...
Gen-CLI 是基于开源 Gemini-CLI ,依托硅基流动 SiliconCloud 平台 API 开发的命令行AI编程工具。Gen-CLI 为国内开发者提供类似 Gemini-CLI 的高效编程能力。...
MetaStone-S1是原石科技推出的反思型生成式大模型,首次融合深度推理与推理链自筛选能力。模型核心用自监督反思范式,基于共享主干的策略模型和过程评分模型...
HumanOmniV2 是阿里通义实验室开源的多模态推理模型。模型基于强制上下文总结机制、大模型驱动的多维度奖励体系及基于 GRPO 的优化训练方法,解决多模态推理...
Skywork-R1V 3.0 是昆仑万维开源的多模态推理模型,具备强大的跨模态推理能力和跨学科泛化能力。模型在高考数学中取得142分的高分,在多学科推理评测 MMMU 中...
Grok 4 是 xAI 推出的最新AI大模型,Grok 4 的推理能力相较于前代提升 10 倍。模型具备卓越的推理能力,能在 SAT、GRE 等高难度考试中接近满分,在多项基准测...
TradingAgents-CN是基于多智能体大模型的中文金融交易决策框架,在TauricResearch/TradingAgents的基础上进行了开发,为中文用户提供了完整的文档体系和本地...
PromptForge 是 AI 提示工程工作台,支持帮助用户高效地创建、测试和优化 AI 提示。平台基于智能生成功能提供 AI 辅助的提示构建和优化建议,具备高级分析工...
RoboBrain 2.0 是强大的开源具身大脑模型,能统一感知、推理和规划,支持复杂任务的执行。RoboBrain 2.0 包含 7B(轻量级)和 32B(全规模)两个版本,基于异...