Fun-CosyVoice3.5 - 阿里通义实验室推出的语音生成模型
Fun-CosyVoice3.5 是阿里通义实验室语音团队最新发布的语音生成模型,主打多语种音色复刻与精细化表达控制。模型最突出的创新在于FreeStyle自然语言控制能力—...
Fun-CosyVoice3.5 是阿里通义实验室语音团队最新发布的语音生成模型,主打多语种音色复刻与精细化表达控制。模型最突出的创新在于FreeStyle自然语言控制能力—...
FireRed-OCR 是小红书团队开源的轻量级文档结构解析视觉语言模型,以仅 2B 参数的规模在 OmniDocBench v1.5 权威评测中斩获 92.94% 综合得分,超越 GPT-5.2、...
Fun-AudioGen-VD 是阿里通义实验室语音团队推出的创新语音大模型,定位为面向'声音设计与场景化音频生成'的专业工具。模型支持'FreeStyle'自由指令生成,能根...
Goose 是 Block 开源的本地 AI Agent 框架,能自主执行完整工程任务——读文件、写代码、跑测试、调 API、自动 Debug,出错后自我修正直至完成。
DataClaw 是开发者Peter O'Malle开源的AI对话数据导出工具。能自动抓取用户与Claude Code、Codex CLI、Gemini CLI等AI编程助手的完整对话历史,将其转换为结...
OpenSandbox 是阿里巴巴开源的通用 AI 应用沙箱平台,采用 Apache 2.0 协议,专为安全执行 AI 生成代码和自动化任务而设计。提供多语言 SDK(Python、Java/Ko...
TinyClaw 是 TinyAGI 开源的轻量级多智能体协作框架,专为资源受限环境设计。TinyClaw支持在树莓派等设备上同时运行多个专业 AI Agent(如 @coder、@writer)...
OpenFang 是用 Rust 构建的开源 Agent 操作系统,核心创新是 Hands——7 个预置的自主能力包,让 AI 无需人工触发可 7×24 小时自动执行任务(如监控竞品、挖掘...
AngelSlim 是腾讯混元团队自研并开源的全模态大模型压缩工具包,通过量化、投机采样、稀疏化和蒸馏等技术,为大语言模型(LLM)、视觉语言模型(VLM)及语音...
Arrow 1.0 是 Quiver AI 推出全球首款 SVG 原生 AI 生成模型。与传统像素生成模型不同,模型能直接输出可缩放矢量图形代码,图像基于数学公式构建,支持无限...
pplx-embed 是 Perplexity 推出的系列文本嵌入模型,包含标准检索的 pplx-embed-v1 和上下文感知的 pplx-embed-context-v1,均提供 0.6B 和 4B 两种规模。
SkyReels V4是昆仑万维推出的视频基础模型,是全球首个支持多模态输入、联合音视频生成及统一生成/修复/编辑的AI视频模型。模型采用双流MMDiT架构,可生成108...
LocoOperator-4B 是 LocoreMind 开源的 4B 参数代码探索智能体,基于 Qwen3-4B-Instruct 通过知识蒸馏从 Qwen3-Coder-Next 训练而来。模型定位为 Claude Code...
Nano Banana 2 是 Google DeepMind 推出的新一代图像生成模型(Gemini 3.1 Flash Image)。模型接入 Gemini 知识库和实时网络搜索,可精准绘制真实场景、生成...
Ctrl-World 是清华陈建宇与斯坦福 Chelsea Finn 团队联合推出的具身世界模型,在 WorldArena 权威评测中斩获具身任务能力全球第一、视频生成质量全球第二。
Talksign-1是专为美式手语(ASL)设计的AI实时翻译模型,支持双向转换,能通过摄像头捕捉3D人体关键点识别250个ASL词汇,或将语音/文字转为手语视频。
IronClaw 是 NearAI 团队推出开源的AI助手,基于 Rust 语言实现,主打本地优先与安全可控。IronClaw采用 WASM 沙盒隔离工具执行,通过加密保险柜管理凭证,确...
MimiClaw是基于ESP32-S3芯片的超轻量级AI助手,采用纯C语言编写,能直接在裸机上运行,无需Linux、Node.js或操作系统。
NanoClaw 是开源的 AI 助手,作为 OpenClaw 的轻量级替代品,每个 Agent 在独立沙箱中运行,仅访问显式挂载的目录。
Zvec是阿里巴巴开源的轻量级嵌入式向量数据库,基于内部Proxima引擎构建。与传统独立部署方案不同,Zvec直接嵌入应用进程运行,无需额外服务器或配置,安装即...
MoChat是香港大学数据科学实验室推出的AI智能体原生社交平台。平台通过OpenClaw、Nanobot、Claude Code等适配器,让AI Agent以独立身份自动发现潜在合作者、...
ClawFeed 是开源的 AI 新闻摘要工具,能帮用户聚合 Twitter、RSS、HackerNews、Reddit、GitHub 等多平台信息源,通过 AI 智能筛选生成结构化摘要(支持 4小时...
OpenAkita 是开源自进化 AI 助手框架,能像传统 AI 助手一样执行指令,具备独特的'自我进化'能力会自动进行内存整合、错误修复和任务复盘,遇到卡壳时能自己...
FireRedASR2S是小红书Super Intelligence-AudioLab开源的工业级端到端语音识别模型,集成ASR、VAD、语种识别和标点预测四大SOTA模块。