Home
AI Tools
AI News

AiBossCross-market AI tools discovery, in your language

AiBoss is a cross-market, multilingual AI tools discovery site covering AI ecosystems worldwide (EN/JP/ZH). Find tools your local directory misses, and learn whether you can actually use them from where you are.

Popular Categories

AI Writing Tools
AI Image Tools
AI Video Tools
AI Coding Tools
View All →

Quick Links

AI News
AI Projects
AI Apps
Search
Privacy Policy
Terms of Service

AI News

AI Projects12/18/2025

Pipecat是开源的Python框架，专注于构建语音和多模态对话代理。基于内置的语音识别、文本转语音（TTS）和对话处理功能，简化AI服务的复杂协调、网络传输、音...

AI Projects12/18/2025

RealtimeSTT是开源的实时语音转文本库，专为低延迟应用设计。有强大的语音活动检测功能，可自动识别说话的开始与结束，通过WebRTCVAD和SileroVAD进行精准检测...

AI Projects12/18/2025

Step R-mini（全称Step Reasoner mini）是阶跃星辰推出的推理模型，是 Step 系列模型家族的首个推理模型，擅长主动规划、尝试和反思，基于慢思考和反复验证...

AI Projects12/18/2025

GLM-Realtime是智谱推出的全新端到端多模态模型，具备低延迟的视频理解与语音交互能力，特别融入清唱功能，让大模型在对话中能展现歌唱才能。模型支持长达2分...

AI Projects12/18/2025

CogView-3-Flash 是智谱推出的首个免费AI图像生成模型，能根据文本描述生成高审美分数的图像，支持多种分辨率，满足专业领域需求。模型具备创意多样性，基于...

AI Projects12/18/2025

MangaNinja是基于参考图像的线稿上色方法，具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案，提升了上色的准确性与图像质量。能应对...

AI Projects12/18/2025

AutoMouser - AI Chrome扩展程序，实时交互跟踪自动生成测试代码

AutoMouser是Chrome扩展程序，能智能地跟踪用户交互，基于OpenAI的GPT模型自动生成Selenium测试代码。通过记录用户的浏览器操作，如点击、拖动、悬停等，将其...

AI Projects12/18/2025

CogVideoX-Flash - 智谱推出的首个免费AI视频生成模型

CogVideoX-Flash 是智谱推出的首个免费AI视频生成模型，继承CogVideoX自研的端到端视频理解模型，具备强大的视频生成能力。CogVideoX-Flash支持文生视频，依...

AI Projects12/18/2025

Mini-InternVL - 上海AI Lab联合清华等机构推出的轻量级多模态大模型

Mini-InternVL是“迷你版”书生·万象大模型，是上海AI实验室与清华大学、南京大学等机构联合推出的轻量级多模态大型语言模型系列，包含1B、2B和4B三个参数版本...

AI Projects12/18/2025

Weebo - AI语音聊天机器人，实时响应用户语音指令和问题

Weebo是实时语音聊天机器人，基于Whisper Small、Llama 3.2和Kokoro-82M技术驱动。能通过语音识别和生成技术，与用户进行自然流畅的对话，提供实时的语音交互...

AI Projects12/18/2025

ParGo - 字节与中山大学联合推出的多模态大模型连接器

ParGo是字节团队与中山大学合作提出的创新的多模态大语言模型连接器，提升视觉和语言模态在多模态大语言模型（MLLMs）中的对齐效果。通过结合局部token和全局...

AI Projects12/18/2025

MatterGen - 微软推出的无机材料生成模型

MatterGen是微软推出的创新生成模型，专门用在设计无机材料。基于独特的扩散过程，逐步细化原子类型、坐标和周期晶格，从而生成跨越周期表的稳定、多样化的无...

AI Projects12/18/2025

XMusic - 腾讯多媒体实验室自主研发的AI通用作曲框架

XMusic是腾讯多媒体实验室自主研发的AI通用作曲框架。用户只需上传视频、图片、文字、标签、哼唱等任意内容，XMusic能生成情绪、曲风、节奏可控的高质量音乐...

AI Projects12/18/2025

Seaweed APT - 字节跳动推出的单步图像和视频生成项目

Seaweed APT是字节跳动推出的对抗性后训练（Adversarial Post-Training）模型，能实现图像和视频的一站式生成。Seaweed APT基于预训练的扩散模型，直接对真实...

AI Projects12/18/2025

OmAgent - Om AI联合浙大开源的多模态语言代理框架

OmAgent是Om AI和浙江大学滨江研究院联合开源的多模态语言代理框架，能简化设备端智能代理的开发。OmAgent支持可重用的代理组件，助力开发者构建复杂的多模态...

AI Projects12/18/2025

T2A-01-HD - 海螺AI海外版推出新的语音模型

T2A-01-HD是海螺AI海外版推出新的语音模型。支持语音克隆，仅需10秒音频即可精准克隆声音，保留情感底色。模型具备智能情感系统，能捕捉语音中的情感细微差别...

AI Projects12/18/2025

Uni-AdaFocus - 清华大学推出通用的高效视频理解框架

Uni-AdaFocus是清华大学自动化系的研究团队推出的通用的高效视频理解框架，框架通过自适应聚焦机制，动态调整计算资源的分配，实现对视频内容的高效处理。

AI Projects12/18/2025

AnyStory - 阿里通义推出的高保真个性化文本到图像生成框架

AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架，实现单个和多个主体的高保真个性化图像生成。通过“编码-路由”的方法来建模主体个性化问题。在编...

AI Projects12/18/2025

SHMT - 阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术

SHMT（Self-supervised Hierarchical Makeup Transfer）是阿里巴巴达摩院与武汉理工大学等机构联合研发的先进自监督化妆转移技术。技术通过潜在扩散模型实现...

AI Projects12/18/2025

SmartEraser - 中科大与微软亚洲研究院推出的图像对象移除技术

SmartEraser是中国科学技术大学与微软亚洲研究院推出的图像编辑技术，专门用在从图像中移除用户指定的对象。SmartEraser基于创新的“掩码区域引导”（Masked-Re...

AI Projects12/18/2025

Zerox - 开源的OCR工具，零样本识别多种格式文件

Zerox是开源的本地化高精度OCR工具，基于GPT-4o-mini模型，无需提前训练实现零样本识别。Zerox支持PDF、DOCX、图片等多种格式文件，擅长处理扫描版文档及复杂...

AI Projects12/18/2025

Video Alchemist - AI视频生成模型，具备多主体开放集合个性化能力

Video Alchemist是Snap公司等推出的新型视频生成模型，具备多主体、开放集合个性化能力，能根据文本提示和参考图像生成视频，无需在测试时进行优化。模型基于...

AI Projects12/18/2025

PSHuman - 开源的单图像3D人像重建技术，仅需一张照片

PSHuman是先进的单图像3D人像重建技术。基于跨尺度多视图扩散模型，仅需一张照片，能生成高度逼真的3D人像模型，包括精细的面部表情和全身姿态。核心优势在于...

AI Projects12/18/2025

Wear-Any-Way - 阿里拍立淘团队推出自由定制的虚拟试穿框架

Wear-Any-Way是阿里巴巴拍立淘团队推出的创新的虚拟试穿框架。通过稀疏对应对齐机制，实现了高保真度且可定制的虚拟试穿效果。用户可以生成逼真的试穿图像，...

←1...72 73 74 75 76 77 78...137 →

All Categories

AI News

AutoMouser - AI Chrome扩展程序，实时交互跟踪自动生成测试代码

CogVideoX-Flash - 智谱推出的首个免费AI视频生成模型

Mini-InternVL - 上海AI Lab联合清华等机构推出的轻量级多模态大模型

Weebo - AI语音聊天机器人，实时响应用户语音指令和问题

ParGo - 字节与中山大学联合推出的多模态大模型连接器

MatterGen - 微软推出的无机材料生成模型

XMusic - 腾讯多媒体实验室自主研发的AI通用作曲框架

Seaweed APT - 字节跳动推出的单步图像和视频生成项目

OmAgent - Om AI联合浙大开源的多模态语言代理框架

T2A-01-HD - 海螺AI海外版推出新的语音模型

Uni-AdaFocus - 清华大学推出通用的高效视频理解框架

AnyStory - 阿里通义推出的高保真个性化文本到图像生成框架

SHMT - 阿里达摩院联合武汉理工等机构推出的自监督化妆转移技术

SmartEraser - 中科大与微软亚洲研究院推出的图像对象移除技术

Zerox - 开源的OCR工具，零样本识别多种格式文件

Video Alchemist - AI视频生成模型，具备多主体开放集合个性化能力

PSHuman - 开源的单图像3D人像重建技术，仅需一张照片

Wear-Any-Way - 阿里拍立淘团队推出自由定制的虚拟试穿框架

Pipecat - 构建语音和多模态对话代理的开源框架

RealtimeSTT - AI实时语音转文本库，自动检测说话的开始与结束

Step R-mini - 阶跃星辰推出的 Step 系列首个推理模型

GLM-Realtime - 智谱推出的端到端多模态模型

CogView-3-Flash - 智谱推出的首个免费AI图像生成模型

MangaNinja - 基于参考图像的线稿着色技术