AIニュース

すべてニュースチュートリアル Wiki AIプロジェクト AIアプリ

AIプロジェクト2025/12/18

TIGER - 清华大学推出的轻量级语音分离模型

TIGER（Time-frequency Interleaved Gain Extraction and Reconstruction Network）是清华大学研究团队提出的轻量级语音分离模型，通过时频交叉建模策略，结...

AIプロジェクト2025/12/18

NPOA - 开源舆情检测工具，实时监控网络舆情与分析

NPOA 是开源的功能强大的舆情监测工具，可以帮助用户实时监控网络舆情，了解公众对特定话题或品牌的看法。系统基于先进的自然语言处理技术，可以分析大量的网...

AIプロジェクト2025/12/18

Long-VITA - 腾讯优图联合南大、厦大开源的多模态模型

Long-VITA 是腾讯优图实验室、南京大学、厦门大学开源的多模态模型，能处理超过100万tokens的长文本输入，在短文本任务中表现出色。Long-VITA基于分阶段训练...

AIプロジェクト2025/12/18

WiseDiag - 杭州智诊科技推出全球领先的医疗大模型

WiseDiag 是杭州智诊科技推出的全球领先的医疗大模型，专注于基于人工智能技术提升医疗服务的效率和质量。模型具有 730 亿参数和 32k 的上下文长度，基于超过...

AIプロジェクト2025/12/18

CustomVideoX - 中科大联合浙大等推出的个性化视频生成框架

CustomVideoX 是中科大和浙大等联合提出的创新的个性化视频生成框架，通过参考图像和文本描述生成高质量的定制化视频。框架基于视频扩散变换器（Video Diffus...

AIプロジェクト2025/12/18

KTransformers - 清华开源的大语言模型推理优化框架

KTransformers是清华大学KVCache.AI团队联合趋境科技推出的开源项目，能优化大语言模型的推理性能，降低硬件门槛。KTransformers基于GPU/CPU异构计算策略，用...

AIプロジェクト2025/12/18

DragAnything - 快手联合浙大等机构开源的可控视频生成方法

DragAnything 是快手联合浙江大学和新加坡国立大学 Show Lab推出的，基于实体表示的可控视频生成方法，基于简单的轨迹输入实现对视频中任意物体的精确运动控...

AIプロジェクト2025/12/18

GENERator - 阿里 AI for Science 团队等推出的生成式 DNA 大模型

GENERator是阿里云飞天实验室 AI for Science 团队推出的生成式基因组基础模型，专注于 DNA 序列的设计和生成。模型基于 Transformer 解码器架构，具有 98k ...

AIプロジェクト2025/12/18

FoloUp - 开源AI语音面试平台，自动生成定制化面试问题

FoloUp 是开源的AI语音面试平台，能帮助企业高效地进行招聘面试。FoloUp能根据职位描述自动生成定制化的面试问题，基于AI技术与候选人进行自然、对话式的语音...

AIプロジェクト2025/12/18

ConsistentDreamer - 华为推出的单张图像生成 3D 资产技术

ConsistentDreamer 是华为慕尼黑研究中心提出的新型图像到 3D 资产生成技术，通过单张图像生成视图一致的 3D 网格。方法通过多视图先验图像引导的高斯优化，...

AIプロジェクト2025/12/18

Cline - AI编程助手，集成于 VSCode 实时检查语法错误

Cline 是集成于 VSCode 的 AI 编程助手，通过智能化手段提升开发效率。具备强大的代码生成与编辑能力，能根据用户需求快速创建或修改代码文件，实时检查语法...

AIプロジェクト2025/12/18

腾讯混元T1 - 腾讯混元推出的最新深度思考模型

T1（Thinker）是腾讯混元推出的最新深度思考模型，已正式上线接入腾讯元宝。模型专注于逻辑推理和深度思考，支持联网搜索功能，能从互联网信源、微信公众号、...

AIプロジェクト2025/12/18

ImageRAG - 基于检索增强生成的图像生成技术

ImageRAG 是基于检索增强生成（Retrieval-Augmented Generation, RAG）的图像生成技术，通过动态检索相关图像来提升文本到图像（T2I）模型生成罕见或未见概念...

AIプロジェクト2025/12/18

X-R1 - 基于强化学习的低成本训练框架

X-R1是基于强化学习的低成本训练框架，能加速大规模语言模型的后训练（Scaling Post-Training）开发。X-R1用极低的成本训练0.5B（5亿参数）规模的R1-Zero模型...

AIプロジェクト2025/12/18

Step-Video-T2V - 阶跃星辰开源的文本到视频模型

Step-Video-T2V 是阶跃星辰团队推出的开源文本到视频预训练模型，拥有 300 亿参数，能生成长达 204 帧的高质量视频。模型基于深度压缩的变分自编码器（Video-...

AIプロジェクト2025/12/18

unsloth - 开源的大语言模型微调工具

unsloth 是开源的大语言模型（LLM）微调工具，基于优化计算步骤和 GPU 内核，显著提升模型训练速度减少内存使用。Unsloth支持多种主流 LLM，如 Llama-3、Mist...

AIプロジェクト2025/12/18

Matrix3D - 南大联合Apple、港科大推出的统一摄影测量模型

Matrix3D 是南京大学、苹果公司和香港科技大学合作推出的新型的统一摄影测量模型，能在一个模型中完成多个摄影测量子任务，包括姿态估计、深度预测和新视图合...

AIプロジェクト2025/12/18

Light-A-Video - 上海AI Lab联合交大等高校推出的视频重照明方法

Light-A-Video 是上海交通大学、中国科学技术大学、香港中文大学、香港科技大学、斯坦福大学及上海AI实验室的共同推出的无需训练的视频重照明方法，基于渐进...

AIプロジェクト2025/12/18

Finedefics - 北大团队推出的细粒度多模态大模型

Finedefics 是北京大学彭宇新教授团队推出的细粒度多模态大模型，提升多模态大语言模型（MLLMs）在细粒度视觉识别（FGVR）任务中的表现。模型通过引入对象的...

AIプロジェクト2025/12/18

Step-Audio - 阶跃星辰开源的语音交互模型

Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型，能根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达，能和用户自然地进行高...

AIプロジェクト2025/12/18

SkyReels-V1 - 昆仑万维开源首个面向AI短剧创作的视频生成模型

SkyReels-V1是昆仑万维开源的首个面向AI短剧创作的视频生成模型。基于在千万级高质量影视数据上进行微调，实现影视级的人物微表情和肢体动作生成，支持33种细...

AIプロジェクト2025/12/18

LangFlow - AI应用构建工具，拖拽组件创建复杂工作流

LangFlow 是低代码、可视化的 AI 应用构建工具，用于快速搭建和实验 LangChain 流水线。通过拖拽式界面，用户能轻松创建复杂的 AI 工作流，无需编写大量代码...

AIプロジェクト2025/12/18

SkyReels-A1 - 昆仑万维开源的表情动作可控算法

SkyReels-A1是昆仑万维开源的中国首个SOTA（State-of-the-Art）级别的基于视频基座模型的表情动作可控算法。SkyReels-A1能实现更精准可控的人物视频生成，能...

AIプロジェクト2025/12/18

Mistral Saba - Mistral AI 推出的首个专业区域语言模型

Mistral Saba 是法国 Mistral AI 推出的专注于中东和南亚地区语言及文化的区域定制 AI 模型。模型拥有 240 亿参数，规模虽小，在处理阿拉伯语和印度起源语言...

←1...80 81 82 83 84 85 86...137 →

AIニュース

AIプロジェクト2025/12/18

すべてのカテゴリ

AIニュース

TIGER - 清华大学推出的轻量级语音分离模型

NPOA - 开源舆情检测工具，实时监控网络舆情与分析

Long-VITA - 腾讯优图联合南大、厦大开源的多模态模型

WiseDiag - 杭州智诊科技推出全球领先的医疗大模型

CustomVideoX - 中科大联合浙大等推出的个性化视频生成框架

KTransformers - 清华开源的大语言模型推理优化框架

DragAnything - 快手联合浙大等机构开源的可控视频生成方法

GENERator - 阿里 AI for Science 团队等推出的生成式 DNA 大模型

FoloUp - 开源AI语音面试平台，自动生成定制化面试问题

ConsistentDreamer - 华为推出的单张图像生成 3D 资产技术

Cline - AI编程助手，集成于 VSCode 实时检查语法错误

腾讯混元T1 - 腾讯混元推出的最新深度思考模型

ImageRAG - 基于检索增强生成的图像生成技术

X-R1 - 基于强化学习的低成本训练框架

Step-Video-T2V - 阶跃星辰开源的文本到视频模型

unsloth - 开源的大语言模型微调工具

Matrix3D - 南大联合Apple、港科大推出的统一摄影测量模型

Light-A-Video - 上海AI Lab联合交大等高校推出的视频重照明方法

Finedefics - 北大团队推出的细粒度多模态大模型

Step-Audio - 阶跃星辰开源的语音交互模型

SkyReels-V1 - 昆仑万维开源首个面向AI短剧创作的视频生成模型

LangFlow - AI应用构建工具，拖拽组件创建复杂工作流

SkyReels-A1 - 昆仑万维开源的表情动作可控算法

Mistral Saba - Mistral AI 推出的首个专业区域语言模型

AIニュース

TIGER - 清华大学推出的轻量级语音分离模型

NPOA - 开源舆情检测工具，实时监控网络舆情与分析

Long-VITA - 腾讯优图联合南大、厦大开源的多模态模型

WiseDiag - 杭州智诊科技推出全球领先的医疗大模型

CustomVideoX - 中科大联合浙大等推出的个性化视频生成框架

KTransformers - 清华开源的大语言模型推理优化框架

DragAnything - 快手联合浙大等机构开源的可控视频生成方法

GENERator - 阿里 AI for Science 团队等推出的生成式 DNA 大模型

FoloUp - 开源AI语音面试平台，自动生成定制化面试问题

ConsistentDreamer - 华为推出的单张图像生成 3D 资产技术

Cline - AI编程助手，集成于 VSCode 实时检查语法错误

腾讯混元T1 - 腾讯混元推出的最新深度思考模型

ImageRAG - 基于检索增强生成的图像生成技术

X-R1 - 基于强化学习的低成本训练框架

Step-Video-T2V - 阶跃星辰开源的文本到视频模型

unsloth - 开源的大语言模型微调工具

Matrix3D - 南大联合Apple、港科大推出的统一摄影测量模型

Light-A-Video - 上海AI Lab联合交大等高校推出的视频重照明方法

Finedefics - 北大团队推出的细粒度多模态大模型

Step-Audio - 阶跃星辰开源的语音交互模型

SkyReels-V1 - 昆仑万维开源首个面向AI短剧创作的视频生成模型

LangFlow - AI应用构建工具，拖拽组件创建复杂工作流

SkyReels-A1 - 昆仑万维开源的表情动作可控算法

Mistral Saba - Mistral AI 推出的首个专业区域语言模型