Krea 2 - Krea AI 推出首个从零训练的基础图像生成模型 - AiBoss

Krea 2是什么

Krea 2 是 Krea AI 推出的首个从零训练的基础图像生成模型，定位为”美学优先”的创意协作者。专注于视觉美学一致性、风格迁移和创意控制，而非单纯的提示词精确翻译。模型开源两个版本：RAW（未蒸馏基础模型，可塑性极强，适合训练 LoRA）和 Turbo（8步蒸馏模型，约2秒出图，支持 1K~2K 分辨率）。Krea 2 支持风格迁移、Moodboards 情绪板和四档创意参数调节，在 Artificial Analysis 评测中位列独立实验室文生图模型第一。

Krea 2的主要功能

风格迁移（Style Transfer）：上传一张或多张参考图，提取其视觉风格并应用到新图像中，支持调节每张参考图的影响强度，也可混合多种风格。
Moodboards（情绪板）：上传一组共享创意方向的图片，Krea 2 能理解整体的色调、纹理、氛围和构图意图，即使简单提示词也能输出风格一致的结果。
创意参数（Creativity）：四档控制——Raw（严格遵循提示词）、Low（接近提示词）、Medium（平衡默认）、High（模型自动添加美学深度、构图和视觉丰富度）。
文生图（Text-to-Image）：支持从文本提示词生成高质量图像，RAW 模型支持最高 1K 分辨率，Turbo 模型支持 1K~2K 分辨率。
图生图 / 图像编辑：配合 Krea Edit 功能，支持区域级图像编辑、场景重打光、外扩（Outpainting），无需重新生成整张图片。
LoRA 训练与推理：在 RAW 基础模型上训练 LoRA，在 Turbo 蒸馏模型上运行推理，实现快速、个性化的风格定制。
Krea Nodes 工作流：通过自然语言描述图像处理流程，系统自动组装处理图，无需手动配置复杂参数。

微信关注回复 “开源”，加入AI开源项目交流群

如何使用Krea 2

网页端直接使用：访问 krea.ai，在界面中选择 Krea 2 模型，输入文本提示词，上传风格参考图或 Moodboards，调节 Creativity 参数（Raw/Low/Medium/High），点击生成即可。
本地部署（RAW 模型）：克隆 GitHub 仓库 krea-ai/krea-2，运行 uv sync 安装依赖，下载 RAW 模型权重并设置 OSS_RAW 环境变量，执行 uv run inference.py "提示词" --checkpoint oss_raw --steps 52 --cfg 3.5，支持最高 1K 分辨率。
本地部署（Turbo 模型）：下载 Turbo 模型权重并设置 OSS_TURBO 环境变量，执行 uv run inference.py "提示词" --checkpoint oss_turbo --steps 8 --cfg 0.0 --mu 1.15 --width 2048 --height 2048，8步快速出图，支持 1K~2K 分辨率。
ComfyUI 中使用：将 Krea 2 模型导入 ComfyUI 工作流，加载 RAW 或 Turbo 模型节点，连接提示词和采样器节点进行推理。
API 调用：通过 Fal 等官方合作伙伴的 API 服务调用 Krea 2，集成到自己的应用或工作流中。
LoRA 训练与推理：使用 Hugging Face Diffusers、Ostris AI toolkit、Kohya（musubi tuner）或 Fal 在 RAW 模型上训练 LoRA，训练完成后在 Turbo 模型上加载 LoRA 进行快速推理。
风格迁移工作流：上传一张或多张风格参考图，设置每张图的影响强度，输入提示词，Krea 2 会自动将参考风格融合到新图像中。
Moodboards 创作：上传一组共享创意方向的图片作为情绪板，输入简单提示词，Krea 2 会基于整体视觉意图生成风格一致的输出。

Krea 2的官网地址

GitHub仓库：https://github.com/krea-ai/krea-2

Krea 2的核心优势

美学质量行业领先：Krea 2 是”美学优先”设计的模型，在 Artificial Analysis 评测中位列独立实验室文生图模型第一，输出具有编辑级视觉品质。
开源双模型架构：同时提供 RAW（未蒸馏基础模型，可塑性极强）和 Turbo（8步蒸馏模型，约2秒出图），且两者权重完全开源。
RAW 训练 + Turbo 推理的最佳实践：在 RAW 上训练 LoRA 并在 Turbo 上运行推理，兼顾定制化与生成速度，这是其独特的工作流设计。
极强的风格迁移能力：支持上传多张参考图提取并融合视觉风格，还能通过 Moodboards 理解一组图片的集体创意意图，实现风格一致的批量输出。
去 AI 味：相比其他模型”技术上正确但视觉上平淡”的输出，Krea 2 更像有审美品味的创意协作者，生成结果更少”AI 感”。
创意参数灵活可控：四档 Creativity 调节（Raw/Low/Medium/High），从严格遵循提示词到让模型自主添加美学深度，适应不同创作需求。
高分辨率快速生成：Turbo 模型支持 1K~2K 分辨率输出，且仅需 8 步采样即可达到高质量。
多平台生态支持：官方支持 ComfyUI、Fal、SGLang 等主流推理平台，并提供完整的 API 和微调工具链。
区域级图像编辑：配合 Krea Edit 功能，支持定向修改、重打光、外扩等局部编辑，无需重新生成整张图片。

Krea 2的同类竞品对比

对比维度	Krea 2	GPT Image 2	Gemini Imagen 3
定位	美学优先的创意协作者	指令遵循型精确生成器	通用型高质量图像模型
核心优势	视觉美学、风格迁移、创意控制	复杂提示词精确遵循、文本渲染	照片真实感、干净精致输出
提示词遵循	中等（偏艺术解读，会自主优化构图）	极高（逐字翻译，多部分复杂指令最强）	高（忠实于描述，自然语言理解好）
美学质量	极高（有审美主见，编辑级温暖感）	好（技术优秀但较冷淡、”正确但冷”）	高（干净、精致、通用）
风格迁移	极强（核心优势，支持 Moodboards 和多风格混合）	好但不够一致，偏 polished 风格	好但较通用，缺乏鲜明个性
照片真实感	中等（偏风格化，非核心目标）	极高	极高（ arguably 三者中最强）
文本渲染	弱（短词尚可，长文本不稳定）	极强（标签、UI、包装文字最可靠）	中等（短文本可用，长文本易出错）
图像一致性	高（风格统一性强）	极高（复杂场景结构最可靠）	高（干净准确，偶有多轮差异）
开源/可定制	完全开源（RAW + Turbo 权重 + 推理代码）	闭源（仅 API/ChatGPT 访问）	闭源（仅 Google 平台访问）
LoRA 微调	支持（RAW 训练，Turbo 推理）	不支持	支持（Vertex AI 企业版）
生成速度	Turbo 约 2 秒/8步	8~15 秒/张	标准版较慢，Flash 版 5~10 秒

Krea 2的应用场景

创意工作室与概念设计：快速探索视觉方向、构建情绪板（Moodboards）、生成概念艺术和风格参考，帮助团队在项目早期统一审美方向。
营销与广告：生成风格一致的编辑级/商业级 campaign 素材，支持品牌视觉调性的批量输出，减少传统拍摄和后期成本。
时尚行业：制作 Lookbook、时尚编辑图像，精准控制面料质感、光影氛围和整体美学风格，实现从概念到成片的高效迭代。
建筑与空间设计：进行概念可视化、材质研究和空间构图快速探索，帮助设计师在方案阶段呈现多种风格倾向的效果图。
游戏开发：用于角色设计、场景概念、世界观构建和道具设计，通过风格迁移保持全项目视觉统一性。
电商与产品展示：批量生成一致风格的高质量产品图，支持不同场景、背景和风格的快速切换，提升商品视觉吸引力。

Krea 2是什么

Krea 2的主要功能

风格迁移（Style Transfer）：上传一张或多张参考图，提取其视觉风格并应用到新图像中，支持调节每张参考图的影响强度，也可混合多种风格。

Moodboards（情绪板）：上传一组共享创意方向的图片，Krea 2 能理解整体的色调、纹理、氛围和构图意图，即使简单提示词也能输出风格一致的结果。

创意参数（Creativity）：四档控制——Raw（严格遵循提示词）、Low（接近提示词）、Medium（平衡默认）、High（模型自动添加美学深度、构图和视觉丰富度）。

文生图（Text-to-Image）：支持从文本提示词生成高质量图像，RAW 模型支持最高 1K 分辨率，Turbo 模型支持 1K~2K 分辨率。

图生图 / 图像编辑：配合 Krea Edit 功能，支持区域级图像编辑、场景重打光、外扩（Outpainting），无需重新生成整张图片。

LoRA 训练与推理：在 RAW 基础模型上训练 LoRA，在 Turbo 蒸馏模型上运行推理，实现快速、个性化的风格定制。

Krea Nodes 工作流：通过自然语言描述图像处理流程，系统自动组装处理图，无需手动配置复杂参数。

微信关注回复 “开源”，加入AI开源项目交流群

如何使用Krea 2

网页端直接使用：访问 krea.ai，在界面中选择 Krea 2 模型，输入文本提示词，上传风格参考图或 Moodboards，调节 Creativity 参数（Raw/Low/Medium/High），点击生成即可。

本地部署（RAW 模型）：克隆 GitHub 仓库 krea-ai/krea-2，运行 uv sync 安装依赖，下载 RAW 模型权重并设置 OSS_RAW 环境变量，执行 uv run inference.py "提示词" --checkpoint oss_raw --steps 52 --cfg 3.5，支持最高 1K 分辨率。

本地部署（Turbo 模型）：下载 Turbo 模型权重并设置 OSS_TURBO 环境变量，执行 uv run inference.py "提示词" --checkpoint oss_turbo --steps 8 --cfg 0.0 --mu 1.15 --width 2048 --height 2048，8步快速出图，支持 1K~2K 分辨率。

ComfyUI 中使用：将 Krea 2 模型导入 ComfyUI 工作流，加载 RAW 或 Turbo 模型节点，连接提示词和采样器节点进行推理。

API 调用：通过 Fal 等官方合作伙伴的 API 服务调用 Krea 2，集成到自己的应用或工作流中。

LoRA 训练与推理：使用 Hugging Face Diffusers、Ostris AI toolkit、Kohya（musubi tuner）或 Fal 在 RAW 模型上训练 LoRA，训练完成后在 Turbo 模型上加载 LoRA 进行快速推理。

风格迁移工作流：上传一张或多张风格参考图，设置每张图的影响强度，输入提示词，Krea 2 会自动将参考风格融合到新图像中。

Moodboards 创作：上传一组共享创意方向的图片作为情绪板，输入简单提示词，Krea 2 会基于整体视觉意图生成风格一致的输出。

Krea 2的核心优势

美学质量行业领先：Krea 2 是”美学优先”设计的模型，在 Artificial Analysis 评测中位列独立实验室文生图模型第一，输出具有编辑级视觉品质。

开源双模型架构：同时提供 RAW（未蒸馏基础模型，可塑性极强）和 Turbo（8步蒸馏模型，约2秒出图），且两者权重完全开源。

RAW 训练 + Turbo 推理的最佳实践：在 RAW 上训练 LoRA 并在 Turbo 上运行推理，兼顾定制化与生成速度，这是其独特的工作流设计。

极强的风格迁移能力：支持上传多张参考图提取并融合视觉风格，还能通过 Moodboards 理解一组图片的集体创意意图，实现风格一致的批量输出。

去 AI 味：相比其他模型”技术上正确但视觉上平淡”的输出，Krea 2 更像有审美品味的创意协作者，生成结果更少”AI 感”。

创意参数灵活可控：四档 Creativity 调节（Raw/Low/Medium/High），从严格遵循提示词到让模型自主添加美学深度，适应不同创作需求。

高分辨率快速生成：Turbo 模型支持 1K~2K 分辨率输出，且仅需 8 步采样即可达到高质量。

多平台生态支持：官方支持 ComfyUI、Fal、SGLang 等主流推理平台，并提供完整的 API 和微调工具链。

区域级图像编辑：配合 Krea Edit 功能，支持定向修改、重打光、外扩等局部编辑，无需重新生成整张图片。

Krea 2的同类竞品对比

对比维度

Krea 2

GPT Image 2

Gemini Imagen 3

定位

美学优先的创意协作者

指令遵循型精确生成器

通用型高质量图像模型

核心优势

视觉美学、风格迁移、创意控制

复杂提示词精确遵循、文本渲染

照片真实感、干净精致输出

提示词遵循

中等（偏艺术解读，会自主优化构图）

极高（逐字翻译，多部分复杂指令最强）

高（忠实于描述，自然语言理解好）

美学质量

极高（有审美主见，编辑级温暖感）

好（技术优秀但较冷淡、”正确但冷”）

高（干净、精致、通用）

风格迁移

极强（核心优势，支持 Moodboards 和多风格混合）

好但不够一致，偏 polished 风格

好但较通用，缺乏鲜明个性

照片真实感

中等（偏风格化，非核心目标）

极高

极高（ arguably 三者中最强）

文本渲染

弱（短词尚可，长文本不稳定）

极强（标签、UI、包装文字最可靠）

中等（短文本可用，长文本易出错）

图像一致性

高（风格统一性强）

极高（复杂场景结构最可靠）

高（干净准确，偶有多轮差异）

开源/可定制

完全开源（RAW + Turbo 权重 + 推理代码）

闭源（仅 API/ChatGPT 访问）

闭源（仅 Google 平台访问）

LoRA 微调

支持（RAW 训练，Turbo 推理）

不支持

支持（Vertex AI 企业版）

生成速度

Turbo 约 2 秒/8步

8~15 秒/张

标准版较慢，Flash 版 5~10 秒

Krea 2的应用场景

创意工作室与概念设计：快速探索视觉方向、构建情绪板（Moodboards）、生成概念艺术和风格参考，帮助团队在项目早期统一审美方向。

营销与广告：生成风格一致的编辑级/商业级 campaign 素材，支持品牌视觉调性的批量输出，减少传统拍摄和后期成本。

时尚行业：制作 Lookbook、时尚编辑图像，精准控制面料质感、光影氛围和整体美学风格，实现从概念到成片的高效迭代。

建筑与空间设计：进行概念可视化、材质研究和空间构图快速探索，帮助设计师在方案阶段呈现多种风格倾向的效果图。

游戏开发：用于角色设计、场景概念、世界观构建和道具设计，通过风格迁移保持全项目视觉统一性。

电商与产品展示：批量生成一致风格的高质量产品图，支持不同场景、背景和风格的快速切换，提升商品视觉吸引力。

全部分类

Krea 2是什么

Krea 2的主要功能

如何使用Krea 2

Krea 2的官网地址

Krea 2的核心优势

Krea 2的同类竞品对比

Krea 2的应用场景

Krea 2是什么

Krea 2的主要功能

如何使用Krea 2

Krea 2的官网地址

Krea 2的核心优势

Krea 2的同类竞品对比

Krea 2的应用场景