project
Krea 2 - Krea AI 推出首个从零训练的基础图像生成模型
Krea 2 是 Krea AI 推出的首个从零训练的基础图像生成模型,定位为'美学优先'的创意协作者。专注于视觉美学一致性、风格迁移和创意控制,而非单纯的提示词精...
Krea 2是什么
Krea 2 是 Krea AI 推出的首个从零训练的基础图像生成模型,定位为”美学优先”的创意协作者。专注于视觉美学一致性、风格迁移和创意控制,而非单纯的提示词精确翻译。模型开源两个版本:RAW(未蒸馏基础模型,可塑性极强,适合训练 LoRA)和 Turbo(8步蒸馏模型,约2秒出图,支持 1K~2K 分辨率)。Krea 2 支持风格迁移、Moodboards 情绪板和四档创意参数调节,在 Artificial Analysis 评测中位列独立实验室文生图模型第一。
Krea 2的主要功能
-
风格迁移(Style Transfer):上传一张或多张参考图,提取其视觉风格并应用到新图像中,支持调节每张参考图的影响强度,也可混合多种风格。
-
Moodboards(情绪板):上传一组共享创意方向的图片,Krea 2 能理解整体的色调、纹理、氛围和构图意图,即使简单提示词也能输出风格一致的结果。
-
创意参数(Creativity):四档控制——Raw(严格遵循提示词)、Low(接近提示词)、Medium(平衡默认)、High(模型自动添加美学深度、构图和视觉丰富度)。
-
文生图(Text-to-Image):支持从文本提示词生成高质量图像,RAW 模型支持最高 1K 分辨率,Turbo 模型支持 1K~2K 分辨率。
-
图生图 / 图像编辑:配合 Krea Edit 功能,支持区域级图像编辑、场景重打光、外扩(Outpainting),无需重新生成整张图片。
-
LoRA 训练与推理:在 RAW 基础模型上训练 LoRA,在 Turbo 蒸馏模型上运行推理,实现快速、个性化的风格定制。
-
Krea Nodes 工作流:通过自然语言描述图像处理流程,系统自动组装处理图,无需手动配置复杂参数。
微信关注回复 “开源”,加入AI开源项目交流群
如何使用Krea 2
-
网页端直接使用:访问 krea.ai,在界面中选择 Krea 2 模型,输入文本提示词,上传风格参考图或 Moodboards,调节 Creativity 参数(Raw/Low/Medium/High),点击生成即可。
-
本地部署(RAW 模型):克隆 GitHub 仓库
krea-ai/krea-2,运行uv sync安装依赖,下载 RAW 模型权重并设置OSS_RAW环境变量,执行uv run inference.py "提示词" --checkpoint oss_raw --steps 52 --cfg 3.5,支持最高 1K 分辨率。 -
本地部署(Turbo 模型):下载 Turbo 模型权重并设置
OSS_TURBO环境变量,执行uv run inference.py "提示词" --checkpoint oss_turbo --steps 8 --cfg 0.0 --mu 1.15 --width 2048 --height 2048,8步快速出图,支持 1K~2K 分辨率。 -
ComfyUI 中使用:将 Krea 2 模型导入 ComfyUI 工作流,加载 RAW 或 Turbo 模型节点,连接提示词和采样器节点进行推理。
-
API 调用:通过 Fal 等官方合作伙伴的 API 服务调用 Krea 2,集成到自己的应用或工作流中。
-
LoRA 训练与推理:使用 Hugging Face Diffusers、Ostris AI toolkit、Kohya(musubi tuner)或 Fal 在 RAW 模型上训练 LoRA,训练完成后在 Turbo 模型上加载 LoRA 进行快速推理。
-
风格迁移工作流:上传一张或多张风格参考图,设置每张图的影响强度,输入提示词,Krea 2 会自动将参考风格融合到新图像中。
-
Moodboards 创作:上传一组共享创意方向的图片作为情绪板,输入简单提示词,Krea 2 会基于整体视觉意图生成风格一致的输出。
Krea 2的官网地址
- GitHub仓库:https://github.com/krea-ai/krea-2
Krea 2的核心优势
-
美学质量行业领先:Krea 2 是”美学优先”设计的模型,在 Artificial Analysis 评测中位列独立实验室文生图模型第一,输出具有编辑级视觉品质。
-
开源双模型架构:同时提供 RAW(未蒸馏基础模型,可塑性极强)和 Turbo(8步蒸馏模型,约2秒出图),且两者权重完全开源。
-
RAW 训练 + Turbo 推理的最佳实践:在 RAW 上训练 LoRA 并在 Turbo 上运行推理,兼顾定制化与生成速度,这是其独特的工作流设计。
-
极强的风格迁移能力:支持上传多张参考图提取并融合视觉风格,还能通过 Moodboards 理解一组图片的集体创意意图,实现风格一致的批量输出。
-
去 AI 味:相比其他模型”技术上正确但视觉上平淡”的输出,Krea 2 更像有审美品味的创意协作者,生成结果更少”AI 感”。
-
创意参数灵活可控:四档 Creativity 调节(Raw/Low/Medium/High),从严格遵循提示词到让模型自主添加美学深度,适应不同创作需求。
-
高分辨率快速生成:Turbo 模型支持 1K~2K 分辨率输出,且仅需 8 步采样即可达到高质量。
-
多平台生态支持:官方支持 ComfyUI、Fal、SGLang 等主流推理平台,并提供完整的 API 和微调工具链。
-
区域级图像编辑:配合 Krea Edit 功能,支持定向修改、重打光、外扩等局部编辑,无需重新生成整张图片。
Krea 2的同类竞品对比
| 对比维度 | Krea 2 | GPT Image 2 | Gemini Imagen 3 |
|---|---|---|---|
| 定位 | 美学优先的创意协作者 | 指令遵循型精确生成器 | 通用型高质量图像模型 |
| 核心优势 | 视觉美学、风格迁移、创意控制 | 复杂提示词精确遵循、文本渲染 | 照片真实感、干净精致输出 |
| 提示词遵循 | 中等(偏艺术解读,会自主优化构图) | 极高(逐字翻译,多部分复杂指令最强) | 高(忠实于描述,自然语言理解好) |
| 美学质量 | 极高(有审美主见,编辑级温暖感) | 好(技术优秀但较冷淡、”正确但冷”) | 高(干净、精致、通用) |
| 风格迁移 | 极强(核心优势,支持 Moodboards 和多风格混合) | 好但不够一致,偏 polished 风格 | 好但较通用,缺乏鲜明个性 |
| 照片真实感 | 中等(偏风格化,非核心目标) | 极高 | 极高( arguably 三者中最强) |
| 文本渲染 | 弱(短词尚可,长文本不稳定) | 极强(标签、UI、包装文字最可靠) | 中等(短文本可用,长文本易出错) |
| 图像一致性 | 高(风格统一性强) | 极高(复杂场景结构最可靠) | 高(干净准确,偶有多轮差异) |
| 开源/可定制 | 完全开源(RAW + Turbo 权重 + 推理代码) | 闭源(仅 API/ChatGPT 访问) | 闭源(仅 Google 平台访问) |
| LoRA 微调 | 支持(RAW 训练,Turbo 推理) | 不支持 | 支持(Vertex AI 企业版) |
| 生成速度 | Turbo 约 2 秒/8步 | 8~15 秒/张 | 标准版较慢,Flash 版 5~10 秒 |
Krea 2的应用场景
-
创意工作室与概念设计:快速探索视觉方向、构建情绪板(Moodboards)、生成概念艺术和风格参考,帮助团队在项目早期统一审美方向。
-
营销与广告:生成风格一致的编辑级/商业级 campaign 素材,支持品牌视觉调性的批量输出,减少传统拍摄和后期成本。
-
时尚行业:制作 Lookbook、时尚编辑图像,精准控制面料质感、光影氛围和整体美学风格,实现从概念到成片的高效迭代。
-
建筑与空间设计:进行概念可视化、材质研究和空间构图快速探索,帮助设计师在方案阶段呈现多种风格倾向的效果图。
-
游戏开发:用于角色设计、场景概念、世界观构建和道具设计,通过风格迁移保持全项目视觉统一性。
-
电商与产品展示:批量生成一致风格的高质量产品图,支持不同场景、背景和风格的快速切换,提升商品视觉吸引力。