project
10Kh RealOmni-Open - Gen Robot.AI开源的具身智能数据集
10Kh RealOmni-Open是Gen Robot.AI团队开源的具身智能数据集,是目前行业内规模最大的开源数据集之一。包含超过10000小时的数据、100万+任务剪辑,存储总量达...
10Kh RealOmni-Open是什么
10Kh RealOmni-Open是Gen Robot.AI团队开源的具身智能数据集,是目前行业内规模最大的开源数据集之一。包含超过10000小时的数据、100万+任务剪辑,存储总量达95TB。数据集聚焦于10个常见家庭任务,每项技能有超过1万段剪辑,确保了技能深度。数据采集自3000个真实家庭,画面清晰度高(1600×1296像素,30fps),轨迹精度达到亚厘米级别,且包含夹抓的开合角度和位移信息。
10Kh RealOmni-Open的主要功能
-
大规模数据覆盖:包含超过10000小时的数据和100万+任务剪辑,存储总量达95TB,是行业内规模领先的开源具身智能数据集。
-
聚焦核心技能:数据集专注于10个常见家庭任务,每项技能拥有超过1万段剪辑,确保了技能的深度覆盖。
-
高质量数据采集:画面清晰度高(1600×1296像素,30fps),轨迹精度达到亚厘米级别,同时包含夹抓的开合角度和位移信息。
-
真实场景泛化:数据采集自3000个真实家庭,99.2%为双手长程任务,平均剪辑长度为1分37秒,记录了完整的动作过程,适合多种真实场景的应用。
-
高效数据存储:采用MCAP格式存储,第一阶段数据总时长950小时,包含39761个任务剪辑,方便开发者按需调用。
-
易用性支持:提供网页工具和开源工具包,支持中英文双语,遵循CC-BY-SA-4.0协议,允许商用,同时提供详细使用指导。
-
持续更新与反馈:数据集仍在不断更新中,实现“数字化人类所有技能”,欢迎用户反馈和建议。
10Kh RealOmni-Open的数据特点
-
规模庞大:包含超10000小时数据、100万+任务剪辑,存储总量达95TB,是目前行业内规模最大的开源具身智能数据集之一。
-
技能深度:聚焦于10个常见家庭任务,每项技能有超过1万段剪辑,确保了技能的深度和丰富性。
-
高质量画面:画面清晰度高,分辨率达1600×1296,帧率为30fps,能够全方位录制环境和操作细节。
-
高精度轨迹:轨迹精度达到亚厘米级别,通过高精度IMU硬件和云端重建技术实现,适合机器人学习。
-
多模态数据:包含视觉、听觉等多种模态数据,同时记录夹抓的开合角度和位移信息。
-
真实场景采集:数据来自3000个真实家庭,场景和目标泛化能力强,操作自然,避免了单一场景和重复动作的问题。
-
长程任务记录:99.2%为双手长程任务,平均剪辑长度为1分37秒,记录了完整的动作过程,适合动作逻辑与因果的学习。
-
高效存储格式:采用MCAP格式存储,第一阶段数据总时长950小时,包含39761个任务剪辑,便于开发者按需调用。
-
易用性支持:提供网页工具和开源工具包,支持中英文双语,遵循CC-BY-SA-4.0协议,允许商用,且提供详细使用指导。
10Kh RealOmni-Open的项目地址
- Hugging Face模型库:https://huggingface.co/datasets/genrobot2025/10Kh-RealOmin-OpenData
10Kh RealOmni-Open的应用场景
-
家庭服务机器人训练:为家庭服务机器人提供丰富的任务数据,帮助机器人学习和优化日常家务技能,如整理物品、清洁桌面等。
-
强化学习研究:为强化学习算法提供大规模的真实环境数据,支持算法在复杂任务中的训练和优化,提升机器人的决策能力。
-
机器人视觉与动作协同研究:通过多模态数据,支持机器人视觉与动作协同的研究,帮助机器人更好地理解和执行任务。
-
技能迁移与泛化研究:基于多样化的家庭场景和任务,支持机器人技能的迁移和泛化研究,能适应不同的环境和任务需求。
-
人机交互优化:通过记录真实的人机交互数据,帮助优化机器人与人类的协作方式,提升交互的自然性和效率。
-
具身智能模型开发:为开发具身智能模型提供高质量的数据支持,助力模型在真实场景中的应用和落地。