HorizonRobotics
/

RoboTransfer

Diffusers

Safetensors

RoboTransferPipeline

Model card Files Files and versions Community

nemo04 commited on Jul 18

Commit

dd0c1a4

verified ·

1 Parent(s): 9f64c78

Update README.md

Browse files

Files changed (1) hide show

README.md +80 -15

README.md CHANGED Viewed

@@ -3,19 +3,84 @@ license: apache-2.0
 library_name: diffusers
 ---
-<div align="center" class="authors"> <a href="https://scholar.google.com/citations?user=XXXXXX" target="_blank">Author A</a>, <a href="https://scholar.google.com/citations?user=XXXXXX" target="_blank">Author B</a>, <a href="https://scholar.google.com/citations?user=XXXXXX" target="_blank">Author C</a>, <a href="https://scholar.google.com/citations?user=XXXXXX" target="_blank">Author D</a>, <a href="https://scholar.google.com/citations?user=XXXXXX" target="_blank">Author E</a> </div> <div align="center" style="line-height: 3;"> <a href="https://github.com/horizonrobotics/robot_lab" target="_blank" style="margin: 2px;"> <img alt="Code" src="https://img.shields.io/badge/Code-Github-blue" style="display: inline-block; vertical-align: middle;"/> </a> <a href="https://horizonrobotics.github.io/robot_lab/robotransfer" target="_blank" style="margin: 2px;"> <img alt="Project Page" src="https://img.shields.io/badge/🌐-Project_Page-blue" style="display: inline-block; vertical-align: middle;"/> </a> <a href="https://arxiv.org/abs/2505.23171" target="_blank" style="margin: 2px;"> <img alt="arXiv" src="https://img.shields.io/badge/📄-arXiv-b31b1b" style="display: inline-block; vertical-align: middle;"/> </a> <a href="https://youtu.be/dGXKtqDnm5Q" target="_blank" style="margin: 2px;"> <img alt="Video" src="https://img.shields.io/badge/🎥-Video-red" style="display: inline-block; vertical-align: middle;"/> </a> <a href="https://mp.weixin.qq.com/s/c9-1HPBMHIy4oEwyKnsT7Q" target="_blank" style="margin: 2px;"> <img alt="中文介绍" src="https://img.shields.io/badge/中文介绍-07C160?logo=wechat&logoColor=white" style="display: inline-block; vertical-align: middle;"/> </a> </div> <div align="center"> <img src="assets/pin/robotransfer.png" width="90%" alt="RoboTransfer Overview"/> <p style="font-size:0.8em; color:#555;">The RoboTransfer framework integrates multi-view geometry and video diffusion, enabling controllable and geometry-consistent robotic video synthesis for policy transfer.</p> </div>
-📖 中文介绍
-## Citation
-```
-@misc{liu2025robotransfergeometryconsistentvideodiffusion,
-      title={RoboTransfer: Geometry-Consistent Video Diffusion for Robotic Visual Policy Transfer},
-      author={Liu Liu and Xiaofeng Wang and Guosheng Zhao and Keyu Li and Wenkang Qin and Jiaxiong Qiu and Zheng Zhu and Guan Huang and Zhizhong Su},
-      year={2025},
-      eprint={2505.23171},
-      archivePrefix={arXiv},
-      primaryClass={cs.CV},
-      url={https://arxiv.org/abs/2505.23171},
 }
-```

 library_name: diffusers
 ---
+# RoboTransfer: Geometry-Consistent Video Diffusion for Robotic Visual Policy Transfer
+<div align="center" class="authors">
+  Liu Liu,
+  Xiaofeng Wang,
+  Guosheng Zhao,
+  Keyu Li,
+  Wenkang Qin,
+  Jiaxiong Qiu,
+  Zheng Zhu,
+  Guan Huang,
+  Zhizhong Su
+</div>
+<div align="center" style="line-height: 3;">
+  <a href="https://github.com/horizonrobotics/robot_lab" target="_blank" style="margin: 2px;">
+    <img alt="Code" src="https://img.shields.io/badge/Code-Github-blue" style="display: inline-block; vertical-align: middle;"/>
+  </a>
+  <a href="https://horizonrobotics.github.io/robot_lab/robotransfer" target="_blank" style="margin: 2px;">
+    <img alt="Project Page" src="https://img.shields.io/badge/🌐-Project_Page-blue" style="display: inline-block; vertical-align: middle;"/>
+  </a>
+  <a href="https://arxiv.org/abs/2505.23171" target="_blank" style="margin: 2px;">
+    <img alt="arXiv" src="https://img.shields.io/badge/📄-arXiv-b31b1b" style="display: inline-block; vertical-align: middle;"/>
+  </a>
+  <a href="https://youtu.be/dGXKtqDnm5Q" target="_blank" style="margin: 2px;">
+    <img alt="Video" src="https://img.shields.io/badge/🎥-Video-red" style="display: inline-block; vertical-align: middle;"/>
+  </a>
+  <a href="https://mp.weixin.qq.com/s/c9-1HPBMHIy4oEwyKnsT7Q" target="_blank" style="margin: 2px;">
+    <img alt="中文介绍" src="https://img.shields.io/badge/中文介绍-07C160?logo=wechat&logoColor=white" style="display: inline-block; vertical-align: middle;"/>
+  </a>
+</div>
+<div align="center">
+  <img src="assets/pin/robotransfer.png" width="90%" alt="RoboTransfer Overview"/>
+  <p style="font-size:0.8em; color:#555;">The RoboTransfer framework integrates multi-view geometry and video diffusion, enabling controllable and geometry-consistent robotic video synthesis for policy transfer.</p>
+</div>
+---
+## 🔍 Abstract
+**RoboTransfer** is a novel diffusion-based video generation framework tailored for robotic visual policy transfer. Unlike conventional approaches, RoboTransfer introduces **geometry-aware synthesis** by injecting **depth and normal priors**, ensuring multi-view consistency across dynamic robotic scenes. The method further supports **explicit control over scene components**, such as **background editing**, **object identity swapping**, and **motion specification**, offering a fine-grained video generation pipeline that benefits embodied learning.
+---
+## 🧠 Key Features
+- 📐 **Geometry-Consistent Diffusion**: Injects global 3D cues (depth, normal) and cross-view interactions for multi-view realism.
+- 🧩 **Scene Component Control**: Enables manipulation of object attributes (pose, identity) and background features.
+- 🔁 **Cross-View Conditioning**: Learns representations from multiple camera views with spatial correspondence.
+- 🤖 **Robotic Policy Transfer**: Facilitates domain adaptation by generating synthetic training data in target domains.
+---
+## 📦 Resources
+- **[🧠 Paper (arXiv)](https://arxiv.org/abs/2505.23171)**
+- **[🌐 Project Page](https://horizonrobotics.github.io/robot_lab/robotransfer)**
+- **[🎥 Video Demo](https://youtu.be/dGXKtqDnm5Q)**
+- **[💻 GitHub Code (Coming Soon)](https://github.com/horizonrobotics/robot_lab)**
+- **[📖 中文介绍](https://mp.weixin.qq.com/s/c9-1HPBMHIy4oEwyKnsT7Q)**
+---
+## 📸 Framework Overview
+![RoboTransfer Pipeline](assets/pin/robotransfer_pipeline.png)
+> The overall architecture includes view-specific encoding, geometry injection, diffusion denoising with spatial constraints, and component-level editing modules. Our system enables compositional control over scene dynamics while preserving physical and geometric consistency.
+---
+## 📖 BibTeX
+```bibtex
+@article{liu2025robotransfer,
+  title={RoboTransfer: Geometry-Consistent Video Diffusion for Robotic Visual Policy Transfer},
+  author={Liu, Liu and Wang, Xiaofeng and Zhao, Guosheng and Li, Keyu and Qin, Wenkang and Qiu, Jiaxiong and Zhu, Zheng and Huang, Guan and Su, Zhizhong},
+  journal={arXiv preprint arXiv:2505.23171},
+  year={2025}
 }