这项由字节跳动智能创作团队牟冲、孙奇超、吴衍泽等研究人员完成的最新研究发表于2025年10月,论文编号为arXiv:2510.08485v1。有兴趣深入了解的读者可以通过该编号查询完整论文。这项研究首次实现了用一个统一模型同时处理图像和视频编辑任务,并且能够真正理解人类的自然语言编辑指令。