邢龙和董潇逸为本篇文章共同第一作者。邢龙是中国科学技术大学博士生,师从林达华教授和吴枫教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。董潇逸是香港中文大学 MMLab ...