新闻动态
米哈游创始人蔡浩宇AI公司发表最新视频生成模型论文
发布日期:2026-04-28 13:40 点击次数:60
上证报中国证券网讯(记者罗茂林)4月10日,米哈游创始人蔡浩宇旗下AI公司Anuttacon在arXiv发布论文,公开其新一代视频生成模型LPM1.0(LargePerformanceModel)。
据论文介绍,LPM1.0是一个基于170亿参数扩散Transformer架构的视频模型,主打角色表演生成能力。与传统视频生成模型相比,该模型不仅关注画面生成,还尝试实现角色在视频中的连续表达,包括说话、倾听和实时反应,更注重于“表演”。
该模型可以根据输入图像生成具有稳定身份特征的视频角色,在对话过程中保持外观与行为一致,同时完成语音驱动、表情变化和动作反馈。
值得一提是,有媒体注意到,论文项目标注的ProjectLead包括曾爱玲(AilingZeng)。其个人主页显示目前就职于Anuttacon。据悉,曾爱玲此前在腾讯混元团队及AILab从事计算机视觉与生成模型相关研究工作。

