阿里发布的一款声音驱动人物动画的模型:EchoMimicV2 - 技术宅银魂 - 科技改变生活 - 万事屋

阿里发布的一款声音驱动人物动画的模型:EchoMimicV2

choMimicV2 是蚂蚁金服的研究团队提出的一种半身人物动画技术,它能够通过一个参考图像、一段音频片段和一系列手部姿势来生成高质量的动画视频,确保音频内容与人物半身动作的一致性。

该方法通过音频 – 姿态动态协调策略,包括姿态采样和音频扩散,增强了半身动画的细节、面部和手势表情性,并减少了条件冗余。

体验地址:https://huggingface.co/spaces/fffiloni/echomimic-v2
开源地址:https://github.com/antgroup/echomimic_v2
项目主页:https://antgroup.github.io/ai/echomimic_v2

阿里发布的一款声音驱动人物动画的模型:EchoMimicV2

阿里发布的一款声音驱动人物动画的模型:EchoMimicV2

阿里发布的一款声音驱动人物动画的模型:EchoMimicV2

    没有回复内容

万事屋新帖