From Audio to Photoreal Embodiment: Synthesizing Humans in Conversations
From Audio to Photoreal Embodiment:Synthesizing Humans in Conversations
从二元对话的音频中,我们生成相应的逼真的面部、身体和手势。
概括性:角色是由作者的声音驱动的(而不是模型所训练的演员)。
环境安装:需要pytorch3D
【配环境】pytorch3d版本不匹配导致ImportError: libtorch_cuda_cu.so: cannot open shared object file-CSDN博客
效果展示如下