在数字人领域的热潮中,我最近全身心投入,对多个开源的数字人项目进行了深入测试。今天,我怀揣着满满的干货和心得,迫不及待地想与大家分享这段充满挑战与惊喜的经历。
tts训练,文生成声音训练与推理
首先来说说声音的处理。经过一番摸索,我发现 So-VITS-SVC 堪称声音处理的神器。我仅仅在喜马拉雅上下载了一段 30 分钟的声音,通过它进行训练,最终呈现的效果令人惊艳。大家不妨听听看,相信您也会为其出色的表现所折服。
数字人的训练与推理
在数字人的呈现探索之旅中,我对 MuseTalk、EchoMimic、SyncTalk、wav2lip 等项目进行了全面且深入的测试。
首先是 MuseTalk 项目。我按照其官方文档的指引,准备好所需的数据集,包括大量的人物图像和相应的语音数据。然后,根据教程设置好训练参数,启动训练过程。然而,在训练完成后的推理阶段,发现生成的数字人动作略显生硬,表情不够自然,与真实人类的表现存在一定差距。
接下来 SyncTalk 项目。
对于这个项目,我同样认真地完成了数据准备和训练设置工作。
我先录制了一个我的视频素材:
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
电商播未来已关注
分享视频
,时长00:15
0/0
00:00/00:15
切换到横屏模式
继续播放
进度条,百分之0
00:00
/
00:15
00:15
全屏
倍速播放中
您的浏览器不支持 video 标签
继续观看
探索数字人世界:我的开源项目测试之旅与经验分享
观看更多
原创
,
探索数字人世界:我的开源项目测试之旅与经验分享
电商播未来已关注
分享点赞在看
已同步到看一看写下你的评论
训练完数字人后,推理的视频:
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
电商播未来已关注
分享视频
,时长00:59
0/0
00:00/00:59
切换到横屏模式
继续播放
进度条,百分之0
00:00
/
00:59
00:59
全屏
倍速播放中
您的浏览器不支持 video 标签
继续观看
探索数字人世界:我的开源项目测试之旅与经验分享
观看更多
原创
,
探索数字人世界:我的开源项目测试之旅与经验分享
电商播未来已关注
分享点赞在看
已同步到看一看写下你的评论
换背景的视频展示:
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
电商播未来已关注
分享视频
,时长01:01
0/0
00:00/01:01
切换到横屏模式
继续播放
进度条,百分之0
00:00
/
01:01
01:01
全屏
倍速播放中
您的浏览器不支持 video 标签
继续观看
探索数字人世界:我的开源项目测试之旅与经验分享
观看更多
原创
,
探索数字人世界:我的开源项目测试之旅与经验分享
电商播未来已关注
分享点赞在看
已同步到看一看写下你的评论
接下来是 EchoMimic 项目。同样地,我仔细收集和整理了符合要求的数据,严格遵循其规定的步骤进行训练配置。但在最终的效果呈现中,虽然数字人的语音模仿有一定的相似度,但在口型与语音的同步性方面还不够精准。
EchoMimic 项目处理后的视频
已关注
关注
重播 分享 赞
关闭
观看更多
更多
退出全屏
切换到竖屏全屏退出全屏
电商播未来已关注
分享视频
,时长00:50
0/0
00:00/00:50
切换到横屏模式
继续播放
进度条,百分之0
00:00
/
00:50
00:50
全屏
倍速播放中
您的浏览器不支持 video 标签
继续观看
探索数字人世界:我的开源项目测试之旅与经验分享
观看更多
原创
,
探索数字人世界:我的开源项目测试之旅与经验分享
电商播未来已关注
分享点赞在看
已同步到看一看写下你的评论
最后是 wav2lip 项目。我严格按照操作流程进行数据预处理和训练,但得到的数字人在唇部动作的细腻程度上还有提升的空间,与原声的匹配度也有待加强。
尽管这些项目的整体效果离我的理想状态有一定距离,但我为大家准备了详细的效果展示。通过这些展示,您可以直观地看到每个项目在不同方面的特点,比如 MuseTalk 在某些姿态上的表现、EchoMimic 语音模仿的优势与不足、SyncTalk 整体稳定性的情况以及 wav2lip 唇部动作的具体细节等。同时,也能清晰地了解到它们各自存在的不足之处,从而为您在选择和应用相关技术时提供参考。希望通过我的这些实践和展示,能让您在数字人领域的探索道路上少走弯路,更快地迈向理想的数字人效果。
数字人社群
通过这一系列的训练实践,我也总结出了不少宝贵的经验。如果您也怀揣着打造属于自己数字人的梦想,那么加入我的会员圈子绝对是您的明智之选。
我郑重声明,创建这个圈子绝非为了割韭菜。只需 9.9 元,您就能加入我们这个充满热情与探索精神的群体。
在这个链接:https://51qpm.cn/szr/
付款进群!
在群里,我将毫无保留地分享这些数字人项目的整合包资料,包括各种实用的工具和资源。同时,我还会详细讲述训练过程中的点点滴滴,那些让我踩过坑、也让我取得突破的关键心得。
不仅如此,我还会为您传授如何以更加经济高效的方式打造属于自己的数字人。无论是在硬件设备的选择上,还是在软件工具的运用中,我都将为您提供最具性价比的方案和建议,让您能够用最小的投入实现最大的梦想。
别再犹豫了,快来加入我们,一起在数字人的奇妙世界中探索前行,创造属于我们的精彩!