1186340.png

a40e780f

GF  2022-10-30 19:03

算了,回头发语音吧,好像没什么人对模型感兴趣


575912.jpg

黄白

B1F  2022-10-31 01:10
我对从零构建自己的语音ai很感兴趣啊,不过苦于目前电脑配置太低,达不到训练的要求。而且我看了你发的那篇教程贴了,不过还是看得头大 楼主是学计算机的吗,那些github的源技术贴,配置教程都是复杂的全英文,你是怎么啃懂的

575912.jpg

黄白

B2F  2022-10-31 19:02

回 6楼(a40e780f) 的帖子

我看完这篇专栏了。大佬,你是学计算机出身的吗,能看懂那些代码配置教程,选的是在本机配置训练环境的方式?还是也选的在线上算力平台训练?
主要是我最近也无暇研究,刚好想等到明年年后装一台高配的电脑,专门来研究ai绘图和ai语音,想从零吃透这些项目的搭建和运行逻辑,而不是止于实用。所以不知道你有没有什么交流群,或者在更新进度的b站号,我去关注你。
我看了一圈b站,发现ai语音的实用方式主要有三种:
1.单纯的文本转语音,但有高级的调试情感色彩的参数;
2.输入别的音频,用模型复刻输出带情感的语音,可以拿ai来唱歌和整活;
3.原理应该和2类似,自己讲话用ai输出语音,也就是当变声器用,看到有人用猫雷的音色做视频,但不知道这种技术是不是强到能实时转换的(能直接拿来录视频或做直播),还是说可能是一句一句讲话录好、再调试的。

575912.jpg

黄白

B3F  2022-10-31 21:20

回 10楼(a40e780f) 的帖子

好几年没用qq了 我先装回来,一会私信您qq号