1186340.png

a40e780f

算了,回头发语音吧,好像没什么人对模型感兴趣


1186340.png

a40e780f

不要购买,已取消

1186340.png

a40e780f

不要购买楼上,已取消

1186340.png

a40e780f


none.gif

konulo

B4F  2022-10-30 21:10
(希望各路大神可以看一看我的求物,长期有效)
楼主加油,期待早见沙织姐姐的成品

575912.jpg

黄白

我对从零构建自己的语音ai很感兴趣啊,不过苦于目前电脑配置太低,达不到训练的要求。而且我看了你发的那篇教程贴了,不过还是看得头大 楼主是学计算机的吗,那些github的源技术贴,配置教程都是复杂的全英文,你是怎么啃懂的

1186340.png

a40e780f

回 5楼(黄白) 的帖子

你用谷歌实验室好了,那个不用电脑配置,我发的教程贴都是整理过的呀
你从这个开始:
https://www.bilibili.com/read/cv17826415?spm_id_from=333.999.0.0

575912.jpg

黄白

回 6楼(a40e780f) 的帖子

我看完这篇专栏了。大佬,你是学计算机出身的吗,能看懂那些代码配置教程,选的是在本机配置训练环境的方式?还是也选的在线上算力平台训练?
主要是我最近也无暇研究,刚好想等到明年年后装一台高配的电脑,专门来研究ai绘图和ai语音,想从零吃透这些项目的搭建和运行逻辑,而不是止于实用。所以不知道你有没有什么交流群,或者在更新进度的b站号,我去关注你。
我看了一圈b站,发现ai语音的实用方式主要有三种:
1.单纯的文本转语音,但有高级的调试情感色彩的参数;
2.输入别的音频,用模型复刻输出带情感的语音,可以拿ai来唱歌和整活;
3.原理应该和2类似,自己讲话用ai输出语音,也就是当变声器用,看到有人用猫雷的音色做视频,但不知道这种技术是不是强到能实时转换的(能直接拿来录视频或做直播),还是说可能是一句一句讲话录好、再调试的。

1186340.png

a40e780f

回 7楼(黄白) 的帖子

我不是学习计算机的,我也是比较早接触一点这个而已,我之前的教程说过了
我是使用colab在训练的,国内的算力平台九天还算可以
AI绘画方面我不熟悉,语音方面你可以关注B站的Rcell大佬,CjangCjengh,CjangCjengh大佬有群
你底下写的
1,你指的vits模型,然后使用moegoe驱动
2,sovits就是指的这个吧
3,目前还不能实时的进行变声,会慢半句左右,你可以看一下这个:https://github.com/IceKyrin/sovits_f0_infer

1186340.png

a40e780f

回 7楼(黄白) 的帖子

对了,我建议不要在本地运行,这个要求挺高的,别把电脑烧了,你用的还是新电脑

1186340.png

a40e780f

回 7楼(黄白) 的帖子

大佬有QQ吗,一直在这个废掉的贴子里说话也不好,私信一下吧

575912.jpg

黄白

回 10楼(a40e780f) 的帖子

好几年没用qq了 我先装回来,一会私信您qq号

a40e780f

回 11楼(黄白) 的帖子