a40e780f

GF 2022-10-30 19:03

只看GF | | 小中大

算了，回头发语音吧，好像没什么人对模型感兴趣

顶端

a40e780f

B1F 2022-10-30 19:03

只看该作者 | | 小中大

不要购买，已取消

顶端

a40e780f

B2F 2022-10-30 19:04

只看该作者 | | 小中大

不要购买楼上，已取消

顶端

a40e780f

B3F 2022-10-30 19:07

只看该作者 | | 小中大

顶端

konulo

B4F 2022-10-30 21:10

（希望各路大神可以看一看我的求物，长期有效）

只看该作者 | | 小中大

楼主加油，期待早见沙织姐姐的成品

顶端

黄白

B5F 2022-10-31 01:10

只看该作者 | | 小中大

我对从零构建自己的语音ai很感兴趣啊，不过苦于目前电脑配置太低，达不到训练的要求。而且我看了你发的那篇教程贴了，不过还是看得头大

楼主是学计算机的吗，那些github的源技术贴，配置教程都是复杂的全英文，你是怎么啃懂的

顶端

a40e780f

B6F 2022-10-31 10:33

只看该作者 | | 小中大

回 5楼(黄白) 的帖子

你用谷歌实验室好了，那个不用电脑配置，我发的教程贴都是整理过的呀
你从这个开始：
https://www.bilibili.com/read/cv17826415?spm_id_from=333.999.0.0

顶端

黄白

B7F 2022-10-31 19:02

只看该作者 | | 小中大

回 6楼(a40e780f) 的帖子

我看完这篇专栏了。大佬，你是学计算机出身的吗，能看懂那些代码配置教程，选的是在本机配置训练环境的方式？还是也选的在线上算力平台训练？
主要是我最近也无暇研究，刚好想等到明年年后装一台高配的电脑，专门来研究ai绘图和ai语音，想从零吃透这些项目的搭建和运行逻辑，而不是止于实用。所以不知道你有没有什么交流群，或者在更新进度的b站号，我去关注你。
我看了一圈b站，发现ai语音的实用方式主要有三种：
1.单纯的文本转语音，但有高级的调试情感色彩的参数；
2.输入别的音频，用模型复刻输出带情感的语音，可以拿ai来唱歌和整活；
3.原理应该和2类似，自己讲话用ai输出语音，也就是当变声器用，看到有人用猫雷的音色做视频，但不知道这种技术是不是强到能实时转换的（能直接拿来录视频或做直播），还是说可能是一句一句讲话录好、再调试的。

顶端

a40e780f

B8F 2022-10-31 19:59

只看该作者 | | 小中大

回 7楼(黄白) 的帖子

我不是学习计算机的，我也是比较早接触一点这个而已，我之前的教程说过了
我是使用colab在训练的，国内的算力平台九天还算可以
AI绘画方面我不熟悉，语音方面你可以关注B站的Rcell大佬，CjangCjengh，CjangCjengh大佬有群
你底下写的
1，你指的vits模型，然后使用moegoe驱动
2，sovits就是指的这个吧
3，目前还不能实时的进行变声，会慢半句左右，你可以看一下这个:https://github.com/IceKyrin/sovits_f0_infer

顶端

a40e780f

B9F 2022-10-31 20:02

只看该作者 | | 小中大

回 7楼(黄白) 的帖子

对了，我建议不要在本地运行，这个要求挺高的，别把电脑烧了，你用的还是新电脑

顶端

a40e780f

B10F 2022-10-31 20:21

只看该作者 | | 小中大

回 7楼(黄白) 的帖子

大佬有QQ吗，一直在这个废掉的贴子里说话也不好，私信一下吧

顶端

黄白

B11F 2022-10-31 21:20

只看该作者 | | 小中大

回 10楼(a40e780f) 的帖子

好几年没用qq了

我先装回来，一会私信您qq号

顶端

a40e780f

B12F 2022-10-31 21:22

| ▼展开

只看该作者 | | 小中大

漫区特设

蜜柑计划

综合交流

人民囧府

算了，回头发语音吧，好像没什么人对模型感兴趣

回 5楼(黄白) 的帖子

回 6楼(a40e780f) 的帖子

回 7楼(黄白) 的帖子

回 7楼(黄白) 的帖子

回 7楼(黄白) 的帖子

回 10楼(a40e780f) 的帖子

回 11楼(黄白) 的帖子