我看完这篇专栏了。大佬,你是学计算机出身的吗,能看懂那些代码配置教程,选的是在本机配置训练环境的方式?还是也选的在线上算力平台训练?
主要是我最近也无暇研究,刚好想等到明年年后装一台高配的电脑,专门来研究ai绘图和ai语音,想从零吃透这些项目的搭建和运行逻辑,而不是止于实用。所以不知道你有没有什么交流群,或者在更新进度的b站号,我去关注你。
我看了一圈b站,发现ai语音的实用方式主要有三种:
1.单纯的文本转语音,但有高级的调试情感色彩的参数;
2.输入别的音频,用模型复刻输出带情感的语音,可以拿ai来唱歌和整活;
3.原理应该和2类似,自己讲话用ai输出语音,也就是当变声器用,看到有人用猫雷的音色做视频,但不知道这种技术是不是强到能实时转换的(能直接拿来录视频或做直播),还是说可能是一句一句讲话录好、再调试的。