从音乐生成,语音克隆,跨模态生成三个方面,看AIGC在音频领域与人类协同工作的过程。AIGC并不是依托人类已有的音乐创作方法对音乐进行编程,而是在学习了现有音乐的和声,节奏和风格,有了一定了解后才开始创作。语音克隆涉及语音合成技术,语音合成又可以称为文本转语音,它指的是将一段文本依照用户的需求,转化为相应音频的技术。音频的跨模态生成现在有好几种玩法,如文本生成音频,图像生成音频,视频生成音频等。我们进入了“万物皆可生成”的世界,可能在今后,AIGC还可以利用音乐的节奏,生成个性化的舞蹈。
还没有评论,快来发表第一个评论!