我把小说变成了有声故事,而且每个人物都有自己的声音

故事要从去年说起。

我写了一篇短篇小说,大概三万字,讲的是一个小镇上三个老朋友重逢的故事。

写完之后发在公众号上,阅读量还行,但总觉得少了点什么。

后来有一天晚上躺在床上,戴着耳机听有声书,突然就想——如果我的小说也能变成有声故事呢?

不是那种干巴巴的机器朗读,而是真的有不同的人在说话,有笑声,有叹息,有沉默。

第二天我就开始折腾了。

第一次尝试:找人配音

第一个想法很朴素——找人来录。

我在兼职平台上发了需求,三万字的小说,需要三个男声、两个女声。报价回来的时候我愣了一下:最便宜的也要两千多,贵的上万。而且周期至少两周,还得来回沟通语气、重录。

不是出不起这个钱,但作为一个独立创作者,每篇内容都这么搞,成本根本扛不住。

这条路走不通。

第二次尝试:普通 TTS 工具

那就用 AI 语音合成呗,现在不是到处都是吗?

我找了几款常见的 TTS 工具,把小说文本往里一丢,点生成。出来的效果……怎么说呢,能听,但一听就是机器在读。

最致命的问题是:从头到尾都是同一个声音

我的小说里,老张是个粗嗓门的退休工人,小李是个说话轻声细语的年轻姑娘,老陈是个慢条斯理的中学老师。结果用 TTS 一生成,三个人说话听起来像同一个人在自言自语。

而且所有对白的语气都一模一样——老张骂人和平静聊天听起来没区别,小李哭和笑听起来也没区别。

我又试了几个工具,有的支持切换音色,但得手动一段一段地选声音、调参数。三万字的小说,几百段对话,手动改到天亮也改不完。

这条路也走不通。

第三次尝试:青萍AI 语音

后来在一个做配音的朋友推荐下,接触到了青萍AI 语音。一开始没抱太大期望,结果用下来发现它正好能解决我做有声故事的所有痛点。

克隆音色:给每个角色一张”声音身份证”

青萍AI 语音有个功能叫一键音色克隆。只需要上传一段十几秒的音频样本,就能克隆出一个专属音色。

我给小说里的三个主要角色各克隆了一个声音:

  • 老张:找了一段老一辈人说话的录音,声音浑厚,略带沙哑,克隆出来的声音一听就是那种干了大半辈子体力活的老爷子
  • 小李:用了一段年轻女性说话的录音,声音清亮,语速偏快,克隆出来就是那种活泼小姑娘的感觉
  • 老陈:找了一段中年男性讲课时的话,声音沉稳,不急不躁,活脱脱一个老教师

前后不到十分钟,三个角色的声音就准备好了。不用录几小时样本,不用专业录音棚,一段十几秒的音频就够了。

多人对话:一个人也能做出广播剧的效果

这是最让我惊喜的功能。

以前用别的 TTS 工具,多人对话是最头疼的事——得手动给每句话指定不同的音色,工作量巨大。

青萍AI 语音的多人对话模式可以直接在文本里标注说话人,系统自动用对应的音色来读。

我只需要把小说的对话部分标注成这样:

1
2
3
老张:哟,这不是小陈吗?多少年没见了!
老陈:老张?你这家伙还活着呢?
小李:哈哈,你们两个一见面就斗嘴,十年了一点没变。

系统就会自动用老张的粗嗓门、老陈的沉稳声线、小李的清亮声音来合成。

整篇小说几百段对话,标注完也就一两个小时的事,比手动一段段调音色快了不知道多少倍。

情感控制:让角色真的”活”起来

光有不同声音还不够,如果每句话都是同一个语气,听起来还是死板。

青萍AI 语音支持情感参数控制,可以给每段话设定不同的情绪:开心、悲伤、愤怒、恐惧、惊讶、严肃……都能调。

小说里有一段老张回忆往事的戏,我就给他加了悲伤的情感:

1
[老张|悲伤] 那年走的时候,连句话都没来得及说……

还有一段小李终于找到失联多年朋友的场景:

1
[小李|兴奋] 我找到你了!我居然真的找到你了!

同样的音色,加上不同的情感参数,听起来完全不一样。老张那句话,我第一次听的时候鼻子都有点酸——那种苍老的声音带着哽咽,是普通 TTS 绝对做不出来的效果。

其他细节

除了核心的三个功能,还有一些细节让我觉得这个工具确实是为做内容的人设计的:

  • 语速和音调微调:老张说话慢,语速调到 0.85;小李说话快,调到 1.2。老陈音调偏低,降两个半音
  • 停顿控制:对话之间的沉默很重要,有时候一句话说完停两秒比不停顿效果好十倍。青萍支持精确到毫秒的停顿控制
  • BGM 和音效:可以直接在配音里加背景音乐和音效,不用再后期用剪辑软件单独加。我给重逢的场景加了一段舒缓的钢琴曲,效果直接拉满
  • 字幕自动生成:配音完成后自动带时间轴字幕,如果要把有声故事做成视频版,直接导入就行

最终效果

三万字的小说,从准备音色到标注对话到生成整篇有声故事,前后花了不到一天。

如果用真人配音,至少两周,花费几千。如果用普通 TTS,要么所有角色同一个声音,要么手动改到崩溃。

而用青萍AI 语音,三个角色三个声音,每句话都有对应的情感,对话之间的节奏和停顿也调好了,配了 BGM,还自动出了字幕。

做完之后我把有声版发到了几个平台上,评论区有人说”这不像机器读的”,还有人说”那个老张的声音太有画面感了”。

说实话,听到这种反馈,比写小说本身还开心。

写在最后

如果你也有把文字变成有声故事的想法——不管是一篇小说、一篇剧本、还是一段访谈记录——我踩过的坑你可以不用再踩了。

青萍AI 语音是我目前用下来最适合做有声内容的工具,原因很简单:

  • 一键克隆音色:十几秒音频就能给每个角色定制专属声音
  • 多人对话模式:标注说话人自动切换音色,不用手动一段段调
  • 丰富的情感控制:开心、悲伤、愤怒、兴奋……让角色真的”活”起来
  • 语速、音调、停顿精调:每个细节都能控制,出来的效果像真人录音
  • BGM + 音效内置:配音同时加音乐和音效,不用后期再处理
  • 字幕自动生成:配音完成自动出字幕,做视频版无缝衔接

不需要录音棚,不需要找配音演员,不需要学音频剪辑。打开浏览器,上传文本,选好音色和情感,点生成,有声故事就出来了。

对于做有声小说、播客、短视频配音的人来说,这可能是目前最省事也最专业的方案了。

官网地址:https://audio.lusyoe.com