问题描述
我正在寻找一些易于安装文本到Ubuntu的语音软件,这听起来很自然。我已经安装了Festival
,Gespeaker
等,但没有听起来很自然。所有非常合成和难以理解。
有任何建议吗?
最佳解决办法
SVOX pico2wave
除了其他答案之外:
一个非常简约的TTS,比espeak或mbrola更好听(在我看来)。
一些信息:https://launchpad.net/ubuntu/precise/+source/svox/
我不明白为什么pico2wave与espeak或mbrola相比,很少讨论。它很小,但听起来很不错(自然)。没有修改,你会听到自然的女声。
AND …与Mbrola相比,它能够识别Units并以正确的方式说出它!例如:
-
2°C→两度
-
2米→两米
-
2公斤→两公斤
安装后我在脚本中使用它:
#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav
然后用所需的文本运行它:
<scriptname>.sh "hello world"
或者读取整个文件的内容:
<scriptname>.sh "$(cat <filename>)"
这就是在Ubuntu上有一个轻量级,稳定的工作TTS。
次佳解决办法
我相信我已经使用名为”SpeakIt”的Google Chrome扩展程序免费找到了最好的TTS软件。这只适用于Ubuntu上的Chrome浏览器。由于某些原因,它不适用于Chromium。 SpeakIt带有两个女声,与其他所有声音相比,这听起来非常逼真。至少有四个以上的男性和女性。如果您使用”TTS”作为查询搜索Chrome网上应用店,则女性声音会列出Chrome扩展程序。
在网站上使用。突出显示要阅读的文本,并右键单击并选择”SpeakIt”,或者单击停靠在Chrome顶部栏上的SpeakIt图标。
Firefox用户也有两个选择。在Firefox插件中,搜索TTS,您应该找到”Click Speak”以及“文本到语音”。声音不如Chrome SpeakIt声音好,但绝对可用。
SpeakIt扩展使用iSpeech技术,每年价格为20美元,该网站可以将文本转换为MP3音频文件。您可以输入文本,URL,RSS源以及TXT,DOC和PDF等文档并输出到MP3。您可以制作播客,嵌入音频等。这是一个链接…
http://www.ispeech.org/free.text.to.speech.tts.software
和他们的音频样本(不知道链接将持续多久)…
http://www.ispeech.org/view/681080/4429622
第三种解决办法
简单的Google–Ë~TTS
由于缺少更好的选择,我写了一个bash script与a perl script by Michal Fapso接口,通过Google Translate提供TTS。从项目说明:
The intention is to provide an easy to use interface to text-to-speech output via Google’s speech synthesis system. A fallback option using pico2wave automatically provides TTS synthesis in case no Internet connection is found.
As it stands, the wrapper supports reading from standard input, plain text files and the X selection (highlighted text).
主要特点是:
-
通过谷歌翻译在线TTS综合
-
通过pico2wave离线TTS合成
-
支持多种不同的语言
-
可以从CLI读取文本文件和突出显示的文本
-
支持以固定格式读取突出显示的文本(例如PDF文件)
安装和使用记录在project page上。
如果您尝试过,我会很高兴。 Bug reports and any other feedback欢迎!
第四种办法
对于高品质的Ubuntu来说,我已经看好文本到语音。空无一人。我的声带麻痹了,所以我需要TTS将语音指令添加到我的Ubuntu videos。您可以在这里获得商业高质量的Linux文本到语音软件:http://wizzardsoftware.com/att_desktop_overview.php它只是非常昂贵。我最终以40美元购买了Natural Reader for Windows(在Ubuntu下的Wine下无法使用)。也许以后我会拿到Linux的。
我希望有所帮助。
第五种办法
我一直在研究最好的发音和容易调整的文本语音。下面列出了我认为是音质方面排名前五的产品。与这些产品相关的大多数网站都有一个交互式演示,可以让您自己做出决定。
-
NeoSpeech
-
伊沃娜
-
Acapela
-
AT& T自然的声音
-
CereProc的声音
第六种办法
Pico和espeak很有趣,很容易上班,但他们并不是那么好。默认的节日声音也不是很好。然而,Festival是一个scheme-based演讲框架,许多研究人员已经建立了更好的plug-in声音。您可以轻松超越Ubuntu上的pico2wave质量,因为其中一种声音可作为ready-made软件包提供。
为了让节日听起来自然,以下是做什么:
sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts)
festival> (SayText "Don't hate me, I'm just doing my job!")
您可以通过使用-b
(或--batch
)并将每个命令放入单引号从命令行执行此操作:
festival -b '(voice_cmu_us_slt_arctic_hts)' \
'(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'
您可以从Nitech存储库中获得其他相当不错的声音,但安装它们很挑剔,而且默认路径已更改,因此可能需要手动编辑捆绑方案文件中的文件名引用才能在Ubuntu上使用。
第七种办法
将SVOX工具(pico)与LibreOffice结合使用:
SVOX(pico)工具易于安装,并在Ubuntu中提供高质量的声音。安装它:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
通过安装“Read Text” extension,您可以将LibreOffice与SVOX(pico)工具结合使用,并为此优秀的TTS软件获得”GUI”:
带工具的Set up Read Text Extension’s options – Add-ons – 读取选择….使用/usr /bin /python作为外部程序。选择一个包含标记(PICO_READ_TEXT_PY)的命令行选项,您可能想要尝试其中的一些选项。
现在,您只需在LO Writer,Calc,Impress或Draw中选择一些文本,然后在作为工具栏添加的图标(带有气球的快乐脸)上点击。
第八种办法
我发现Nitech HTS在节日上的声音非常自然,并且让我感受到我听到的任何其他声音。 See this link关于如何用节日设置Nitech和其他声音。我还没有找到一个很好的gui,我可以用它来配置这些声音,但是通过festival.scm设置它们仍然有效。该帖子非常陈旧,您可能需要使用”locate festival”命令查找实际的安装目录
第九种办法
以下是我为PDF和其他文本文件提供纯粹自然语音所做的事情(其他解决方案不自然,或者他们只是付费服务)。这实际上是一个围绕使用 chrome 或 chrome 的工作,但工作快速而简单。
-
在您的 chrome 或 chrome 上安装SpeakIt!扩展。
-
如果您使用的是 chrome (Chrome浏览器已免费提供pdf查看器),请安装PDF Viewer,并在 chrome 的扩展设置中选中“允许隐身”和“允许访问文件网址”选项。
-
拖放您的PDF到浏览器。
-
现在突出显示一些文本并右键单击并选择SpeakIt!所以你可以听纯天然的text-to-speech。
还有一些方法可以在chrome中打开其他文件,如.doc和.txt,并执行相同的操作。还有其他扩展程序可用于查看PDF文件,请检查它是否适合您。此外,您可以上传Google云端硬盘中的所有文字,并使用SpeakIt!为你阅读它。另一个名为’Speak text’的扩展以相同的方式工作,并具有自然语言。
第十种办法
当寻找更好的tts引擎与新的firefox 49叙述模式一起使用时,我发现了pico tts(svox) – 我最喜欢的TTS引擎。
sudo apt install espeak libttspico0 libttspico-data libttspico-utils
如何改变系统默认的语音合成引擎系统?
arch linux的人把我带到了正确的道路上(https://bbs.archlinux.org/viewtopic.php?id=217411):
取消注释您喜欢的模块,并在speech-dispatcher设置中将其设为默认值:
#> vim /etc/speech-dispatcher/speechd.conf
[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak" "sd_espeak" "espeak.conf"
AddModule "pico-generic" "sd_generic" "pico-generic.conf"
[...]
#DefaultModule espeak
DefaultModule pico-generic
重新启动守护进程:
#> sudo systemctl restart speech-dispatcher.service
但是,当再次启动firefox时,没有任何反应。根据以上链接(论坛帖子#10和#16)与节日(未尝试)一起工作,但用于pico的speech-dispatcher不会列出可用语音。它不会运行。
任何想法都会被高度赞赏;-)