听起来比较自然的文本转语音？

问题描述

我正在寻找一些易于安装文本到Ubuntu的语音软件，这听起来很自然。我已经安装了Festival，Gespeaker等，但没有听起来很自然。所有非常合成和难以理解。

有任何建议吗？

最佳解决办法

SVOX pico2wave

除了其他答案之外：

一个非常简约的TTS，比espeak或mbrola更好听(在我看来)。

一些信息：https://launchpad.net/ubuntu/precise/+source/svox/

我不明白为什么pico2wave与espeak或mbrola相比，很少讨论。它很小，但听起来很不错(自然)。没有修改，你会听到自然的女声。

AND …与Mbrola相比，它能够识别Units并以正确的方式说出它！例如：

2°C→两度
2米→两米
2公斤→两公斤

安装后我在脚本中使用它：

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

然后用所需的文本运行它：

<scriptname>.sh "hello world"

或者读取整个文件的内容：

<scriptname>.sh "$(cat <filename>)"

这就是在Ubuntu上有一个轻量级，稳定的工作TTS。

次佳解决办法

我相信我已经使用名为”SpeakIt”的Google Chrome扩展程序免费找到了最好的TTS软件。这只适用于Ubuntu上的Chrome浏览器。由于某些原因，它不适用于Chromium。 SpeakIt带有两个女声，与其他所有声音相比，这听起来非常逼真。至少有四个以上的男性和女性。如果您使用”TTS”作为查询搜索Chrome网上应用店，则女性声音会列出Chrome扩展程序。

https://chrome.google.com/webstore/detail/speakit/pgeolalilifpodheeocdmbhehgnkkbak?utm_source=chrome-ntp-icon

在网站上使用。突出显示要阅读的文本，并右键单击并选择”SpeakIt”，或者单击停靠在Chrome顶部栏上的SpeakIt图标。

Firefox用户也有两个选择。在Firefox插件中，搜索TTS，您应该找到”Click Speak”以及“文本到语音”。声音不如Chrome SpeakIt声音好，但绝对可用。

SpeakIt扩展使用iSpeech技术，每年价格为20美元，该网站可以将文本转换为MP3音频文件。您可以输入文本，URL，RSS源以及TXT，DOC和PDF等文档并输出到MP3。您可以制作播客，嵌入音频等。这是一个链接…

http://www.ispeech.org/free.text.to.speech.tts.software

和他们的音频样本(不知道链接将持续多久)…

http://www.ispeech.org/view/681080/4429622

第三种解决办法

简单的Googleâ€“Ë~TTS

由于缺少更好的选择，我写了一个bash script与a perl script by Michal Fapso接口，通过Google Translate提供TTS。从项目说明：

The intention is to provide an easy to use interface to text-to-speech output via Google’s speech synthesis system. A fallback option using pico2wave automatically provides TTS synthesis in case no Internet connection is found.

As it stands, the wrapper supports reading from standard input, plain text files and the X selection (highlighted text).

主要特点是：

通过谷歌翻译在线TTS综合
通过pico2wave离线TTS合成
支持多种不同的语言
可以从CLI读取文本文件和突出显示的文本
支持以固定格式读取突出显示的文本(例如PDF文件)

安装和使用记录在project page上。

如果您尝试过，我会很高兴。 Bug reports and any other feedback欢迎！

第四种办法

对于高品质的Ubuntu来说，我已经看好文本到语音。空无一人。我的声带麻痹了，所以我需要TTS将语音指令添加到我的Ubuntu videos。您可以在这里获得商业高质量的Linux文本到语音软件：http://wizzardsoftware.com/att_desktop_overview.php它只是非常昂贵。我最终以40美元购买了Natural Reader for Windows(在Ubuntu下的Wine下无法使用)。也许以后我会拿到Linux的。

我希望有所帮助。

第五种办法

我一直在研究最好的发音和容易调整的文本语音。下面列出了我认为是音质方面排名前五的产品。与这些产品相关的大多数网站都有一个交互式演示，可以让您自己做出决定。

NeoSpeech
伊沃娜
Acapela
AT& T自然的声音
CereProc的声音

第六种办法

Pico和espeak很有趣，很容易上班，但他们并不是那么好。默认的节日声音也不是很好。然而，Festival是一个scheme-based演讲框架，许多研究人员已经建立了更好的plug-in声音。您可以轻松超越Ubuntu上的pico2wave质量，因为其中一种声音可作为ready-made软件包提供。

为了让节日听起来自然，以下是做什么：

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

您可以通过使用-b(或--batch)并将每个命令放入单引号从命令行执行此操作：

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

您可以从Nitech存储库中获得其他相当不错的声音，但安装它们很挑剔，而且默认路径已更改，因此可能需要手动编辑捆绑方案文件中的文件名引用才能在Ubuntu上使用。

第七种办法

将SVOX工具(pico)与LibreOffice结合使用：

SVOX(pico)工具易于安装，并在Ubuntu中提供高质量的声音。安装它：

sudo apt-get install libttspico0 libttspico-utils libttspico-data

通过安装“Read Text” extension，您可以将LibreOffice与SVOX(pico)工具结合使用，并为此优秀的TTS软件获得”GUI”：

带工具的Set up Read Text Extension’s options – Add-ons – 读取选择….使用/usr /bin /python作为外部程序。选择一个包含标记(PICO_READ_TEXT_PY)的命令行选项，您可能想要尝试其中的一些选项。

现在，您只需在LO Writer，Calc，Impress或Draw中选择一些文本，然后在作为工具栏添加的图标(带有气球的快乐脸)上点击。

第八种办法

我发现Nitech HTS在节日上的声音非常自然，并且让我感受到我听到的任何其他声音。 See this link关于如何用节日设置Nitech和其他声音。我还没有找到一个很好的gui，我可以用它来配置这些声音，但是通过festival.scm设置它们仍然有效。该帖子非常陈旧，您可能需要使用”locate festival”命令查找实际的安装目录

第九种办法

以下是我为PDF和其他文本文件提供纯粹自然语音所做的事情(其他解决方案不自然，或者他们只是付费服务)。这实际上是一个围绕使用 chrome 或 chrome 的工作，但工作快速而简单。

在您的 chrome 或 chrome 上安装SpeakIt!扩展。
如果您使用的是 chrome (Chrome浏览器已免费提供pdf查看器)，请安装PDF Viewer，并在 chrome 的扩展设置中选中“允许隐身”和“允许访问文件网址”选项。
拖放您的PDF到浏览器。
现在突出显示一些文本并右键单击并选择SpeakIt！所以你可以听纯天然的text-to-speech。

还有一些方法可以在chrome中打开其他文件，如.doc和.txt，并执行相同的操作。还有其他扩展程序可用于查看PDF文件，请检查它是否适合您。此外，您可以上传Google云端硬盘中的所有文字，并使用SpeakIt！为你阅读它。另一个名为’Speak text’的扩展以相同的方式工作，并具有自然语言。

第十种办法

当寻找更好的tts引擎与新的firefox 49叙述模式一起使用时，我发现了pico tts(svox) – 我最喜欢的TTS引擎。

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

如何改变系统默认的语音合成引擎系统？

arch linux的人把我带到了正确的道路上(https://bbs.archlinux.org/viewtopic.php?id=217411)：

取消注释您喜欢的模块，并在speech-dispatcher设置中将其设为默认值：

#> vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

重新启动守护进程：

#> sudo systemctl restart speech-dispatcher.service

但是，当再次启动firefox时，没有任何反应。根据以上链接(论坛帖子＃10和＃16)与节日(未尝试)一起工作，但用于pico的speech-dispatcher不会列出可用语音。它不会运行。

任何想法都会被高度赞赏;-)

参考资料

Natural Sounding Text to Speech?