当前位置: 首页>>技术教程>>正文


听起来比较自然的文本转语音?

, ,

问题描述

我正在寻找一些易于安装文本到Ubuntu的语音软件,这听起来很自然。我已经安装了FestivalGespeaker等,但没有听起来很自然。所有非常合成和难以理解。

有任何建议吗?

最佳解决办法

SVOX pico2wave

除了其他答案之外:

一个非常简约的TTS,比espeak或mbrola更好听(在我看来)。

一些信息:https://launchpad.net/ubuntu/precise/+source/svox/

我不明白为什么pico2wave与espeak或mbrola相比,很少讨论。它很小,但听起来很不错(自然)。没有修改,你会听到自然的女声。

AND …与Mbrola相比,它能够识别Units并以正确的方式说出它!例如:

  • 2°C→两度

  • 2米→两米

  • 2公斤→两公斤

安装后我在脚本中使用它:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

然后用所需的文本运行它:

<scriptname>.sh "hello world"

或者读取整个文件的内容:

<scriptname>.sh "$(cat <filename>)"

这就是在Ubuntu上有一个轻量级,稳定的工作TTS。

次佳解决办法

我相信我已经使用名为”SpeakIt”的Google Chrome扩展程序免费找到了最好的TTS软件。这只适用于Ubuntu上的Chrome浏览器。由于某些原因,它不适用于Chromium。 SpeakIt带有两个女声,与其他所有声音相比,这听起来非常逼真。至少有四个以上的男性和女性。如果您使用”TTS”作为查询搜索Chrome网上应用店,则女性声音会列出Chrome扩展程序。

https://chrome.google.com/webstore/detail/speakit/pgeolalilifpodheeocdmbhehgnkkbak?utm_source=chrome-ntp-icon

在网站上使用。突出显示要阅读的文本,并右键单击并选择”SpeakIt”,或者单击停靠在Chrome顶部栏上的SpeakIt图标。

Firefox用户也有两个选择。在Firefox插件中,搜索TTS,您应该找到”Click Speak”以及“文本到语音”。声音不如Chrome SpeakIt声音好,但绝对可用。

SpeakIt扩展使用iSpeech技术,每年价格为20美元,该网站可以将文本转换为MP3音频文件。您可以输入文本,URL,RSS源以及TXT,DOC和PDF等文档并输出到MP3。您可以制作播客,嵌入音频等。这是一个链接…

http://www.ispeech.org/free.text.to.speech.tts.software

和他们的音频样本(不知道链接将持续多久)…

http://www.ispeech.org/view/681080/4429622

第三种解决办法

简单的Google–Ë~TTS

由于缺少更好的选择,我写了一个bash scripta perl script by Michal Fapso接口,通过Google Translate提供TTS。从项目说明:

The intention is to provide an easy to use interface to text-to-speech output via Google’s speech synthesis system. A fallback option using pico2wave automatically provides TTS synthesis in case no Internet connection is found.

As it stands, the wrapper supports reading from standard input, plain text files and the X selection (highlighted text).

主要特点是:

  • 通过谷歌翻译在线TTS综合

  • 通过pico2wave离线TTS合成

  • 支持多种不同的语言

  • 可以从CLI读取文本文件和突出显示的文本

  • 支持以固定格式读取突出显示的文本(例如PDF文件)

安装和使用记录在project page上。

如果您尝试过,我会很高兴。 Bug reports and any other feedback欢迎!

第四种办法

对于高品质的Ubuntu来说,我已经看好文本到语音。空无一人。我的声带麻痹了,所以我需要TTS将语音指令添加到我的Ubuntu videos。您可以在这里获得商业高质量的Linux文本到语音软件:http://wizzardsoftware.com/att_desktop_overview.php它只是非常昂贵。我最终以40美元购买了Natural Reader for Windows(在Ubuntu下的Wine下无法使用)。也许以后我会拿到Linux的。

我希望有所帮助。

第五种办法

我一直在研究最好的发音和容易调整的文本语音。下面列出了我认为是音质方面排名前五的产品。与这些产品相关的大多数网站都有一个交互式演示,可以让您自己做出决定。

  1. NeoSpeech

  2. 伊沃娜

  3. Acapela

  4. AT& T自然的声音

  5. CereProc的声音

第六种办法

Pico和espeak很有趣,很容易上班,但他们并不是那么好。默认的节日声音也不是很好。然而,Festival是一个scheme-based演讲框架,许多研究人员已经建立了更好的plug-in声音。您可以轻松超越Ubuntu上的pico2wave质量,因为其中一种声音可作为ready-made软件包提供。

为了让节日听起来自然,以下是做什么:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

您可以通过使用-b(或--batch)并将每个命令放入单引号从命令行执行此操作:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

您可以从Nitech存储库中获得其他相当不错的声音,但安装它们很挑剔,而且默认路径已更改,因此可能需要手动编辑捆绑方案文件中的文件名引用才能在Ubuntu上使用。

第七种办法

将SVOX工具(pico)与LibreOffice结合使用:

SVOX(pico)工具易于安装,并在Ubuntu中提供高质量的声音。安装它:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

通过安装“Read Text” extension,您可以将LibreOffice与SVOX(pico)工具结合使用,并为此优秀的TTS软件获得”GUI”:

带工具的Set up Read Text Extension’s options – Add-ons – 读取选择….使用/usr /bin /python作为外部程序。选择一个包含标记(PICO_READ_TEXT_PY)的命令行选项,您可能想要尝试其中的一些选项。

现在,您只需在LO Writer,Calc,Impress或Draw中选择一些文本,然后在作为工具栏添加的图标(带有气球的快乐脸)上点击。

第八种办法

我发现Nitech HTS在节日上的声音非常自然,并且让我感受到我听到的任何其他声音。 See this link关于如何用节日设置Nitech和其他声音。我还没有找到一个很好的gui,我可以用它来配置这些声音,但是通过festival.scm设置它们仍然有效。该帖子非常陈旧,您可能需要使用”locate festival”命令查找实际的安装目录

第九种办法

以下是我为PDF和其他文本文件提供纯粹自然语音所做的事情(其他解决方案不自然,或者他们只是付费服务)。这实际上是一个围绕使用 chrome 或 chrome 的工作,但工作快速而简单。

  1. 在您的 chrome 或 chrome 上安装SpeakIt!扩展。

  2. 如果您使用的是 chrome (Chrome浏览器已免费提供pdf查看器),请安装PDF Viewer,并在 chrome 的扩展设置中选中“允许隐身”和“允许访问文件网址”选项。

  3. 拖放您的PDF到浏览器。

  4. 现在突出显示一些文本并右键单击并选择SpeakIt!所以你可以听纯天然的text-to-speech。

还有一些方法可以在chrome中打开其他文件,如.doc和.txt,并执行相同的操作。还有其他扩展程序可用于查看PDF文件,请检查它是否适合您。此外,您可以上传Google云端硬盘中的所有文字,并使用SpeakIt!为你阅读它。另一个名为’Speak text’的扩展以相同的方式工作,并具有自然语言。

第十种办法

当寻找更好的tts引擎与新的firefox 49叙述模式一起使用时,我发现了pico tts(svox) – 我最喜欢的TTS引擎。

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

如何改变系统默认的语音合成引擎系统?

arch linux的人把我带到了正确的道路上(https://bbs.archlinux.org/viewtopic.php?id=217411):

取消注释您喜欢的模块,并在speech-dispatcher设置中将其设为默认值:

#> vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

重新启动守护进程:

#> sudo systemctl restart speech-dispatcher.service

但是,当再次启动firefox时,没有任何反应。根据以上链接(论坛帖子#10和#16)与节日(未尝试)一起工作,但用于pico的speech-dispatcher不会列出可用语音。它不会运行。

任何想法都会被高度赞赏;-)

参考资料

本文由Ubuntu问答整理, 博文地址: https://ubuntuqa.com/article/957.html,未经允许,请勿转载。