LUG Krefeld: TextToSpeechMontage

More...

Montage von non-anglo-Sprachdateien unter Linux/BSD/FOSS #

Update am Fronleichnam 30.05.2013:% cat ~/bin/despeak

#!/bin/sh                 
# Texte per espeak in Phoneme umwandeln und per mbrola und aplay ausgeben lassen   
#                                                                                                   
# Quelle: http://5in4.de/blog/2010/01/16/text-to-speech-mit-espeak-und-mbrola/  
#                     
# Datum: 30.05.2013         
# 
# Synopsis: 
# espeak  -v mb-de5 “Auszugebender Satz” | mbrola -e /usr/share/mbrola/de5/de5 - /tmp/mbrola.wav;
# aplay -q /tmp/mbrola.wav; rm /tmp/mbrola.wav       
#                   
# Zur Verfügung stehende Sprachdateien in espeak: % dpkg -L espeak-data|less 
#
# % espeak -v de_dict "auszugebender Satz" 
#                  
# dau@mbopc:~/src/mbrola/de6/espeak$ file test.wav  
# test.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 22050 Hz  
# Für Formate (aplay -f) siehe aplay --help  
# aplay -r 22050 -c 1 -f S16_LE test.wav 
                                          
espeak -v mb-de5 "$1" |mbrola -e /usr/share/mbrola/de5/de5 - -|aplay -t wav -f S16_LE -r 22050 -c 1 -q

Nachtrag 1 am 30.05.2013: Bibel vorlesen lassen:

cat ~/Documents/text/Bibelpur.txt|espeak -v mb-de6 --stdin | mbrola -e /usr/share/mbrola/de6/de6 - -| \
aplay -t wav -f S16_LE -r 22050 -c 1 -q

Nachtrag 2 am 30.05.2013: IRC live aus irssi-log vorlesen lassen:

tail -f ~/irssilogs/idempiere.log|espeak -v mb-de6 --stdin | mbrola -e /usr/share/mbrola/de6/de6 - -| \
aplay -t wav -f S16_LE -r 22050 -c 1 -q

Disclaimer: Mir kam für das Thema anfangs eher der Titel TTS-Frickelei in den Sinn...

Wortwolke: Es geht bei Sprachausgabe um Festival, Hadifix, Mbrola, Acapela, Diphone, CMU-Arctic-Voices, Nitech HTS-Voices, IRC-Radio, Orca, ...
bei Spracherkennung um Siri, Viavoice, Simon listens, ...

Anglophile Sprachausgabe steht Linuxpersonen, die aus freiwilligen oder realexistierenden Gründen Bildschirmlesemuffel sind, in den Repositories der gängigen Linux/FOSS-Distributionen in der Grundausstattung gut erprobt zur Verfügung.
(*buntu, Debian, OpenSuse, redhat users: please refer to your repositories for packages containing festival, espeak, orca and the like.)

Anders sieht es aus, wenn ich deutsche oder gut verständliche Sprachausgabe erhalten will. Dann sind FOSS-Leute zur Zeit (28.05.2013) gehalten, sich die Finger mit Kompilieren und externen Quellen wund zu tippen, so meine Erfahrung.

Hier ein paar Anlaufstellen, die ich mir für die gewünschte Erleuchtung auf dem Weg durch den TTS-Dschungel notiert habe, sowohl für Sprachausgabe als auch zur Spracherkennung. Ziel ist eine virtuelle Maschine, um bei Interesse schnell ein funktionierendes FOSS-Hör-und-Laber-System an den Start zu bringen.
--Markus Monderkamp, 2013-05-28

Einschub:
Klaus Knopper und seine Frau leisten gründliche Vorarbeit mit Adriane und Orca. Tausend Dank dafür an dieser Stelle.
Er hat jedoch meines Wissens kein funktionierendes Festival-System mit dt. Sprachausgabe auf seinen Knoppix-Medien bis Version 7.1.
Und Orca für german-Sprachgut scheint - für bessere Qualität als espeak - auch tricky.

Nachtrag: Wenn ich einen betreffenden Artikel aus der c't von April 1999 lese, kommt es mir vor, als stagnierte das Thema bzgl. FOSS.
Oder die Sprachdateien haben sich aus lizenzrechtlichen Gründen in den letzten 14 Jahren eher vom FOSS-Sektor in den kommerziellen Bereich verlagert.

Linkliste:

http://wiki.ubuntuusers.de/Sprachausgabe -> Überblick
http://wiki.ubuntuusers.de/Festival/Kompilieren -> get your hands dirty for german tts, achtung bei gcc aus build-essentials:
bitte Änderungshinweise auf der genannten Seite beachten
http://ubuntuforums.org/showthread.php?t=751169 -> Howto make festival use better voices mit z.B. mbrola
http://www.ip-phone-forum.de/showthread.php?t=196679 -> deutsches TTS für Linux
http://sourceforge.net/projects/pidgin-festival/ -> IRC Anbindung an die Festival-Sprachausgabe

Mehraufwand auch in Windows >= 7 mangels serienmäßiger Ausstattung mit nicht-englischen Sprachdateien:

http://www.borncity.com/blog/2009/06/30/deutsche-sprachausgabe-in-windows-7/ -> deutsche Sprachausgabe für Windows 7
http://www.satis.de/www/56-65_sp/59_spr_2/59-3-ste.htm -> dt. Sprachausgabe Steffi für Windows
http://community.nvda-project.org/ -> open Source Sprachausgabe für Windows, unterstützt von acapella
http://www.acapela-group.com/infovox-4-41-speech-solutions.html -> Infovox Sprachausgabe f. Sehbehinderte

Add new attachment

Only authorized users are allowed to upload new attachments.

« This page (revision-4) was last changed on 30-May-2013 14:51 by Markus Monderkamp

G’day (anonymous guest) My Prefs

View Page Source

Menü
Startseite
ThemenWolke
Stammtisch
Mitglieder
EMail-Verteiler
Letzte Änderungen
Sitemap

Änderungen dieser Woche

JSPWiki v2.8.5-svn-9