Montage von non-anglo-Sprachdateien unter Linux/BSD/FOSS #
Update am Fronleichnam 30.05.2013:% cat ~/bin/despeak
#!/bin/sh # Texte per espeak in Phoneme umwandeln und per mbrola und aplay ausgeben lassen # # Quelle: http://5in4.de/blog/2010/01/16/text-to-speech-mit-espeak-und-mbrola/ # # Datum: 30.05.2013 # # Synopsis: # espeak -v mb-de5 “Auszugebender Satz” | mbrola -e /usr/share/mbrola/de5/de5 - /tmp/mbrola.wav; # aplay -q /tmp/mbrola.wav; rm /tmp/mbrola.wav # # Zur Verfügung stehende Sprachdateien in espeak: % dpkg -L espeak-data|less # # % espeak -v de_dict "auszugebender Satz" # # dau@mbopc:~/src/mbrola/de6/espeak$ file test.wav # test.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 22050 Hz # Für Formate (aplay -f) siehe aplay --help # aplay -r 22050 -c 1 -f S16_LE test.wav espeak -v mb-de5 "$1" |mbrola -e /usr/share/mbrola/de5/de5 - -|aplay -t wav -f S16_LE -r 22050 -c 1 -q
Nachtrag 1 am 30.05.2013: Bibel vorlesen lassen:
cat ~/Documents/text/Bibelpur.txt|espeak -v mb-de6 --stdin | mbrola -e /usr/share/mbrola/de6/de6 - -| \ aplay -t wav -f S16_LE -r 22050 -c 1 -q
Nachtrag 2 am 30.05.2013: IRC live aus irssi-log vorlesen lassen:
tail -f ~/irssilogs/idempiere.log|espeak -v mb-de6 --stdin | mbrola -e /usr/share/mbrola/de6/de6 - -| \ aplay -t wav -f S16_LE -r 22050 -c 1 -q
Disclaimer: Mir kam für das Thema anfangs eher der Titel TTS-Frickelei in den Sinn...
Wortwolke: Es geht bei Sprachausgabe um Festival, Hadifix, Mbrola, Acapela, Diphone, CMU-Arctic-Voices, Nitech HTS-Voices, IRC-Radio, Orca, ...
bei Spracherkennung um Siri, Viavoice, Simon listens, ...
Anglophile Sprachausgabe steht Linuxpersonen, die aus freiwilligen oder realexistierenden Gründen
Bildschirmlesemuffel sind, in den Repositories der gängigen Linux/FOSS-Distributionen
in der Grundausstattung gut erprobt zur Verfügung.
(*buntu, Debian, OpenSuse, redhat users: please refer to your repositories for packages containing festival, espeak, orca and the like.)
Anders sieht es aus, wenn ich deutsche oder gut verständliche Sprachausgabe erhalten will. Dann sind FOSS-Leute zur Zeit (28.05.2013) gehalten, sich die Finger mit Kompilieren und externen Quellen wund zu tippen, so meine Erfahrung.
Hier ein paar Anlaufstellen, die ich mir für die gewünschte Erleuchtung auf dem Weg durch den
TTS-Dschungel notiert habe, sowohl für Sprachausgabe als auch zur Spracherkennung.
Ziel ist eine virtuelle Maschine, um bei Interesse schnell ein funktionierendes
FOSS-Hör-und-Laber-System an den Start zu bringen.
--Markus Monderkamp, 2013-05-28
Einschub:
Klaus Knopper und seine Frau leisten gründliche Vorarbeit mit Adriane und Orca. Tausend Dank dafür an dieser Stelle.
Er hat jedoch meines Wissens kein funktionierendes Festival-System mit dt. Sprachausgabe
auf seinen Knoppix-Medien bis Version 7.1.
Und Orca für german-Sprachgut scheint - für bessere Qualität als espeak - auch tricky.
Nachtrag:
Wenn ich einen betreffenden Artikel aus der c't von April 1999 lese, kommt es mir vor, als stagnierte das Thema bzgl. FOSS.
Oder die Sprachdateien haben sich aus lizenzrechtlichen Gründen in den letzten 14 Jahren eher vom FOSS-Sektor in den kommerziellen Bereich verlagert.
Linkliste:
- http://wiki.ubuntuusers.de/Sprachausgabe -> Überblick
- http://wiki.ubuntuusers.de/Festival/Kompilieren -> get your hands dirty for german tts, achtung bei gcc aus build-essentials:
bitte Änderungshinweise auf der genannten Seite beachten - http://ubuntuforums.org/showthread.php?t=751169 -> Howto make festival use better voices mit z.B. mbrola
- http://www.ip-phone-forum.de/showthread.php?t=196679 -> deutsches TTS für Linux
- http://sourceforge.net/projects/pidgin-festival/ -> IRC Anbindung an die Festival-Sprachausgabe
- http://www.borncity.com/blog/2009/06/30/deutsche-sprachausgabe-in-windows-7/ -> deutsche Sprachausgabe für Windows 7
- http://www.satis.de/www/56-65_sp/59_spr_2/59-3-ste.htm -> dt. Sprachausgabe Steffi für Windows
- http://community.nvda-project.org/ -> open Source Sprachausgabe für Windows, unterstützt von acapella
- http://www.acapela-group.com/infovox-4-41-speech-solutions.html -> Infovox Sprachausgabe f. Sehbehinderte