Montage von non-anglo-Sprachdateien unter Linux/BSD/FOSS #

Update am Fronleichnam 30.05.2013:% cat ~/bin/despeak

#!/bin/sh                 
# Texte per espeak in Phoneme umwandeln und per mbrola und aplay ausgeben lassen   
#                                                                                                   
# Quelle: http://5in4.de/blog/2010/01/16/text-to-speech-mit-espeak-und-mbrola/  
#                     
# Datum: 30.05.2013         
# 
# Synopsis: 
# espeak  -v mb-de5 “Auszugebender Satz” | mbrola -e /usr/share/mbrola/de5/de5 - /tmp/mbrola.wav;
# aplay -q /tmp/mbrola.wav; rm /tmp/mbrola.wav       
#                   
# Zur Verfügung stehende Sprachdateien in espeak: % dpkg -L espeak-data|less 
#
# % espeak -v de_dict "auszugebender Satz" 
#                  
# dau@mbopc:~/src/mbrola/de6/espeak$ file test.wav  
# test.wav: RIFF (little-endian) data, WAVE audio, Microsoft PCM, 16 bit, mono 22050 Hz  
# Für Formate (aplay -f) siehe aplay --help  
# aplay -r 22050 -c 1 -f S16_LE test.wav 
                                          
espeak -v mb-de5 "$1" |mbrola -e /usr/share/mbrola/de5/de5 - -|aplay -t wav -f S16_LE -r 22050 -c 1 -q

Nachtrag 1 am 30.05.2013: Bibel vorlesen lassen:

cat ~/Documents/text/Bibelpur.txt|espeak -v mb-de6 --stdin | mbrola -e /usr/share/mbrola/de6/de6 - -| \
aplay -t wav -f S16_LE -r 22050 -c 1 -q

Nachtrag 2 am 30.05.2013: IRC live aus irssi-log vorlesen lassen:

tail -f ~/irssilogs/idempiere.log|espeak -v mb-de6 --stdin | mbrola -e /usr/share/mbrola/de6/de6 - -| \
aplay -t wav -f S16_LE -r 22050 -c 1 -q

Disclaimer: Mir kam für das Thema anfangs eher der Titel TTS-Frickelei in den Sinn...

Wortwolke: Es geht bei Sprachausgabe um Festival, Hadifix, Mbrola, Acapela, Diphone, CMU-Arctic-Voices, Nitech HTS-Voices, IRC-Radio, Orca, ...
bei Spracherkennung um Siri, Viavoice, Simon listens, ...

Anglophile Sprachausgabe steht Linuxpersonen, die aus freiwilligen oder realexistierenden Gründen Bildschirmlesemuffel sind, in den Repositories der gängigen Linux/FOSS-Distributionen in der Grundausstattung gut erprobt zur Verfügung.
(*buntu, Debian, OpenSuse, redhat users: please refer to your repositories for packages containing festival, espeak, orca and the like.)

Anders sieht es aus, wenn ich deutsche oder gut verständliche Sprachausgabe erhalten will. Dann sind FOSS-Leute zur Zeit (28.05.2013) gehalten, sich die Finger mit Kompilieren und externen Quellen wund zu tippen, so meine Erfahrung.

Hier ein paar Anlaufstellen, die ich mir für die gewünschte Erleuchtung auf dem Weg durch den TTS-Dschungel notiert habe, sowohl für Sprachausgabe als auch zur Spracherkennung. Ziel ist eine virtuelle Maschine, um bei Interesse schnell ein funktionierendes FOSS-Hör-und-Laber-System an den Start zu bringen.
--Markus Monderkamp, 2013-05-28


Einschub:
Klaus Knopper und seine Frau leisten gründliche Vorarbeit mit Adriane und Orca. Tausend Dank dafür an dieser Stelle.
Er hat jedoch meines Wissens kein funktionierendes Festival-System mit dt. Sprachausgabe auf seinen Knoppix-Medien bis Version 7.1.
Und Orca für german-Sprachgut scheint - für bessere Qualität als espeak - auch tricky.


Nachtrag: Wenn ich einen betreffenden Artikel aus der c't von April 1999 lese, kommt es mir vor, als stagnierte das Thema bzgl. FOSS.
Oder die Sprachdateien haben sich aus lizenzrechtlichen Gründen in den letzten 14 Jahren eher vom FOSS-Sektor in den kommerziellen Bereich verlagert.

Linkliste:

Mehraufwand auch in Windows >= 7 mangels serienmäßiger Ausstattung mit nicht-englischen Sprachdateien:

Add new attachment

Only authorized users are allowed to upload new attachments.
« This page (revision-4) was last changed on 30-May-2013 14:51 by Markus Monderkamp