| Referent: Pascal Christoph Thema: 'Sprachsynthese' Kurs: 'ComputerLinguistische Grundlagen 'bei Jürgen Hühn 021113 UniKöln [ HomePage ]
|
|
Phonetische Information: Sprache dient letztendlich dazu, Information - mehr oder weniger vollständig und fehlerfrei - vom Sprecher zum Hörer zu übertragen. Die Akustik dient uns dabei, kodierte Information von der Oberfläche des Sprechers (Phonation, Artikulationstrakt) auf die Oberfläche des Hörers (Basilarmembran) zu leiten (signalphonetisches Band). http://www.phonetik.uni-muenchen.de/AP/APKap1.htm Referent: Pascal Christoph Thema: 'Sprachsynthese' Kurs: 'ComputerLinguistische Grundlagen 'bei Jürgen Hühn 021113 UniKöln [ HomePage ]
|
# " Die maschinelle Sprachsynthese geht als Forschungsrichtung allen anderen Entwicklungen der Sprachtechnologie voraus. Erste Versuche zur Synthese von Sprache
wurden 1779
an der Königlichen Akademie St. Petersburg unternommen: C.G.
Kratzenstein
konstruierte eine Nachbildung des Vokaltraktes zur Erzeugung
vokalischer
Klänge. 1791 baute Baron Wolfgang von Kempelen einen mechanischen Sprechapparat (Abb. 1), der bereits Laute und Lautübergänge formulieren konnte. Dieser arbeitete mit Blasebälgen und Kammern, deren Form mit den Händen verändert werden konnte. 100 Jahre später wurde diese Maschine von Charles Wheatstone weiterentwickelt, jedoch basierte auch diese Maschine noch auf mechanischen Prinzipien. Erst 1937 gelang es Homer Dudley und seinen Mitarbeitern von den Bell Labs, Sprache auf elektrischem Wege zu synthetisieren, allerdings natürlich noch analog. Diese Maschine - Dudley nannte Sie VODER - machte erstmals die Überführung menschlicher Sprache in zahlenmäßige Parameter möglich. Auch bei VODER wurde ein Keyboard benutzt, jedoch wurde die Sprache durch die Modifizierung eines Spektrums bzw. von Schallwellen simuliert (Abb. 2). Dieses System bildete damit die Grundlage für heutige Synthesizer. In den 50er Jahren experimentierte man mit
Synthese-Systemen,
die die Eingabe von Lautschrift verarbeiten konnten, jedoch erst in den
70er Jahren wurden Maschinen gebaut, die funktionsfähig waren und
erste brauchbare Ergebnisse lieferten. Dies wurde erst durch die
massenhafte
Verfügbarkeit von Speicherplatz und Rechenleistung möglich.
In
diesem Jahrzent war es auch, daß ein Forscher namens Joseph Olive
seine Arbeit in eine ganz neue Richtung weiterführte: Er wollte nicht
eine Schallwelle modifizieren, sondern vorher aufgenommene Segmente
menschlicher
Sprache zusammenfügen . Dieser komplett neue Ansatz ist
auch heute noch das Prinzip, welches hinter den meisten
Sprachsynthesesystemen
steckt. Der Nachfolger des
C64, der Amiga
(1985) , war der erste Computer der mit Software zur Sprachsynthese
ausgeliefert
wurde.
amiga-say-beispiel Referent : Pascal Christoph Thema: 'Sprachsynthese' Kurs : 'ComputerLinguistische Grundlagen 'bei Jürgen Hühn 021113 UniKöln [ HomePage ]
|
| TECHNIK
Bei der Sprachsynthese wird ein geschriebener Text mittels maschineller Verfahren in sprachliche Laute verwandelt. Bei modernen Text-to-Speech Systemen unterscheidet man zwei große Bestandteile eines Systems: berg -> [berk] im deutschen gibt es eine regel, die besagt, dass konsonanten am ende eines wortes als wortgrenzsignale durch harte konsonanten abgegrenzt werden. also kann aus dem gegebenen wort 'bild' abgeleitet werden, dass es phonologisch als 'bilt' zu hören sein muss. der vorteil von solchen regeln liegt auf der hand: es muss nicht für jedes wort ein eintrag in eine phonologische aequivalenzliste erdacht werden. Methode: Akustische Phonetik - Kapitel III Wie wird aus Schall Sprachschall? Prof. H.G. Tillmann, Dr.-Ing. F. Schiel
Phonetische Information
Zusammenfassung: Aus Schall wird also Sprachschall, indem
man dem
Schall prosodisch wohlartikulierte Sprechbewegungen aufprägt.
Referent : Pascal Christoph Thema: 'Sprachsynthese' Kurs : 'ComputerLinguistische Grundlagen 'bei Jürgen Hühn 021113 UniKöln [ HomePage ]
|
| Exkurs
Referent : Pascal Christoph Thema: 'Sprachsynthese' Kurs : 'ComputerLinguistische Grundlagen 'bei Jürgen Hühn 021113 UniKöln [ HomePage ]
|
|
TECHNIK 2. Die Umwandlung
beim verfahren der sprachsynthese existieren 2 richtungen :
http://www.logox.de/sprachsynthese.php Referent : Pascal Christoph Thema: 'Sprachsynthese' Kurs : 'ComputerLinguistische Grundlagen 'bei Jürgen Hühn 021113 UniKöln [ HomePage ]
|
| ANWENDUNG Die digitale Synthese menschlicher Sprache bietet vielfältige Einsatzmöglichkeiten, vornehmlich in dem Bereich der Auskunfts- und Expertensysteme . Überall dort, wo Information über das Telefon übermittelt wird (v.a. bei Banken und in der zivilen Luftfahrt), im Zugriff auf Datenbanken , z.B. zum Abruf von Wettervorhersagen , lassen sich solche Systeme nutzen. Für die maschinelle Übersetzung liessen sich Systeme entwerfen, die den Gesprächspartnern in ihrer eigenen Muttersprache Auskunft über das eben Gesagte erteilten.(-> Translatoren, LPS gekoppelt an Sprachsynthesizer :-) ) Die Mensch- / Maschine-Schnittstelle ist ein weiterer Ansatzpunkt, insbesondere zur Prozess- und Fahrzeugsteuerung und als von GPS/Galileo geleiteten Fahrzeugführern. Für Behinderte lässt sich das Leben mit sprachsynthetischen Vorrichtungen erheblich erleichtern - im Einsatz als Blindenvorlesegeräte oder als künstliche Stimme für Sprachbehinderte . Auch das Militär ist natürlich an der Entwicklung solcher Systeme zum Einsatz in hostile environments interessiert. Weiterhin überall dort, wo Augen und/oder Hände des Benutzers beschäftigt sind (Medizin) oder Bildschirmplatz kostbar bzw. Zeit Mangelware ist, finden Sprachsynthesesysteme Verwendung. Allein im Multimediabereich ergeben sich
zahlreiche Anwendungen
wie Sprachlernprogramme , der stufenlose
Übergang
von einem Sprecher zum anderen ( Morphing)
... Referent : Pascal
Christoph Thema:
'Sprachsynthese' Kurs : 'ComputerLinguistische
Grundlagen
'bei Jürgen
Hühn
021113 UniKöln
|
| AUSBLICK " Verwendete Sprachen sind naturgemäß die Sprachen der industriell mächtigsten Staaten der Erde, also Englisch, Deutsch, Japanisch, Französisch, Mandarin, Italienisch, Spanisch und Russisch. Es gibt jedoch auch Versuche, z.B. die slawischen Sprachen stärker in die Forschung einzubinden. Vor allem folgende Fragen stellt sich die heutige Forschung: Was sind die am besten geeigneten Units einer Sprache? (-> Konkatenationssynthese )
In die Konsumgesellschaft hat die Sprachsynthese auch Einzug gehalten: neben den im Referat erwähnten Anwendungen existieren mittlerweile fertige Komponentenbibliotheken für moderne Programmiersprachen wie Java und sogar Beschreibungssprachen auf XML-Basis, die die oben beschriebenen Algorithmen nutzen und nun standardisiert werden" so gibt es also noch
viel zu
forschen. etwas weiter ausgeblickt:
Referent : Pascal
Christoph Thema:
'Sprachsynthese' Kurs : 'ComputerLinguistische
Grundlagen
'bei Jürgen
Hühn
021113 UniKöln
|
| LINKS
emotional text-to-speech synthesis Referent : Pascal Christoph Thema: 'Sprachsynthese' Kurs : 'ComputerLinguistische Grundlagen 'bei Jürgen Hühn 021113 UniKöln [ HomePage ]
we always have a
choice, or at
least we think we do. all layout done on
linux-machine :
|