Laryngo Voice
Laryngektomie. Ein Eingriff, bei dem den Patienten der Kehlkopf einschließlich aller seiner Teile entfernt wird, die Stimmbänder nicht ausgenommen. Der irreversible Verlust der Sprachfähigkeit verändert die Lebensqualität dauerhaft. Wir entschieden uns, diese Situation mit Hilfe der Kollegen von der Westböhmischen Universität in Pilsen (ZČU) zu ändern.
Die Lösung Laryngo Voice ermöglicht die Beibehaltung und sogar die Weiterverwendung der spezifischen Stimme des Individuums zur Kommunikation. Die Stimme des Patienten wird aufgrund der erhaltenen Aufnahmen von phonetisch reichen Sätzen aus der Zeit vor der Operation erzeugt.
Der Sprachsynthesizer wird auf tragbaren Geräten (Handy, Tablet, Laptop usw.) installiert und die künstlich erzeugte Stimme kann vom Patienten selbst bearbeitet werden. Diese moderne Lösung stellt eine große Ähnlichkeit der künstlich erzeugten Stimme mit der ursprünglichen Stimme des Patienten sicher.
Prozess der Erhaltung der Stimme
Die erste Phase des Syntheseprozesses ist die Tonaufzeichnung der Stimme des Patienten vor der Operation, die in einem spezialisierten Aufnahmestudio stattfindet.
Der eingespielte Text wird sorgfältig zusammengestellt, so dass effektiv eine breite Skala an Spezifika der stimmlichen Äußerung des betreffenden Patienten erfasst wird. Nach dem Einspielen der Stimme des Patienten werden die Kontrolle des eingesprochenen Texts und die phonetisch-prosodische Analyse durchgeführt. Ergebnis ist ein Stimmenmodul, das mit den folgenden Methoden der Sprachsynthese kompatibel ist:
- statistisch-parametrische Sprachsynthese (die Sprache wird auf der Basis statistischer Modelle generiert; Nutzung der Markov-Modelle)
- Einheitsselektion (die Sprache entsteht durch Verkettung sorgfältig ausgewählter kurzer Segmente der realen Sprache)
Die derzeitige Entwicklung des Systems richten wir auf die volle Automatisierung aus, wobei im gesamten Prozess keine menschliche Assistenz notwendig sein würde. Der Patient würde sich so selbst das Programm erstellen, das den eingegebenen Text mit seiner synthetischen Stimme einliest, und danach würde er es auf seinen ausgewählten Geräten installieren.
Die derzeitig verfügbaren Lösungen, die sich mit der Schaffung persönlicher synthetischer Sprachsysteme befassen, konzentrieren sich meist auf die statistisch-parametrische Sprachsynthese. Ein statistisches Durchschnittsmodell, das mit Hilfe einer großen Menge verschiedener Stimmen entstand, wird einem konkreten Nutzer aufgrund seiner Stimmaufzeichnungen angepasst. Die Ähnlichkeit des Endergebnisses mit der Stimme der betreffenden Person ist aber in der Regel unbefriedigend.
Laryngo Voice und sein Testen
Seit Beginn des Projekts verläuft enge Zusammenarbeit mit der Klinik für Oto-Rhino-Laryngologie und Kopf-Hals-Chirurgie der Uniklinik Motol und mit der 1. medizinischen Fakultät der Karlsuniversität, wo gleichzeitig Tests an ausgewählten Patienten verlaufen.