Schlagworte: Speech Synthesis

Künstliche Stimmen künstlicher Wesen

Die 2. VDI-Konferenz “Humanoide Roboter” am 5. und 6. Dezember 2017 beschäftigte sich wieder – wie die 1. VDI-Konferenz mit diesem Titel – mit “dem Menschen nachempfundenen Robotern” (Website VDI). Am 6. Dezember 2017 sprach Prof. Dr. Oliver Bendel (Hochschule für Wirtschaft FHNW) über “SSML für humanoide Serviceroboter”. Es ging darum, wie man künstliche Stimmen so manipuliert, dass sie z.B. zu Informations- und Navigationsrobotern passen. Am Rande stellte er auch Fragen aus der Ethik heraus, etwa mit Blick auf die Stimmen von Pflegerobotern. Der Postprint kann hier heruntergeladen werden. Es folgte Dr.-Ing. Hendrik Wöhrle vom DFKI mit einem Vortrag über “Eingebettete Biosignalverarbeitung und integrierte Regelung eines Ganzkörper-Exoskelettes für die Neuro-Rehabilitation”. Der Moderator, Prof. Dr. Frank Kirchner vom DFKI, ging zusammen mit dem jungen Wissenschaftler auf Fragen aus dem Publikum ein. Prof. Dr. Elisabeth André (Universität Augsburg) referierte dann zur “Personalisierung der Mensch-Roboter-Interaktion durch sozialsensitives Lernen”. Die Teilnehmerinnen und Teilnehmer der Konferenz hatten sich an beiden Tagen interessiert an ethischen Fragestellungen gezeigt. Dem soll bei der nächsten Durchführung verstärkt Rechnung getragen werden.

Abb.: Auch Nao hat eine künstliche Stimme

The Synthetization of Human Voices

The synthetization of voices, or speech synthesis, has been an object of interest for centuries. It is mostly realized with a text-to-speech system (TTS), an automaton that interprets and reads aloud. This system refers to text available for instance on a website or in a book, or entered via popup menu on the website. Today, just a few minutes of samples are enough in order to be able to imitate a speaker convincingly in all kinds of statements. The article “The Synthetization of Human Voices” by Oliver Bendel (published on 26 July 2017) abstracts from actual products and actual technological realization. Rather, after a short historical outline of the synthetization of voices, exemplary applications of this kind of technology are gathered for promoting the development, and potential applications are discussed critically in order to be able to limit them if necessary. The ethical and legal challenges should not be underestimated, in particular with regard to informational and personal autonomy and the trustworthiness of media. The article can be viewed via rdcu.be/uvxm.

Fig.: What will we hear in the future?