Schlagworte: Text-to-speech

Im Dialog mit Maschinen

“Keywords wie Digitalisierung, Künstliche Intelligenz und Big Data sind in aller Munde. Der Versicherungs- und Bankenmarkt steht unter ständiger Veränderung, Rahmenbedingungen ändern sich rapide und eine optimale Kundenbindung gewinnt zunehmend an Bedeutung. Doch worauf dürfen – und müssen – wir uns zukünftig einstellen?” (Einladung APRIL) Über diese und weitere Themen wird beim diesjährigen APRIL-Praxisforum in München am 26. September 2018 diskutiert. Die Keynote von Oliver Bendel aus Zürich trägt den Titel “Im Dialog mit Maschinen”. Ob iPal, Pepper oder Lio – viele Roboter verstehen uns und sprechen mit uns. Virtuelle Assistenten wie Siri und Cortana belauschen uns und klingen immer menschenähnlicher. Alexa kann dank SSML inzwischen flüstern. Mit SSML kann man grundsätzlich in die Stimme eingreifen, sie höher und tiefer, jünger und älter machen, sie zufrieden und unsicher klingen lassen. Bei Google Duplex wurde zudem die Sprechweise angepasst, wurden Unterbrechungen und Ähs eingebaut. Was ist der technische Stand bei der Sprachsynthese, was ist aus ethischer Sicht anzumerken? Auf solche Fragen gibt Oliver Bendel Antworten. Weitere Informationen über www.april.de/index.php?id=124.

Abb.: Kann er mich verstehen?

Artificial Voices of Sex Robots and Love Dolls

In love and sex, the voice is a decisive factor. It not only matters what is said, but also how it is said. Pitch, volume and personal expression are important to attract and retain potential partners. The same goes for sex robots and love dolls, and is true for chatbots and virtual assistants with sexual orientation as well. If you are not working with ordinary recordings, they all need artificial voices (if you decide to use voices at all). The synthetization of voices, or speech synthesis, has been an object of interest for centuries. Today, it is mostly realized with a text-to-speech system (TTS), an automaton that interprets and reads aloud. This system refers to text which is available for instance in a knowledge base or on a website. Different procedures have been established to adjust the artificial voice. A recently published article by Oliver Bendel examines how the Speech Synthesis Markup Language (SSML) can be used for sex robots and love servants. Existing tags, attributes and values are categorized in the present context and new ones are proposed to support the purpose of the special machines. In addition, a short ethical discussion takes place. The article “SSML for Sex Robots” is part of the new Springer book “Love and Sex with Robots“.

Fig.: The artificial voices of sex robots must be specially designed

Ein locker geflochtener Zopf

Dass Roboter auch Gedichte vortragen können, zeigt ein Projekt von Oliver Bendel, gestartet im November 2016. Benutzt wurde für den ersten Versuch die Text-to-speech-Engine von IBM Watson. Diese kann im Prinzip für Vorlesesysteme, für Chatbots oder für Serviceroboter verwendet werden. Das Gedicht wurde mit Hilfe der Speech Synthesis Markup Language (SSML) angepasst, einer auf XML basierenden Auszeichnungssprache. Die deutsche Stimme “Birgit” unterstützt diese teilweise. So konnte das Personalpronomen “sie” an drei Stellen in der Aussprache etwas verlängert werden. Es wurden Pausen am Anfang eingebaut, damit der Titel und die Metainformationen (Autor, System, Stimme, Datum) nicht zu schnell nacheinander gesprochen werden, zudem Pausen zwischen den Strophen. Der Titel des Gedichts lautet “Ein locker geflochtener Zopf”. Es geht um eine Astronautin, die auf einem Planeten, der Atmosphäre besitzt, ihr Haar schüttelt. Ein Roboter ist bei ihr, ein eitler Geck, der sich am liebsten selbst betrachtet. Die Texte aus der Sammlung “Die Astronautin” kreisen um eine Frau im besten Alter, die allein in den Tiefen des Alls unterwegs ist. Veröffentlicht wurde daraus bisher nur “Auf dem obersten Deck”, und zwar in der Anthologie “Worte reden, Worte schweigen” von 2013. Das Gedicht kann hier im Format .ogg heruntergeladen und beispielsweise im VLC Media Player angehört werden. In weiteren Versuchen will der Autor die Stimme selbst verändern und die eine oder andere Passage anders betonen lassen.

Abb.: Ein locker geflochtener Zopf