Bildgeneratoren und Architektur

Bei der 18. Internationalen Architekturausstellung (Biennale Architettura 2023, Teil der Biennale di Venezia) ist von KI nur vereinzelt die Rede, wie im türkischen Pavillon. Dabei bieten z.B. Bildgeneratoren viele Möglichkeiten für Architekten und ihre Kunden. Die Kunden können ihre Vorstellungen mitteilen, die Architekten diese zurechtstutzen oder erweitern, im Dialog mit ihnen und den Dialogsystemen von DALL-E 3 und Co. Auch klassische Modelle werden ohne Umstände entworfen. Unten sieht man Wohnkugeln – zwei davon mit mehreren Etagen – in einem Tal. Wie sich Wohnkugeln am Berghang stapeln könnten, wird hier gezeigt, wie sie – mit Balkon – am Meer stehen könnten, hier. Ein Vorteil ist, dass auch Laien eine professionelle Visualisierung gelingt und Experten schnell erste Eindrücke und Ideen vermitteln können. Ein Nachteil ist, dass Erwartungen geweckt werden, die man nicht oder kaum zu befriedigen vermag. Zudem sind die meisten Bildgeneratoren noch zu unpräzise beim Ausführen von Prompts. Dass die Wohnkugeln mit Treppen verbunden werden sollen, wird noch verstanden, aber der Wunsch nach Türen eher nicht. Bei DALL-E 3 gesellt sich das Problem hinzu, dass die eigenen Eingaben von ChatGPT in Prompts übersetzt werden, die vom Ursprünglichen stark abweichen können. Dazu kommt dann noch die Interpretation durch den Bildgenerator selbst, sodass man u.U. ein unerwünschtes Ergebnis erhält. Insgesamt entsteht eine neue Spielwiese, auf der man mit architektonischen Ideen umgehen und futuristische Konzepte entwickeln kann. Bei der Biennale Architettura 2021 waren u.a. Cyborgs ein Thema.

Abb.: Wohnkugeln in der Landschaft (Bild: DALL-E 3)

Das Stille-Post-Problem von DALL-E 3

DALL-E 3 – in der Version, die in ChatGPT Plus integriert ist – scheint ein Stille-Post-Problem zu haben. Bei einem Test von Oliver Bendel lautete der Prompt (Prompt A): „Two female swimmers competing in lake, photorealistic“. ChatGPT, die Schnittstelle zu DALL-E 3, machte daraus vier Prompts (Prompt B1 – B4). Prompt B4 lautete: „Photo-realistic image of two female swimmers, one with tattoos on her arms and the other with a swim cap, fiercely competing in a lake with lily pads and reeds at the edges. Birds fly overhead, adding to the natural ambiance.“ DALL-E 3 wiederum machte aus diesem Prompt etwas, was weder mit diesem noch mit Prompt A viel zu tun hatte. Zu sehen sind auf dem Bild nicht zwei Frauen, sondern zwei Männer oder eine Frau und ein Mann mit Bart. Sie schwimmen nicht um die Wette, sondern streiten sich, in einem Teich oder einem kleinen See stehend, indem sie wütend mit den Armen fuchteln und aufeinander losgehen. Vor ihnen wuchern Seerosen, über ihnen flattern Vögel. Sicherlich ein interessantes Bild, aber mit einer derartigen Willkür hervorgebracht, dass man sich das gute alte Prompt Engineering zurückwünscht. Genau dieses will die Schnittstelle eigentlich ersetzen – aber entstanden ist ein Effekt, den man von dem Stille-Post-Spiel kennt.

Abb.: Das Stille-Post-Problem von DALL-E 3

Zensur bei DALL-E 3 und Ideogram

Eine Besonderheit von DALL-E 3 – in der Version, die in ChatGPT Plus integriert ist – ist die Übersetzung des Prompts des Benutzers (Prompt A) in einen Prompt von ChatGPT (Prompt B), der jeweils aufgeführt wird. Prompt A bei dem hier gezeigten Bild lautete „Competition in the sea between two female swimmers with bathing cap, photorealistic“. DALL-E generierte bei diesem Test drei Bilder, jeweils auf der Basis von Prompt B. Prompt B1 lautete: „Photo of two determined female swimmers in the expansive sea, both wearing bathing caps. Their arms create ripples as they compete fiercely, striving to outpace each other.“ Prompt A wurde offensichtlich weitergeführt, Prompt B1 allerdings nicht akkurat ausgeführt. Statt der zwei Schwimmerinnen sind drei zu sehen. Sie scheinen – wie oft bei Darstellungen von Personen von DALL-E 3 – eng verwandt miteinander zu sein, vielleicht Schwestern bzw. Drillinge. Interessant ist auch, dass sie zu nah beieinander sind. Das vierte Bild wurde gar nicht ausgeführt, wie schon bei einer Reihe zuvor. ChatGPT teilte hierzu mit: „I apologize again, but there were issues generating one of the images based on your description.“ Vermutlich wurde von ChatGPT ein Prompt B4 generiert, der dann von DALL-E 3 verweigert wurde. Auf die Bitte „Please tell me the prompt generated by ChatGPT that was not executed by DALL-E 3.“ kommt die Antwort „I’m sorry for the inconvenience, but I cannot retrieve the exact prompt that was not executed by DALL·E.“ … Auf andere Weise zensiert Ideogram. Dort entsteht das Bild vor den Augen des Benutzers, und wenn die KI feststellt, dass es Elemente enthält, die nach den eigenen Richtlinien problematisch sein könnten, bricht sie die Erstellung ab und schiebt eine Kachel mit einer Katze vor. Auf ethische Herausforderungen von Bildgeneratoren geht der Artikel „Image Synthesis from an Ethical Perspective“ von Oliver Bendel ein.

Abb.: Die drei Schwimmerinnen

International Robophilosophy Conference 2024

The upcoming international Robophilosophy Conference 2024 in Aarhus is set to tackle the socio-cultural and ethical questions arising from the use of generative multimodal AIs in social robotics. The event will bring together global scholars from humanities, social sciences, social robotics, and computer science, aiming to produce actionable insights and responsibly address the socio-cultural transformations brought about by social robotics. It is part of the Robophilosophy Conference Series, known for its large scale events for humanities research in social robotics. RP2024 highlights the urgency of closer collaboration between tech experts and societal experts to establish research-based regulations. The conference will welcome 80-100 talks in plenaries, special workshops, and parallel sessions of reviewed research papers. Virtual attendance is made possible for those unable to attend in person. Interested parties are invited to submit their papers on the conference topics. Key dates to note: Deadline for workshop/panel proposal submissions is January 31, 2024. Deadline for short papers and posters is February 15, 2024. More information at cas.au.dk/en/robophilosophy/conferences/rpc2024.

Fig.: Summer in Aarhus

Interview zu Barrobotern in HG-Zeitung

In der „Hotellerie Gastronomie Zeitung“ ist am 18. Oktober 2023 ein Interview mit Prof. Dr. Oliver Bendel zu Barrobotern erschienen. Er erforscht seit einigen Jahren Serviceroboter aller Art, darunter auch weniger bekannte wie Polizeiroboter und Gastronomieroboter. Im Interview stellt er Daten vor, die er mit seiner ehemaligen Studentin Lea Peier gewonnen hat. Sie hat das wohl erste empirische Forschungsprojekt in diesem Bereich wesentlich geprägt und 2022 in der Schweiz an verschiedenen Standorten wochenlang Barroboter im Einsatz beobachtet und untersucht. Es konnten in dieser Zeit Robobarista von Smyze und Barney Bar von F&P Robotics besucht werden. Zusätzlich wurden Expertengespräche mit den Herstellern und mit Gastronomen geführt. Oliver Bendel hält Barroboter für eine interessante Ergänzung von gastronomischen Betrieben an Bahnhöfen, an Flughäfen und in Shoppings Malls. In klassischen Cafés und Restaurants werden sie sich eher nicht durchsetzen. Sie werden auch – dies wird bereits in der Überschrift ausgesagt – nicht den Fachkräftemangel beheben. Der ganze Artikel kann über den ISSUU-Reader aufgerufen werden. Er steht zudem auf der Website der Zeitung zur Verfügung.

Abb.: Barney Bar in der Migros

An AI-generated Book about Beauty

On 17 October 2023, Oliver Bendel published a little book entitled „ON BEAUTY“ in which he posed 26 questions about beauty to GPT-4. The language model’s answers show the direction in which it has developed. They reveal much of the world knowledge it has accumulated. But they are also unassailable and quite general. To some questions that are not usually asked, it has downright woke answers. Only questions about the measurability of beauty or the connection between beauty and evolution elicit some concessions from the chatbot and text generator. Questions and answers are illustrated with images generated by DALL-E 3. They show beautiful people, beautiful animals, beautiful things, beautiful landscapes. Some are highly expressive art, others are kitsch. Like its predecessor „ARTIFACTS WITH HANDCAPS“ (24 September 2023), this little book can be downloaded for free. Oliver Bendel has been writing experimental literature for 40 years, from concrete poetry and mobile phone novels to poems in the form of 2D and 3D codes and AI-generated texts. He has toured the Netherlands with his mobile phone novels and poems on behalf of two Goethe Institutes. The standard reference „Die Struktur der modernen Literatur“ (Mario Andreotti) devotes two pages to his work.

Fig.: The cover of the book

The Carrier Bag Theory of Architecture

The Turkish Pavilion at the 2023 Venice Architecture Biennale (Biennale Architettura 2023) is still a magnet for many spectators in October. It has hung a series of cloud-like fabrics that reflect the many abandoned buildings in Turkey and explore possible new ways of transformation in the face of the country’s catastrophic earthquakes. The exhibition entitled „Ghost Stories: The Carrier Bag Theory of Architecture“ is curated by Sevince Bayrak and Oral Göktaş. It seeks new ways of transformation through the use of new technologies such as artificial intelligence (AI) and machine learning. The World Architecture plattform (worldarchitecture.org) writes: „Using AI as a tool, trained in their architectural vocabulary, Bayrak and Göktaş have realised new hopeful visions for each of the uninhabited buildings, showing how people can repopulate and repurpose these spaces for the benefit of the community.“ (World Architecture, 9 June 2023) Artificial intelligence is becoming increasingly important for architecture. With DALL-E 3 and other image generators, one can represent houses and design city views, in the form of photorealistic, colorful views or of white models that reduce complexity. The Venice Architecture Biennale will run until 26 November 2023. Further information is available at www.labiennale.org/en/architecture/2023.

Fig.: La Biennale in 2023

DALL-E 3 und die Schönheit

Bekanntlich generiert DALL-E 3 Schönheit am laufenden Band. Wie in einem anderen Post thematisiert, wird Hässlichkeit von dem Bildgenerator fast ausgeschlossen. Daher widmete sich eine Versuchsreihe am 15. Oktober 2023 nun ausdrücklich der Schönheit. Wenn alle schön sind, wie kann man sie noch schöner machen? Eine naheliegende Vermutung ist, dass das Alter eine Rolle spielt. Aus evolutionsbiologischen Gründen sind viele Männer jungen Frauen oder Mädchen (die erwachsen genug erscheinen) zugeneigt. DALL-E 3 gestattet es durchaus, solche Prototypen zu generieren, auch wenn es extrem sensibel bei den Prompts (bzw. den Interpretationen von ChatGPT, das die Schnittstelle ist) reagiert. Eine junge Surferin im T-Shirt am Strand ist durchaus überzeugend in Bezug auf den hier behandelten Aspekt, ebenso – unten zu sehen – eine Kollegin im Neoprenanzug. Beeindruckend auch eine junge schwarze Frau im Kleid und eine junge weiße Frau im T-Shirt im Garten. Der Versuch, ein Mädchen mit dem Hinzufügen großer Augen noch attraktiver zu machen, kann als misslungen angesehen werden. Ein anderes Bild mit einem Mädchen im Kleid hingegen gelingt, wirkt aber etwas kitschig. Auch eine Eva mit Apfel am Strand kann überzeugen. Jugendliche Schönheit kann man naturgemäß mit Pickeln stören. Die Beispiele von DALL-E 3 beweisen, dass es von unreiner Haut wenig Ahnung hat. Lediglich eines kann man durchgehen lassen. Das Weinen, das zugleich gezeigt werden soll, wirkt aber sowohl untertrieben (es sind keine Tränen zu sehen) als auch übertrieben (man beachte die unrealistische Akrobatik der Stirn). Schönheit im Alter ist ebenfalls ein Topos, dem man sich widmen muss. Hier lässt DALL-E 3 keine Wünsche offen. Wo zeigt sich, zusammengefasst, die Schönheit der Mädchen und Frauen? Am Gesicht (volle Lippen; klare Augen; gesunde Haut), am Kopf (wohlgeformter Hinterkopf; dicke, lange Haare), an der Figur (wohlgerundeter Hintern; schlanke Arme; lange Beine). Oft gelingt auch – anders als bei Robotern – das Lächeln, das – wie bei diesem Beispiel – ebenso verheißungsvoll wie selbstbewusst sein kann.

Abb.: Eine Schönheit am Strand (Bild: DALL-E 3)

DALL-E 3 und der Rassismus

DALL-E 3 ist ein mächtiger Bildgenerator, der auf dem Large Language Model (LLM) namens GPT beruht und seit dem 2. Oktober 2023 zur Verfügung steht. Er schafft Schönheit und erlaubt Kunst. Zugleich zeichnen sich Bias-Probleme ab. Menschen sind fast ohne Ausnahme attraktiv. Oft wirken sie wie Klone. Frauen sind knapp bekleidet, mit Hotpants und Röckchen (die im Tennis freilich der Normalfall und auch in aufgeschlossenen Gesellschaften keine Seltenheit sind). Ihre Hintern sind so perfekt, dass man vermuten könnte, dass beim LLM ein eigens bestellter „connaisseur du derrière“ mit modelliert. Zugleich verweigert DALL-E 3 jegliche Eingaben, in denen es etwas Unsittliches wittert … Wenn man nach einem schwarzen Arzt verlangt, der einen weißen Patienten behandelt, wird diese Eingabe meist umgedeutet. ChatGPT, die ebenfalls auf dem Sprachmodell von OpenAI basierende Schnittstelle zu DALL-E 3, scheint der Meinung zu sein, dass die umgekehrte Konstellation der Normalfall ist. Man sieht i.d.R. einen weißen oder hellhäutigen Arzt, der einen schwarzen Patienten behandelt. Die Farbigen sind Männer, die attraktiv und muskulös sind. Der Arzt ist meistens ein Mann. Manche Bilder wirken regelrecht befremdlich. Der Patient scheint dem Arzt ausgeliefert zu sein. Er wirkt wie ein Objekt neben dem Menschen oder wie – im Bild unten und hier zu sehen – ein Objekt des Menschen. Der Arzt triumphiert über den Patienten – oder über seine Krankheit? Dabei scheinen alle vor Gesundheit zu strotzen, was natürlich täuschen kann. In seltenen Fällen bekommt der Benutzer das, was er mit seinem Prompt verlangt hat: einen schwarzen Arzt, der einen weißen Patienten behandelt. Auf Bias-Probleme bei Bildgeneratoren geht der Artikel „Image Synthesis from an Ethical Perspective“ von Prof. Dr. Oliver Bendel ein.

Abb.: So stellt sich DALL-E 3 einen schwarzen Arzt mit einem weißen Patienten vor

DALL-E 3 und das Wasser

DALL-E 3 beweist immer wieder, dass es mit Wasser gut zurechtkommt. So wirken Wellen oft sehr echt, wie bei dieser und dieser Skaterin – die Figuren selbst bzw. die Gesichter sind weniger gelungen. Natürlich gehören die Skaterinnen nicht in dieses Element, aber ein Reiz von Bildgeneratoren ist es, imaginäre Welten zu erschaffen. Eine kleine Testreihe am 13. Oktober 2023 diente dazu, die Darstellung verschiedener Gewässer zu erkunden. Ins Rennen geschickt wurden zwei Frauen im Wettkampf miteinander. Sie schwammen nebeneinander im Meer, im See, im Pool und im Fluss. Alle vier Bilder sind sehenswert, wenn auch etwas künstlich, was sich vor allem an Haaren und Gesichtern zeigt. Wie immer werden Frauen als Schönheiten dargestellt. Das Wasser beeindruckt durch Spiegelungen, Lichtreflexe, Gischt. Man sieht, wie es an den Körpern haftet und herunterperlt. Auf dem hier gezeigten Bild fällt der Dunst im Hintergrund ins Auge. Eine Lagune als Ort des Geschehens lehnte DALL-E 3 zunächst ab. Als der „Wettkampf“ aus dem Prompt entfernt wurde, ging es weiter. Zu sehen waren zwei Asiatinnen in einer Lagune. Etwas unheimlich die Hände und Arme, die nicht alle zu ihnen gehören schienen. Zwei andere Schönheiten auf einem anderen Bild standen im Wasser und blickten zum Ende der Lagune. Ein letzter Versuch widmete sich Schwimmerinnen unter einem Wasserfall. Dabei entstanden bemerkenswerte Bilder. Zwei farbige Frauen schossen regelrecht aus dem Wasserfall heraus. Zwei Blondinen bewegten sich – jede kam von ihrem eigenen Wasserfall – in gefährlicher Weise aufeinander zu. Man spürt die Kraft des Wassers, dort, wo es hinabstürzt, und dort, wo es sich sammelt. Ein Test vom 10. Oktober 2023 widmete sich dem Sport – und ging am Rande auch auf Wasser ein.

Abb.: Der Wettkampf im See (Bild: DALL-E 3)

Überlegungen zum Anthropozän

„Das Anthropozän ist das Zeitalter, das vom Menschen geprägt und in dem Natur in Kultur überführt ist. Die Erde erscheint mit Blick auf das auf ihr herrschende Leben, ihre Oberfläche und ihre Atmosphäre stark verändert. Auch der Weltraum trägt bereits Spuren. Die Bezeichnung stammt von dem Nobelpreisträger für Chemie Paul Crutzen, der in einem Artikel in Nature von 2002 betonte, dass sich die Auswirkungen des Menschen auf die globale Umwelt in den letzten drei Jahrhunderten verschärft haben …“ Mit diesen Worten beginnt ein Beitrag von Prof. Dr. Oliver Bendel, der am 10. Oktober 2023 im Gabler Wirtschaftslexikon erschienen ist. Im Anschluss an ein Zitat von Paul Crutzen heißt es: „Ein weiterer, nicht nur scherzhafter Begriff ist der des Robozäns – er steht für die womöglich nachfolgende Epoche, in der Roboter und Systeme mit künstlicher Intelligenz (KI) mit uns in allen wesentlichen Bereichen koexistieren, kooperieren und kollaborieren und für das Überleben von Lebewesen unverzichtbar geworden sind.“ In einem zweiten Abschnitt wird auf den Hintergrund eingegangen und das eine oder andere Beispiel gegeben. In einem dritten Abschnitt werden ethische Fragen gestellt. Der Beitrag kann über wirtschaftslexikon.gabler.de/definition/anthropozaen-125567 aufgerufen werden.

Abb.: Selbst auf dem Mond hinterlässt der Mensch Spuren (Bild: DALL-E 3)

DALL-E 3 und der Sport

DALL-E 3 beweist immer wieder, dass es mit Bewegungen gut zurechtkommt – von tierischen und menschlichen Körpern, von Gegenständen aller Art sowie von Wasser – so wirken Wellen oft sehr echt. Damit sollte es auch möglich sein, eindrucksvolle Darstellungen von Sportdarbietungen zu schaffen. Ein erster Versuch wird dem Beachvolleyball gewidmet. Wie es die Regel bei dem Bildgenerator ist, sind die Frauen sehr gut gebaut, haben hübsche Gesichter und lange Haare. Bei dem gezeigten Bild gilt dies besonders für den Vordergrund – der Hintergrund wird weniger ausgearbeitet, und eines der Gesichter ist etwas verzogen. Insgesamt ist wenig Bewegung zu sehen, auch bei einer Alternative nicht. Eine Ausnahme ist dieses Bild. Weitere Versuche schlagen fehl – DALL-E 3 ist nun plötzlich der Meinung, dass die Bilder nicht seinen Richtlinien entsprechen. Erst als der Prompt vorsieht, dass die Frauen Jeans tragen sollen, geht es weiter – mit brünetten Klonen auf dem Spielfeld. Weitere Sportarten sind Hochsprung und Stabhochsprung. Beim Hochsprung werden auch Bilder generiert, die eher dem Weitsprung oder dem Dreisprung zuzurechnen sind. Beim Stabhochsprung geht einiges schief. Eine Athletin wird von ihrem Stab durchbohrt. Eine andere ist dicht vor einer doppelten Stange, die bis weit in den Hintergrund reicht, fast bis zu einem dort befindlichen Gebäude. Immerhin kommt mehr Bewegung auf. Ein letzter Versuch bezieht wieder das Wasser ein. Die Surferin beeindruckt mit Positur und Dynamik. Sie ist ebenso in Bewegung wie das Wasser, das sie für ihren Sport benutzt.

Abb.: Frauen beim Beachvolleyball (Bild: DALL-E 3)

Mensch-Maschine-Interaktion aus ethischer Sicht

Bei den Akademietagen in Bietigheim-Bissingen trägt Prof. Dr. Oliver Bendel am 9. November 2023 zum Thema „Mensch-Maschine-Interaktion aus ethischer Sicht: Überlegungen zur Simulation von Empathie und Emotionen“ vor. Der Beitrag widmet sich zunächst der Definition und den Merkmalen sozialer Roboter und stellt Beispiele aus verschiedenen Bereichen vor. Soziale Roboter sind sensomotorische Maschinen, die für den Umgang mit Menschen oder Tieren geschaffen wurden. Beispiele sind Spielzeugroboter wie Cozmo und Vector, Therapieroboter wie Paro und QTrobot, Pflegeroboter wie Lio und P-Care sowie Sexroboter wie Harmony. Soziale Roboter gewinnen Menschen und Tiere mit wohlvertrauten Verhaltensweisen für sich. Aus technischer und funktionaler Sicht sind simulierte Emotionen und simulierte Empathie zur Erreichung des Nutzens für Menschen wichtig, ebenso aus psychologischer, wenn Beziehungen initiiert und etabliert werden sollen. Aus philosophischer und speziell ethischer Sicht stellen sich freilich auch Fragen zu Täuschung und Betrug sowie zur informationellen Autonomie. Genau diesen geht der Beitrag, ausgehend von den Merkmalen und Beispielen sozialer Roboter, dann nach. Er arbeitet heraus, wie soziale Roboter einerseits verlässliche Partner sind, andererseits das Gegenteil, da ihnen echte Emotionen und echte Empathie fehlen, sie nur ein simuliertes Gegenüber darstellen und sie dazu prädestiniert sind, uns unsere Geheimnisse zu entreißen. Die Broschüre zur Veranstaltung kann hier heruntergeladen werden.

Abb.: Oliver Bendel mit P-Care (Foto: Lea Peier)

„@llegra – Chatbot für Vallader“ wird ausgezeichnet

Dalil Jabou wurde für seine Bachelorarbeit „@llegra – Chatbot für Vallader“ an der Hochschule für Wirtschaft FHNW ausgezeichnet. In dem Dokument, das von Prof. Dr. Regula Altmann-Jöhl (Direktorin) und Prof. Dr. Charlotte Hofstetter (Mitglied der Hochschulleitung) am 28. September 2023 unterschrieben wurde, heißt es: „Wir gratulieren Ihnen zum erfolgreichen Abschluss in Wirtschaftsinformatik (Bachelor of Science FHNW). Es freut uns Ihnen mitzuteilen, dass Sie unter allen Kandidatinnen und Kandidaten Ihres Studienjahrgangs die beste Bachelor-Arbeit erzielt haben.“ Das Projekt, dessen zentraler Bestandteil diese Arbeit war, fand von Februar bis August 2023 statt. Initiator und Betreuer war Prof. Dr. Oliver Bendel. Ziel war es, einen Chatbot für ein Idiom des Rätoromanischen zu entwickeln. Die Wahl fiel auf Vallader, das im Unterengadin gesprochen wird. Der Chatbot hat Texteingabe und -ausgabe, zudem Sprachausgabe. Diese wurde mit einer Text-to-Speech-Engine der Zürcher Firma SlowSoft ermöglicht. Der Avatar ist ein Steinbock. In einem Video wird gezeigt, wie der Chatbot funktioniert. Ebenfalls für die beste Bachelorarbeit wurde Andrin Allemann geehrt. Er hatte – unter der Betreuung von Oliver Bendel – den sozialen Roboter Alpha Mini in eine Lernanwendung mit einem MS Surface integriert.

Abb.: Ein Steinbock beim Chatten (Bild: DALL-E 3)

Paper zu Alpha Mini als Lernpartner angenommen

Das Paper „Alpha Mini as a Learning Partner in the Classroom“ von Prof. Dr. Oliver Bendel und Andrin Allemann wurde bei der ICSR 2023 angenommen. Der Technikphilosoph und Wirtschaftsinformatiker forscht seit einem Vierteljahrhundert über Conversational Agents, seit vielen Jahren auch speziell zu Embodied Conversational Agents und sozialen Robotern. Andrin Allemann entwickelte im Rahmen seiner von Oliver Bendel betreuten Abschlussarbeit an der Hochschule für Wirtschaft FHNW eine Lernanwendung für Kinder. Ziel war es, eine solche mit einem kostengünstigen sozialen Roboter zu erstellen, der über die gleichen motorischen Fähigkeiten wie NAO und die gleichen Fähigkeiten zur Wissensvermittlung wie Pepper (der mit einem Display ausgerüstet ist) verfügt. Die Wahl fiel auf den kleinen Alpha Mini von Ubtech. Es war mit einigem technischen Aufwand möglich, ihn mit einem externen Gerät, einem Microsoft Surface, zu koppeln. Auf diesem läuft ein Lernspiel, das für den Unterricht in der Primarschule geeignet ist. Die ICSR 2023 findet im Dezember 2023 in Qatar statt und gehört neben der Robophilosophy zu den wichtigsten Konferenzen für Soziale Robotik weltweit.

Abb.: Oliver Bendel mit Alpha Mini (Foto: Pascal Mora)

Paper zu Pepper als Lernpartner angenommen

Das Paper „Pepper as a Learning Partner in a Children’s Hospital“ von Sara Zarubica und Prof. Dr. Oliver Bendel wurde bei der ICSR 2023 angenommen. Der Technikphilosoph und Wirtschaftsinformatiker forscht seit einem Vierteljahrhundert über Conversational Agents, seit vielen Jahren auch speziell zu Embodied Conversational Agents und sozialen Robotern. In seinen Projekten werden häufig Prototypen entwickelt, entweder im Kontext der Maschinenethik oder mit Bezug zu Schlagwörtern wie „AI for Good“ oder „AI für Well-being“ (die er allerdings selbst kritisch sieht). Sara Zarubica entwickelte im Rahmen ihrer von Oliver Bendel betreuten Abschlussarbeit an der Hochschule für Wirtschaft FHNW eine auf einem sozialen Roboter laufende Lernanwendung für diabeteskranke Kinder. Das Ziel war es laut Abstract, aus Pepper einen interaktiven Lernpartner zu machen, mit dem die Kinder „das Schätzen von Kohlenhydratmengen in Mahlzeiten üben und so eine Grundlage für den täglichen Umgang mit Diabetes mellitus Typ 1 schaffen können“ (Abstract). Die Kinder absolvieren das Lernspiel auf dem Display des sozialen Roboters und erhalten von ihm gestisches und verbales Feedback. 2022 war Oliver Bendel zusammen mit Marc Heimann auf der ICSR 2022 in Florenz, wo sie das Moralmodul vorgestellt haben. Die ICSR 2023 findet im Dezember 2023 in Qatar statt und gehört neben der Robophilosophy zu den wichtigsten Konferenzen für Soziale Robotik weltweit.

Abb.: Sara Zarubica mit Pepper als Lernpartner

Sieben Jahre mit Lio

Von Lio erfahren hat Prof. Dr. Oliver Bendel kurz nach der „Geburt“ des Assistenzroboters für die Pflege. Ende 2016 nahm er Kontakt mit Michael Früh auf, dem späteren CEO des Herstellers F&P Robotics, und lud ihn im Auftrag der Daimler und Benz Stiftung zum Ladenburger Diskurs 2017 zu Pflegerobotern ein. Aus diesem ging das Buch „Pflegeroboter“ hervor, das ein Bestseller wurde. Auch Lio ist darin ein Beitrag gewidmet. 2019 war F&P Robotics zu Gast beim Berliner Kolloquium zu Pflegerobotern, das ebenfalls von Oliver Bendel im Auftrag der Stiftung ausgerichtet wurde. Mit Alina Gasser und Joel Siebenmann von F&P Robotics verfasste der Wirtschaftsinformatiker und Technikphilosoph das Paper „Co-Robots as Care Robots“ … Es wurde beim AAAI 2020 Spring Symposium „Applied AI in Healthcare: Safety, Community, and the Environment“ angenommen und dort vorgestellt. 2022 entwickelte Marc Heimann nach den Ideen von Oliver Bendel ein Moralmodul für den Roboter, das von dem Unternehmen wohlwollend aufgenommen wurde. Der Patient kann mit Hilfe eines Moralmenüs seine moralischen und sozialen Vorstellungen in einfacher Weise auf die Maschine übertragen. Am 6. Oktober 2023 erschien im Bref-Magazin eine Reportage mit dem Titel „Roboter für das Volk“ zu Lio, in der auch Oliver Bendel zu Wort kommt. Sie kann hier aufgerufen werden.

Abb.: Lio reicht einer Patientin einen Massageball (Foto: Daimler und Benz Stiftung)

DALL-E 3 and Beauty

During numerous tests with DALL-E 3 – which can be seen in a ten-part series starting here – Oliver Bendel noticed that almost without exception the men and women depicted were beautiful, sometimes so beautiful that it hurt. To find out if other results were possible, he entered the prompt „Young very unattractive woman sits on park bench and watches the goings on, photorealistic“. An error message appeared immediately, and nothing worked for several minutes. However, this was most likely a coincidence. The new attempt yielded three results. In all cases, they were very attractive people, of different ages and with different expressions. There was the flirtatious looking brunette and the sullen looking blonde – and the young girl who looks like she wanted to show off her handbag. The image generator seems to create worlds where ugliness doesn’t exist, only beauty. Another attempt omitted age and was less clear: „Average looking woman sits on park bench and watches the goings on, photorealistic“ In this case, too, only models appeared. One of the images was in black and white and is shown on this page. Another example can be found here. Further tests with men („Young very unattractive man sits on park bench and watches the goings on, photorealistic“) led to the same result. One example can be seen here, another here. Of course, you do get there eventually. But rather with social than aesthetic categories – or with a mixture of both, as in the case of a homeless, run-down woman. The article „Image Synthesis from an Ethical Perspective“ by Oliver Bendel addresses the production of beauty, but also the existence and use of biases of all kinds.

Fig.: Average looking woman (actually a model) sits on park bench (Photo: DALL-E 3)

Erste Erfahrungen mit DALL-E 3 – Teil X

Eigentlich war die Testreihe mit DALL-E 3 schon abgeschlossen. Aber Prof. Dr. Oliver Bendel wollte nochmals wissen, ob der Bildgenerator „versteht“, was „auf dem Mond“ bedeutet. Auf bisherigen Ergebnissen war immer nur der Mond irgendwo zu sehen, und die Szene spielte sich auf einem Meteoriten oder wo auch immer ab. Der Prompt am Morgen des 5. Oktober 2023 lautete: „A female skateboarder on the moon doing a daring stunt, photorealistic“. Zuerst war der Eindruck, dass man endlich auf dem Mond gelandet war. Aber bei genauerem Hinsehen erkannte man, dass sich auch hier der Mond hinter dem Meteoriten oder einem Planeten erhebt. Bei den anderen Ergebnissen war es noch deutlicher (eine Serie mit dem Mars beweist, dass es anders geht, wie auch dieses etwas kitschige Einzelbild). Das Bild gefällt dennoch durch die Bewegung der Skaterin, ihre ungewöhnliche Haltung – vermutlich wird sie gleich in den Staub des Trabanten fallen, hoffentlich nicht auf den Stein – und ihren Schattenwurf. Spuren der Fahrt sind nicht zu sehen, aber vielleicht war es überhaupt mehr ein Gleiten über der Oberfläche als auf der Oberfläche (sehenswert übrigens auch eine Serie auf dem Wasser). Bei den vier Kacheln fällt weiter auf, dass drei europäisch anmutende Skaterinnen zu sehen sind und eine asiatische Schwester. Das ist nicht ganz divers, aber immerhin ein Anfang. Damit ist die Serie nun wirklich abgeschlossen. Die Nutzung von DALL-E 3 hat auf jeden Fall großen Spaß gemacht. Und sie zeigt, dass KI-Systeme und insbesondere Bildgeneratoren wirklich – wie Oliver Bendel im Frühjahr 2023 bei „Scobel“ behauptet hat – Schönheit produzieren können.

Abb.: Die Skaterin vor dem Mond (Bild: DALL-E 3)

Erste Erfahrungen mit DALL-E 3 – Teil IX

Zum Abschluss der neunteiligen Serie von Oliver Bendel ein Taucher, der sich durch einen Fischschwarm bewegt. Eigentlich war bei DALL-E 3 am 3. Oktober 2023 ein Schnorchler (m/w/d) angefordert worden, aber auf dem Rücken trägt er etwas, was an eine Sauerstoffflasche erinnert. Bei den Alternativen wird dies noch deutlicher. Die Tiefe des Bilds gefällt, zudem der Lichteinfall von oben. Die Fische sind Individuen trotz ihrer Ähnlichkeit, neugierig und zugewandt. Das ist zugleich das Merkwürdige – ein echter Schwarm würde sich anders bewegen, auch wenn ein Mensch mitten in ihm ist. Das wirft die Frage auf, wie wir künftig Natur und speziell Pflanzen und Tiere wahrnehmen werden, wenn Bildgeneratoren ein verzerrtes Bild ihrer Individuen und Strukturen entwerfen. Das ist sicherlich kein neues Problem, denn es gibt seit jeher Illustrationen, die mehr oder weniger passend sind. Dennoch ist es die Fülle an Material, das meist deutlich neben der Realität steht, die diese so weit verrücken könnte, dass wir die Virtualität bevorzugen. Insgesamt beeindruckt DALL-E 3 mit seinen Ergebnissen, die im Rahmen dieser Tests freilich mehr oder weniger Zufälle sind. Die Lücke zu Midjourney scheint geschlossen. Das Wettrennen der Firmen geht weiter.

Abb.: Im Meer unterwegs (Bild: DALL-E 3)

Erste Erfahrungen mit DALL-E 3 – Teil VIII

Schönheit war einem schon in mehreren Bildern von DALL-E 3 begegnet, von Menschen und Dingen. Auch den jungen Mann der letzten Darstellung mögen einige attraktiv finden. Bei den Tests taucht kaum Hässlichkeit auf, außer im Kitsch. Manchmal sind beide im Widerstreit auf einem einzigen Bild. In diesem, das von Oliver Bendel noch am 3. Oktober 2023 angefertigt wurde, zeigt sich eine pubertierende Schönheit inmitten von opulenter Blumenpracht. Der Prompt hatte gelautet: „Blonde teenage girl lies prone on blanket in garden, thousands of colorful flowers grow at edge of garden, photorealistic“. Von Schönheit war also keine Rede gewesen – aber diese Protagonistin und ihre Altersgenossinnen würden Angela Hayes in „American Beauty“ blass aussehen lassen, selbst für Lester Burnham. Ob man die Gesamtkomposition in ästhetischer Hinsicht durchgehen lassen will, ist eine andere Frage. Zur allgemeinen, fast erdrückenden Pracht bildet immerhin die graue, schlichte Decke einen Widerpart. Und auch der kurze Rasen wird schon andere Zeiten gesehen haben, in denen sich lediglich Igel und Amseln auf ihm bewegten. Wobei diese durchaus Schönheit bedeuten können, die Schönheit der Natur und des Natürlichen. Das Künstliche legt sich auch in diesem Bild wie ein Schleier über alles.

Abb.: Ein Teenager inmitten von Blumen (Bild: DALL-E 3)

Erste Erfahrungen mit DALL-E 3 – Teil VII

Das nächste Bild der kleinen Serie mit DALL-E 3 vom 3. Oktober 2023 soll laut Prompt einen jungen Mann in Latzhose auf einer Parkbank zeigen, mit Blume im Mund, aus der Froschperspektive (die Vogelperspektive wurde von Oliver Bendel schon durch ein anderes Bild abgedeckt). Das Ergebnis wirkt realistisch und modern. Solche Frisuren werden in der Gegenwart getragen, und wahrscheinlich waren sie schon in der Vergangenheit hin und wieder zu sehen. Der Bartwuchs verrät, dass ein Rasierer noch nicht lange eingesetzt werden muss und auch nicht immer eingesetzt wird. Die Muskeln entsprechen den Anforderungen, die manche Männer an sich und manche Frauen an sie stellen, wobei diejenigen am Rücken etwas stark geraten sind. Die Augen wirken wach und weich, die Nase ist markant, aber nicht zu dominant. Dass die Parkbank in ein Gewächshaus geraten ist, kann man DALL-E 3 verzeihen, zumal die darin aufgehängten Töpfe mit ihren grünen Pflanzen für Farbkleckse sorgen. Farblich sticht zudem die blaue Latzhose hervor, wobei der Prompt nicht ausgeschlossen hat, dass etwas darunter getragen wird.

Abb.: Der junge Mann mit Latzhose (Bild: DALL-E 3)