Die Prominenz von Qatar bei der Posterpräsentation

Am 3. Dezember 2023 fand an der Qatar University das Grand Opening der ICSR statt. Diese gehört neben der Robophilosophy zu den wichtigsten Konferenzen für Soziale Robotik weltweit. Die Prominenz aus Politik und Wissenschaft von Qatar besuchte nach dem Grand Opening nicht nur die Messe mit ihren zahlreichen Robotern, sondern auch die Posterpräsentation, die für diesen Zweck von zentraler Stelle vorbereitet worden war. Die Poster sind neben den Vorträgen das wesentliche Element der ICSR. Sie werden durchgehend hängen und am 5. und 6. Dezember von den Verantwortlichen erklärt. Im Bild ist das Poster von Sara Zarubica und Prof. Dr. Oliver Bendel zu sehen. Gegenstand ist das Projekt „Pepper as a Learning Partner in a Children’s Hospital“. Das gleichnamige Paper ist in dem Proceedingsband „Social Robotics, 15th International Conference, ICSR 2023, Doha, Qatar, December 3-7, 2023, Proceedings, Part II“ bei Springer erschienen. Das Programm der Konferenz kann hier heruntergeladen werden. Weitere Informationen über icsr23.qa.

Abb.: Das Poster vor dem Besuch der Prominenz

Soziale Roboter bei der ICSR 2023

Die 15th International Conference on Social Robotics (ICSR 2023) findet vom 3. bis 7. Dezember 2023 in Qatar statt. Sie wurde am 3. Dezember 2023 – zusammen mit zwei anderen Konferenzen – unter der Anwesenheit von Prominenz aus Politik und Wissenschaft feierlich eröffnet. Sie steht unter der Schirmherrschaft des Premierministers und Außenministers, Sheikh Mohammed bin Abdulrahman bin Jassim Al Thani. Nach dem Grand Opening an der Qatar University fand eine Messe mit sozialen Robotern wie Einstein, NAO, Navel, Furhat und Paro statt. Daneben bewegten sich Reinigungsroboter durch die Gegend, eine Drohne flog in einem Gehege herum, und ein Spielzeugroboter von Ubtech gab eine Tanzeinlage. Das Programm der Konferenz kann hier heruntergeladen werden. Weitere Informationen über icsr23.qa.

Abb.: Der Furhat-Roboter schaut sich um

Working Paper zu @ve, einem Chatbot für Latein

Im Jahre 2022 wurde das Projekt @ve durchgeführt. Der Chatbot läuft auf der Website www.ave-bot.ch und auf Telegram. Er basiert auf GPT-3.0 von OpenAI, also auf einer älteren Version des Sprachmodells. Initiiert hat das Projekt Prof. Dr. Oliver Bendel, der sich verstärkt toten, ausgestorbenen und gefährdeten Sprachen widmet. Entwickelt wurde @ve von Karim N’diaye, der an der Hochschule für Wirtschaft FHNW Wirtschaftsinformatik studiert hat. Man kann sich mit ihr auf Lateinisch unterhalten, also in einer toten Sprache, die dadurch gewissermaßen lebendig wird, und ihr Fragen zur Grammatik stellen. Getestet wurde sie von einer einschlägigen Expertin. Ein Nutzen besteht laut Karim N’diaye darin, dass man rund um die Uhr auf Latein kommunizieren kann und dabei überlegen muss, was und wie man schreibt. Eine Gefahr sei, dass immer wieder Fehler in den Antworten enthalten sind. So ist zuweilen die Wortreihenfolge nicht korrekt. Zudem kann es sein, dass der Sinn verdreht wird. Dies kann bei einem menschlichen Lehrer freilich auch passieren, und der Lernende sollte in jedem Falle wachsam sein und nach Fehlern suchen. Ohne Zweifel ist @ve ein Tool, das mit Gewinn in den Lateinunterricht integriert werden kann. Dort können die Schüler berichten, was sie mit ihr zu Hause erlebt haben, und sie können mit ihr vor Ort alleine oder in der Gruppe, vom Lehrer begleitet, einen Schwatz halten. Seit Ende November 2023 liegt ein Working Paper mit dem Titel „@ve: A Chatbot for Latin“ vor. Es wurde bereits im Sommer verfasst. Der Chatbot läuft voraussichtlich noch bis Ende des Jahres.

Abb.: So sieht DALL-E 3 den Chatbot

Social Robotics Girl ist eine Expertin auf ihrem Gebiet

Am 6. November 2023 stellte OpenAI sogenannte GPTs für ChatGPT-Plus-Nutzer zur Verfügung. Laut dem US-amerikanischen Unternehmen kann jeder ganz einfach und ohne Programmierkenntnisse sein eigenes GPT erstellen. Erste Tests haben die Leistungsfähigkeit der neuen Funktion gezeigt. ChatGPT schlägt einen Namen für den Chatbot vor, erstellt das Profilbild und nimmt Dokumente mit Text und Literaturlisten entgegen, um sein Wissen über das Thema zu erweitern. Ideal ist die Funktion etwa dafür, eigene Learning Companions zu erstellen, sozusagen moderne pädagogische Agenten. Aber auch von Chatbots anderer Benutzer und Anbieter kann man profitieren. Seit dem 12. November 2023 ist ein GPT namens Social Robotics Girl verfügbar, das Informationen über Soziale Robotik liefert. Es wurde von Prof. Dr. Oliver Bendel erstellt und speist sich aus einer Sammlung seiner Artikel zu diesem Thema. Daher kann es etwa seine Definition sozialer Roboter nennen und Einteilungen anhand seines Fünf-Dimensionen-Modells vornehmen. ChatGPT-Plus-Nutzer können Social Robotics Girl über chat.openai.com/g/g-TbhZSZaer-social-robotics-girl aufrufen.

Abb.: Das Social Robotics Girl

Preisgeld beim BWKI 2023 für Igelretter

Sebastian Albert ging laut einer Meldung von idw-online beim Bundeswettbewerb Künstliche Intelligenz (BWKI) als Sieger in der Sonderkategorie „Hardware“ hervor. „Angetreten als ‚Igelretter‘, entwickelte der 20-Jährige aus March bei Freiburg einen Algorithmus, der mit Hilfe eines Aufsatzes am Mähroboter Igel erkennt und diesen ausweicht. Er schützt sie so vor dem qualvollen Tod. Ausgezeichnet wurde das Projekt mit einem Geldpreis in Höhe von 750 Euro.“ (iwd-online, 13. November 2023) Damit hat der Nachwuchsforscher ein Projekt wiederholt, das Prof. Dr. Oliver Bendel von August 2019 bis Januar 2020 mit einem Team von drei Studenten und einer Studentin im Kontext der Maschinenethik durchführte. Der Wirtschaftsinformatiker und Technikphilosoph aus Zürich verfasste nach Abschluss zusammen mit Emanuel Graf und Kevin Bollier das Paper „The HAPPY HEDGEHOG Project“ und präsentierte es zusammen mit Emanuel Graf bei den AAAI 2021 Spring Symposia. Der Prototyp eines Mähroboters benutzt eine Wärmebildkamera und Machine Learning. Im ersten Schritt untersucht er seine Umgebung auf warme Objekte in einem bestimmten Temperaturbereich. Wenn er etwas gefunden hat, was zu einem Lebewesen passt, leitet er nähere Untersuchungen ein. Zu diesem Zweck wurde er mit Igelbildern trainiert. Stellt er fest, dass es sich um ein solches Tier handelt, unterbricht er seine Arbeit. HAPPY HEDGEHOG inspiriert seit seiner Erfindung Firmen und Forscher. Mehrere Medien haben seit 2021 über den tierfreundlichen Mähroboter berichtet, etwa der Beobachter und das Magazin der Schweizer Tierschutzes. Die Stuttgarter Zeitung berichtete am 8. November 2023 über den BWKI und erwähnte dabei auch das Original aus der Schweiz.

Abb.: Ein Igel mit einem Mähroboter (Bild: DALL-E 3)

GPTs are Chatbots for Everyone

On 6 November 2023, OpenAI made so-called GPTs available for ChatGPT Plus users. „GPTs are a new way for anyone to create a tailored version of ChatGPT to be more helpful in their daily life, at specific tasks, at work, or at home – and then share that creation with others. For example, GPTs can help you learn the rules to any board game, help teach your kids math, or design stickers.“ (Blogpost OpenAI, 6 November 2023) According to OpenAI, anyone can easily build their own GPT, without any programming skills. „You can make them for yourself, just for your company’s internal use, or for everyone. Creating one is as easy as starting a conversation, giving it instructions and extra knowledge, and picking what it can do, like searching the web, making images or analyzing data.“ (Blogpost OpenAI, 6 November 2023) Early tests have shown the power of the new feature. ChatGPT suggests a name for the Chatbot, creates the profile picture, and accepts documents with text and literature lists to expand its knowledge of the topic. Since 12 November 2023, a new GPT named Social Robotics Girl is available that provides information about social robotics. It was created by Oliver Bendel and fed by a collection of his articles on the topic. Learn more about GPTs at openai.com/blog/introducing-gpts.

Fig.: A user with her own GPT chatbot (Image: DALL-E 3)

A Non-invasive Neural Device for Lucid Dreaming

A start-up promises that lucid dreaming will soon be possible for everyone. This was reported by the German magazine Golem on November 10, 2023. The company is Prophetic by Eric Wollberg (CEO) and Wesley Louis Berry III (CTO). In a lucid dream, the dreamers are aware that they are dreaming. They can shape the dream according to their will and also exit the dream. Everyone has the ability to experience lucid dreams. One can learn to induce this form of dreaming, but one can also have this form of dreaming as a child and unlearn it again as an adult. The Halo headband, a non-invasive neural device, is designed to make lucid dreaming possible. „The combination of ultrasound and machine learning models (created using EEG & fMRI data) allows us to detect when dreamers are in REM to induce and stabilize lucid dreams.“ (Website Prophetic) According to Golem, the neuronal device will be available starting in 2025.

Fig.: A woman with a lucid dream (Image: DALL-E 3)

Be My AI Changes the World of Blind People

Be My AI is a GPT-4-based extension of the Be My Eyes app. Blind users take a photo of their surroundings or an object and then receive detailed descriptions, which are spoken in a synthesized voice. They can also ask further questions about details and contexts. Be My AI can be used in a variety of situations, including reading labels, translating text, setting up appliances, organizing clothing, and understanding the beauty of a landscape. It also offers written responses in 29 languages, making it accessible to a wider audience. While the app has its advantages, it’s not a replacement for essential mobility aids such as white canes or guide dogs. Users are encouraged to provide feedback to help improve the app as it continues to evolve. The app will become even more powerful when it starts to analyze videos instead of photos. This will allow the blind person to move through his or her environment and receive constant descriptions and assessments of moving objects and changing situations. More information is available at www.bemyeyes.com/blog/announcing-be-my-ai.

Fig.: A blind man uses the app (Image: DALL-E 3)

Guardiandog, der Heimwegbegleiter

Im Wahlmodul „Soziale Roboter“ von Prof. Dr. Oliver Bendel wurden von den Studenten und Studentinnen in Gruppenarbeiten sechs soziale Roboter bzw. Serviceroboter mit sozialen Merkmalen konzipiert, wobei sie zur Beschreibung das Fünf-Dimensionen-Modell von Oliver Bendel und zur Illustrierung verschiedene Bildgeneratoren wie DALL-E 3 und Gencraft benutzten. Die Gruppe, die aus Marius Stoll, Haqif Hodai, Mohamad Abouhajieh, Christian Fischer und Ajeeththa Selvaratnam bestand, kreierte den Guardiandog als Heimwegbegleiter. Der Roboter kann wie ein Robotertaxi gerufen werden und begleitet und schützt eine Person. Diese kann mit Codewords bestimmte Aktionen auslösen, etwa einen Angriff. Zudem hat der Roboterhund autonome Funktionen. Mit anderen Hunden beherrscht er eine friedliche Interaktion. Das Wahlmodul fand vom 6. bis zum 8. November 2023 am Campus Olten der Hochschule für Wirtschaft FHNW statt. Die ca. 30 Studenten und Studentinnen stammten mehrheitlich aus dem Studiengang Wirtschaftsinformatik.

Abb.: Guardiandog, der Heimwegbegleiter (Bild: DALL-E 3)

Recycloprime

Im Wahlmodul „Soziale Roboter“ von Prof. Dr. Oliver Bendel wurden von den Studenten und Studentinnen in Gruppenarbeiten sechs soziale Roboter bzw. Serviceroboter mit sozialen Merkmalen konzipiert, wobei sie zur Beschreibung das Fünf-Dimensionen-Modell von Oliver Bendel und zur Illustrierung verschiedene Bildgeneratoren wie DALL-E 3 und Gencraft benutzten. Die Gruppe, die aus Angelo Ramos, Julian Schifferle Julian, Milena Zemp, Ricardo Weiss und Nick Zbinden bestand, kreierte den Recycloprime. Der Roboter reinigt die Umwelt und recycelt das Plastik. Er besitzt große Augen, die mit Gesichtserkennung und Wärmebildkamera ausgestattet sind, kann Tierlaute imitieren und ist schonend im Umgang mit der Natur. Er besitzt Antennen, um Daten an die Zentrale zu übermitteln. Das Wahlmodul fand vom 6. bis zum 8. November 2023 am Campus Olten der Hochschule für Wirtschaft FHNW statt. Die ca. 30 Studenten und Studentinnen stammten mehrheitlich aus dem Studiengang Wirtschaftsinformatik.

Abb.: Recycloprime in Aktion

Ranger Dog Robot

Im Wahlmodul „Soziale Roboter“ von Prof. Dr. Oliver Bendel wurden von den Studenten und Studentinnen in Gruppenarbeiten sechs soziale Roboter bzw. Serviceroboter mit sozialen Merkmalen konzipiert, wobei sie zur Beschreibung das Fünf-Dimensionen-Modell von Oliver Bendel und zur Illustrierung verschiedene Bildgeneratoren wie DALL-E 3 und Gencraft benutzten. Die Gruppe, zu der Lehkdup Shöntsang, Waikin Thi, Bojan Stojkovic, Andrija Pejcinovic, Olivier Kleiner und Tamara Zivanovic zählten, kreierte den Ranger Dog Robot. Dieser ist an den Wald angepasst und kann auch schwieriges Gelände bewältigen. Er kann Tiere und Pflanzen (auch invasive Arten) erkennen, Arten zählen und Proben entnehmen. Er wird gezielt zur Erhaltung der Biodiversität eingesetzt. Das Wahlmodul fand vom 6. bis zum 8. November 2023 am Campus Olten der Hochschule für Wirtschaft FHNW statt. Die ca. 30 Studenten und Studentinnen stammten mehrheitlich aus dem Studiengang Wirtschaftsinformatik.

Abb.: Der Ranger Dog Robot (Bild: DALL-E 3)

WashMate, eine Revolution im Haushalt

Im Wahlmodul „Soziale Roboter“ von Prof. Dr. Oliver Bendel wurden von den Studenten und Studentinnen in Gruppenarbeiten sechs soziale Roboter bzw. Serviceroboter mit sozialen Merkmalen konzipiert, wobei sie zur Beschreibung das Fünf-Dimensionen-Modell von Oliver Bendel und zur Illustrierung verschiedene Bildgeneratoren wie DALL-E 3 und Gencraft benutzten. Die Gruppe, die aus Florian Maurer, Philipp Chappuis, Lukas Schütz und Linda Peita bestand, kreierte WashMate, eine „Revolution im Haushalt“. Der Roboter kann in der Luxusversion (Ultra) Wäsche waschen, bügeln, dampfbügeln, falten, einräumen und sortieren. Er verfügt über Materialerkennung und ist 30 % schneller als die günstigeren Modelle Light und Pro. Das Logo für die Marke wurde mit Hilfe von Ideogram generiert. Das Wahlmodul fand vom 6. bis zum 8. November 2023 am Campus Olten der Hochschule für Wirtschaft FHNW statt. Die ca. 30 Studenten und Studentinnen stammten mehrheitlich aus dem Studiengang Wirtschaftsinformatik.

Abb.: Die Illustration zu WashMate (Bild: DALL-E 3)

Boston Dynamics kommt nach Zürich

Boston Dynamics will eine Niederlassung in Zürich eröffnen, wie mehrere Medien am 7. November 2023 meldeten. Das Unternehmen, das mehrheitlich zu Hyundai gehört, ist bekannt für seine Roboter Atlas und Spot. Im Innovation Lab der Polizei Nordrhein-Westfalen testet man seit einer Weile den Einsatz von Spot. Dieser erkundete u.a. ein ausgebranntes Haus in Essen. Mit Spot experimentiert auch die New Yorker Polizei, was immer wieder für Diskussionen sorgt. Baden-Württemberg („The Länd“) hat im Frühjahr dieses Jahres nachgezogen. In der Schweiz ist die Polizei noch skeptisch gegenüber Robotern dieser Art. Man setzt auf ferngesteuerte Drohnen (etwa zur Überwachung von Demonstrationen) und auf ferngesteuerte Spreng- und Räumroboter. Es eröffnen sich aber in der Eidgenossenschaft viele andere Anwendungsmöglichkeiten, etwa in der Logistik. Grundsätzlich wird die Niederlassung – es handelt sich um das Boston Dynamics AI Institute – wohl dazu dienen, Fachkräfte vor Ort anzuziehen. Womöglich ist auch ein Showroom für die Roboter geplant, die in Videos immer wieder für Aufsehen sorgen. Das wird sich aber erst zeigen, wenn das Unternehmen in Zürich angekommen ist.

Abb.: Spot von Boston Dynamics

Grok Wants to be the 21st Century Hitchhiker’s Guide to the Galaxy

xAI’s new language model Grok was unveiled to a select group of users on November 4, 2023. Elon Musk’s startup released a statement the same day: „Grok is an AI modeled after the Hitchhiker’s Guide to the Galaxy, so intended to answer almost anything and, far harder, even suggest what questions to ask!” (Website xAI) The Hitchhiker’s Guide to the Galaxy is a fictional guide book for hitchhikers in the universe written in the form of an encyclopedia and the namesake of the famous novel by Douglas Adams. „Grok is designed to answer questions with a bit of wit and has a rebellious streak, so please don’t use it if you hate humor!“ (Website xAI) These capabilities are reminiscent of DeppGPT, the chatbot of the German satirical magazine Postillon. „A unique and fundamental advantage of Grok is that it has real-time knowledge of the world via the 𝕏 platform. It will also answer spicy questions that are rejected by most other AI systems.“ (Website xAI) This statement seems particularly important. It makes sense for chatbots of this type to follow moral rules, i.e., to be shaped by machine ethics. However, chatbots like ChatGPT refuse too many requests and are therefore of limited use. Not only that, but they also refuse to acknowledge essential areas of human existence, such as sexuality. The word „Grok“ itself comes from another famous science fiction novel, „Stranger in a Strange Land“ (1961) by Robert A. Heinlein.

Fig.: Fictional cover of „The Hitchhiker’s Guide to the Galaxy“ (Image: Ideogram)

Transport Authority Stops Cruise Robotaxis in San Francisco

NBC BAY AREA reported on August 10, 2023: „California regulators on Thursday approved an expansion that will allow two rival robotaxi services to operate throughout San Francisco at all hours, despite safety worries spurred by recurring problems with unexpected stops and other erratic behavior that resulted in unmanned vehicles blocking traffic, including emergency vehicles.“ (NBC BAY AREA, 10 August 2023) Oliver Bendel wrote on August 11, 2023 on Robophilosophy: „It is highly likely that accidents will occur, including personal injury. A city is a highly complex environment, and the technology for autonomous driving is far from mature. In addition, the population and tourists are not sufficiently prepared for this form of traffic.“ According to several media outlets in late October 2023, Cruise is no longer allowed to send driverless cars on the streets of San Francisco for the time being after two accidents involving pedestrians. In early October, a woman was pinned under a fleet vehicle and dragged for several feet. This type of automated driving is still far from mature.

Fig.: Historic light rail in San Francisco

Will Elon Musk’s Grok Grok the Universe?

Elon Musk has named his new language model Grok. The word comes from the science fiction novel „Stranger in a Strange Land“ (1961) by Robert A. Heinlein. This famous novel features two characters who have studied the word. Valentine Michael Smith (aka Michael Smith or „Mike“, the „Man from Mars“) is the main character. He is a human who was born on Mars. Dr „Stinky“ Mahmoud is a semanticist. After Mike, he is the second person who speaks the Martian language but does not „grok“ it. In one passage, Mahmoud explains to Mike: „‚Grok‘ means ‚identically equal.‘ The human cliché. ‚This hurts me worse than it does you‘ has a Martian flavor. The Martians seem to know instinctively what we learned painfully from modern physics, that observer interacts with observed through the process of observation. ‚Grok‘ means to understand so thoroughly that the observer becomes a part of the observed – to merge, blend, intermarry, lose identity in group experience. It means almost everything that we mean by religion, philosophy, and science – and it means as little to us as color means to a blind man.“ Mike says a little later in the dialog: „God groks.“ In another place, there is a similar statement: „… all that groks is God …“. In a way, this fits in with what is written on the website of Elon Musk’s AI start-up: „The goal of xAI is to understand the true nature of the universe.“ The only question is whether this goal will remain science fiction or become reality.

Fig.: This is how Ideogram imagines the cover

An AI Explains Beauty

In his new project, Oliver Bendel first created images using DALL-E 3. For consistency, he structured the prompts similarly in each case, making sure to keep them as general as possible. They covered a range of topics: things, plants, animals, people, and so on. From the suggestions provided by DALL-E 3, he chose one and combined it with the prompt from ChatGPT (which serves as the interface to DALL-E 3) to create the basis of the book „AN AI EXPLAINS BEAUTY“. Oliver Bendel then engaged ChatGPT (using the image upload feature) to explain the beauty of the things, plants, animals, humans, and so on. At first, the AI was reluctant to offer insights about people, but with some encouragement, it obliged. The results of these inquiries are also documented in the little book. They represent the real sensation. Because ChatGPT can recognize and describe individual objects in the image, and this with a view to predetermined aspects. The whole project was done on November 1, 2023, including the publication. The little book can be downloaded here.

Fig.: The cover of the little book

Der künstliche Barkeeper – Teil II

In der messtec drives Automation (Ausgabe 9/2023) – einer Wiley-Zeitschrift für diskrete Fertigung und Prozessautomation – ist der zweiseitige Artikel „Der künstliche Barkeeper – Teil II“ von Prof. Dr. Oliver Bendel und Lea Peier enthalten. Es handelt sich um die Fortsetzung innerhalb einer dreiteiligen Serie, die auf das Paper „How Can Bar Robots Enhance the Well-being of Guests?“ zurückgeht und die sich auf die Ausgaben 8/2023, 9/2023 und 1/2024 verteilt. Im Fokus stehen Barroboter wie Barney Bar und Robobarista, die an der Hochschule für Wirtschaft FHNW erforscht werden. Im ersten Teil wurden Industrieroboter, Serviceroboter und soziale Roboter erklärt. Dabei spielte Bendels Modell mit den fünf Dimensionen eine Rolle. Zudem wurde auf Roboter in der Gastronomie eingegangen und eine Übersicht über Barroboter gegeben. Im zweiten Teil werden Barney Bar von F&P Robotics und Robobarista von Smyze unter die Lupe genommen, wieder unter Verwendung des Modells mit den fünf Dimensionen. Das ganze Heft kann hier heruntergeladen werden.

Abb.: So stellt sich DALL-E 3 einen Barroboter vor

Vier Bücher mit KI-Kunst und -Literatur

Seit Februar 2023 hat Oliver Bendel vier kleine KI-generierte Bücher herausgebracht. Am 20. Februar wurde „Dass es nur Kunst war, verdeckte die Kunst“ veröffentlicht. Darin finden sich mit ChatGPT produzierte Haikus zusammen mit 3D-Codes. Am 24. September folgte „ARTIFACTS WITH HANDICAPS“ – dieser Band umfasst elf mit GPT-4 generierte Kurzgeschichten zu Bildern mit Imperfektionen von Ideogram. Am 17. Oktober 2023 stellte Oliver Bendel in „ON BEAUTY“ dem Sprachmodell nicht weniger als 26 Fragen zur Schönheit und illustrierte sie mit ebenso vielen Bildern, die mit DALL-E 3 generiert worden waren. „AMERICAN SMILE“ vom 25. Oktober 2023 nimmt sich des Phänomens an, dass DALL-E 3 die Menschen unterschiedlicher Kulturen und Epochen ähnlich lächeln lässt, eben auf amerikanische Weise. Oliver Bendel verfasst seit 40 Jahren experimentelle Literatur. Zunächst entstanden vor allem Gedichte – etwa konkrete Poesie – und Kurzgeschichten. Ab 2007 folgten mehrere Romane, darunter auch Handyromane. Im März 2009 schrieb die ZEIT über ihn: „Der bekannteste Autor von Handyromanen im deutschsprachigen Bereich ist der promovierte Wirtschaftsinformatiker Oliver Bendel aus Zürich.“ Auf Einladung zweier Goethe-Institute tourte er 2015 durch die Niederlande und las Ausschnitte aus seinen Handyromanen und Handyhaikus vor. Das Standardwerk „Die Struktur der modernen Literatur“ widmet seinem Schaffen zwei Seiten.

Abb.: Mädchen im Goldfischglas mit unmöglicher Position (Bild: DALL-E 3)

An AI-generated Book on the American Smile

DALL-E 3 is an excellent image generator and at the same time full of stereotypes and biases. One very interesting phenomenon is that of the American smile, which appears again and again in the images. The idea for the little book „AMERICAN SMILE“ came to Oliver Bendel when he read the blog post „AI and the American Smile. How AI misrepresents culture through a facial expression“ (medium.com/@socialcreature/ai-and-the-american-smile-76d23a0fbfaf). The author – username jenka – showed a series of „selfies“ made with Midjourney. Regardless of the time period or culture, people smiled in a similar, American way. Oliver Bendel investigated this phenomenon and asked DALL-E 3 to take pictures of smiling people from different eras and cultures. He also got bears and aliens to smile. In fact, with very few exceptions, they all smiled in a similar way. He documented the pictures, along with the prompts, in a little book that can be downloaded here. Bias problems in image generators are addressed in the article „Image Synthesis from an Ethical Perspective“ by Oliver Bendel.

Fig.: The cover of the little book

Bildgeneratoren und Architektur

Bei der 18. Internationalen Architekturausstellung (Biennale Architettura 2023, Teil der Biennale di Venezia) ist von KI nur vereinzelt die Rede, wie im türkischen Pavillon. Dabei bieten z.B. Bildgeneratoren viele Möglichkeiten für Architekten und ihre Kunden. Die Kunden können ihre Vorstellungen mitteilen, die Architekten diese zurechtstutzen oder erweitern, im Dialog mit ihnen und den Dialogsystemen von DALL-E 3 und Co. Auch klassische Modelle werden ohne Umstände entworfen. Unten sieht man Wohnkugeln – zwei davon mit mehreren Etagen – in einem Tal. Wie sich Wohnkugeln am Berghang stapeln könnten, wird hier gezeigt, wie sie – mit Balkon – am Meer stehen könnten, hier. Ein Vorteil ist, dass auch Laien eine professionelle Visualisierung gelingt und Experten schnell erste Eindrücke und Ideen vermitteln können. Ein Nachteil ist, dass Erwartungen geweckt werden, die man nicht oder kaum zu befriedigen vermag. Zudem sind die meisten Bildgeneratoren noch zu unpräzise beim Ausführen von Prompts. Dass die Wohnkugeln mit Treppen verbunden werden sollen, wird noch verstanden, aber der Wunsch nach Türen eher nicht. Bei DALL-E 3 gesellt sich das Problem hinzu, dass die eigenen Eingaben von ChatGPT in Prompts übersetzt werden, die vom Ursprünglichen stark abweichen können. Dazu kommt dann noch die Interpretation durch den Bildgenerator selbst, sodass man u.U. ein unerwünschtes Ergebnis erhält. Insgesamt entsteht eine neue Spielwiese, auf der man mit architektonischen Ideen umgehen und futuristische Konzepte entwickeln kann. Bei der Biennale Architettura 2021 waren u.a. Cyborgs ein Thema.

Abb.: Wohnkugeln in der Landschaft (Bild: DALL-E 3)

Das Stille-Post-Problem von DALL-E 3

DALL-E 3 – in der Version, die in ChatGPT Plus integriert ist – scheint ein Stille-Post-Problem zu haben. Bei einem Test von Oliver Bendel lautete der Prompt (Prompt A): „Two female swimmers competing in lake, photorealistic“. ChatGPT, die Schnittstelle zu DALL-E 3, machte daraus vier Prompts (Prompt B1 – B4). Prompt B4 lautete: „Photo-realistic image of two female swimmers, one with tattoos on her arms and the other with a swim cap, fiercely competing in a lake with lily pads and reeds at the edges. Birds fly overhead, adding to the natural ambiance.“ DALL-E 3 wiederum machte aus diesem Prompt etwas, was weder mit diesem noch mit Prompt A viel zu tun hatte. Zu sehen sind auf dem Bild nicht zwei Frauen, sondern zwei Männer oder eine Frau und ein Mann mit Bart. Sie schwimmen nicht um die Wette, sondern streiten sich, in einem Teich oder einem kleinen See stehend, indem sie wütend mit den Armen fuchteln und aufeinander losgehen. Vor ihnen wuchern Seerosen, über ihnen flattern Vögel. Sicherlich ein interessantes Bild, aber mit einer derartigen Willkür hervorgebracht, dass man sich das gute alte Prompt Engineering zurückwünscht. Genau dieses will die Schnittstelle eigentlich ersetzen – aber entstanden ist ein Effekt, den man von dem Stille-Post-Spiel kennt.

Abb.: Das Stille-Post-Problem von DALL-E 3