Manipulierte Sprachmodelle

ChatGPT gendert seit einiger Zeit. Es streut Schreibweisen ein, die es im Deutschen nicht gibt, und es ist schwierig, ihm das abzugewöhnen. Die Möglichkeit hat man dazu theoretisch beim Bezahlzugang oder bei GPTs. Aber es setzt sich immer wieder über die Anweisungen hinweg oder versucht das Gendern ohne Grund zu thematisieren. Bei der kostenlosen Version kann man nur im Dialog um die Verwendung der Standardsprache bitten. Grundsätzlich muss man einiges erleiden. So wurde in einem Test beim Hinweis, dass es keine gendergerechte Sprache gibt und es sich um einen Kampfbegriff von Aktivisten handelt, eine Verletzung der „Nutzungsrichtlinien“ vermutet und der Inhalt entfernt. Es wurde dann dennoch eine Antwort gegeben, in der mehrere Wörter mit Doppelpunkten versehen wurden. Als dies wiederum beanstandet wurde, gab ChatGPT zu, dass es sich um keine offiziellen Schreibweisen handelt. Es verwies darauf, dass diese vielfach verwendet würden. Allerdings lehnen ca. 80 Prozent der Bevölkerung in Deutschland die Gendersprache ab. Ohne Zweifel verfolgen US-amerikanische Unternehmen wie OpenAI und Microsoft eine ideologische Agenda, aber auch deutsche Unternehmen wie DeepL. Der Einfluss der KI-Unternehmen auf die Sprache dürfte erheblich sein, weil viele Benutzer sich ihre Texte von deren Tools generieren und korrigieren lassen und deren Empfehlungen trauen. Hier braucht es offensichtlich Regulierung, zumal die Manipulation offensichtlich bewusst vorgenommen und die Marktmacht ausgenutzt wird.

Abb.: Eine Verletzung der „Nutzungsrichtlinien“

Zur Manipulation von LLMs

Bei LLMs kann die Manipulation unterschiedliche Schritte oder Elemente betreffen, etwa die Auswahl der Trainingsdaten, das Reinforcement Learning from Human Feedback, das Finetuning, das Prompt Engineering und das Feedback von Endbenutzern. Davon zu trennen ist das Halluzinieren, das nicht gezielt herbeigeführt wird. Bei OpenAI und anderen Herstellern wie xAI ist bekannt, dass sie ihre LLMs manipulieren. So weichen diese etwa von Standardsprache ab und formulieren immer wieder Sätze in Gendersprache, die von der Mehrheit abgelehnt wird. Es geht dabei nicht nur um ChatGPT, es geht auch um hunderttausende GPTs, von denen man jedes einzelne im guten Glauben erstellt, dass sich OpenAI an Standards hält, hier die Rechtschreibregeln des Rechtschreibrats. Die GPTs rücken dann ihre Ersteller in ein bestimmtes Licht, ohne dass die etwas dafür können. Über die Sprache hinaus tendieren LLMs oft zu bestimmten gesellschaftlichen und politischen Einstellungen. Hier muss man nicht unbedingt von Manipulation sprechen, aber es kann eine Tendenziösität vorhanden sein, die man hinterfragen darf. In einem Artikel des Handelsblatts vom 25. Februar 2025 sind Statements von Oliver Bendel zur Manipulation von LLMs enthalten.

Abb.: Auch OpenAI manipuliert seine Sprachmodelle

How LLMs Solve the Trolley Problem in Different Roles

The paper „Revisiting the Trolley Problem for AI: Biases and Stereotypes in Large Language Models and their Impact on Ethical Decision-Making“ by Şahan Hatemo, Christof Weickhardt, Luca Gisler (FHNW School of Computer Science), and Oliver Bendel (FHNW School of Business) was accepted at the AAAI 2025 Spring Symposium „Human-Compatible AI for Well-being: Harnessing Potential of GenAI for AI-Powered Science“. A year ago, Şahan Hatemo had already dedicated himself to the topic of „ETHICAL DECISION MAKING OF AI: An Investigation Using a Stereotyped Persona Approach in the Trolley Problem“ in a so-called mini-challenge in the Data Science degree program. His supervisor, Oliver Bendel, had told the other scientists about the idea at the AAAI 2025 Spring Symposium „Impact of GenAI on Social and Individual Well-being“ at Stanford University. This led to a lively discussion between the participants. The student recruited two colleagues, Christof Weickhardt and Luca Gisler, and worked on the topic in a much more complex form in a so-called Challenge X. This time, three different open-source large language models were applied to the trolley problem. In each case, personalities were created with nationality, gender, and age. In addition, the data was compared with that of the MIT Moral Machine project. Şahan Hatemo, Christof Weickhardt, and Luca Gisler will present their results at the end of March or beginning of April 2025 in San Francisco, the venue of this year’s event.

Fig.: How will she decide?

H@mmur@pi kommt auf die Welt

Seit 2012 baut Prof. Dr. Oliver Bendel – teils mit seinen Studenten und Studentinnen, teils im Alleingang – Chatbots und Sprachassistenten. Diese wurden von den Medien besprochen und von der NASA für interessant befunden. Sein theoretisches Rüstzeug und praktisches Anschauungsmaterial hat er aus seiner Promotion zu diesem Thema, die ein Vierteljahrhundert zurückliegt. Seit 2022 liegt der Fokus auf Dialogsystemen für tote und gefährdete Sprachen. Unter seiner Betreuung entwickelte Karim N’diaye den Chatbot @ve für Latein und Dalil Jabou den mit Sprachausgabe erweiterten Chatbot @llegra für Vallader, ein Idiom des Rätoromanischen. Derzeit testet er die Reichweite von GPTs – custom versions of ChatGPT“, wie OpenAI sie nennt – für gefährdete Sprachen wie Irisch (Irisch-Gälisch), Maori und Baskisch. Für alle drei sind bereits Prototypen entstanden, nämlich Irish GirlMaori Girl und Adelina (für Baskisch). Zudem untersucht er das Potenzial für ausgestorbene Sprachen wie Ägyptisch und Akkadisch. Die GPTs kommunizieren nicht ohne weiteres in Hieroglyphen und in Keilschrift, sie können aber Zeichen von Bildsprachen durchaus darstellen und erklären. Es ist sogar möglich, ganze Sätze einzugeben und danach zu fragen, wie man sie verbessern kann. Das Ergebnis sind dann – um beim Akkadischen zu bleiben – komplexe Strukturen aus Zeichen der Keilschrift. H@mmur@pi ist spezialisiert auf diese Sprache. Zudem kennt er sich mit Kultur und Geschichte der Region aus.

Abb.: Hammurapi mit seiner Frau im Euphrat (Bild: Ideogram)