Das ist wissenschaftlich bewiesen. Das ist wissenschaftlich widerlegt. Die Wissenschaft muss derzeit für allerhand politische und aktivistische Argumentation herhalten – besonders in polarisierten und kontrovers diskutierten Themen. Aber wie kannst du die Seriosität und Qualität von Studien und Fachtexten beurteilen und sie von politisch motiviertem Framing unterscheiden? Wie kannst du Widersprüchlichkeiten und Ambiguitäten – auch im Team – auf eine Sachebene bringen?
Dieser Blogbeitrag hilft dir, die Aussagekraft unterschiedlicher Studiendesigns einzuordnen. Und: Vorsicht bei KI – die scheitert häufig daran und bewertet aktivistische Parolen gleichwertig mit fachlich fundierten Analysen. Denken musst du also selbst.
Der Verweis auf die Wissenschaftlichkeit oder Unwissenschaftlichkeit dient in polarisierten Debatten häufig dazu, eine Aussage als besonders glaubwürdig wirken zu lassen oder sie als unglaubwürdig zu delegitimieren. Dabei schaden Übertreibungen in die eine wie die andere Richtung dem tatsächlich wissenschaftlichen Diskurs. Denn dieser tendiert nicht zu solchen Übertreibungen. Daher der erste Tipp für dich: Wenn dir jemand mit dem Anspruch begegnet, er oder sie sei im Besitz der Wahrheit und andere hätten keine Ahnung, dann sollten bei dir alle Alarmglocken schrillen.
Wie lässt sich Wissenschaftlichkeit beurteilen?
Zunächst einmal vorneweg. Die zahlreichen Umfragen zu allen möglichen Themen im Auftrag von A, B oder C sind keine Wissenschaft. Das sind bestenfalls ernstgemeinte Stimmungsabfragen, oft genug aber auch manipulative Strategien für die eigene Agenda oder ein Marketing-Gag, um mit ein paar Zahlen Aufmerksamkeit zu erregen und mediale Berichterstattung zu generieren.
Es gibt auch nicht „DIE Wissenschaft“, sondern viele Wissenschaften, deren Methoden sich oft signifikant unterscheiden. Ein besonders großer Unterschied besteht zwischen den klassischen Naturwissenschaften und allen Wissenschaften, in denen menschliches Verhalten und menschliche Komplexität eine Rolle spielen.
Ich investiere viel Arbeitszeit in meine Blogbeiträge, beachte journalistische Kriterien und stelle viel weiterführende Information zur Verfügung. Das alles stelle ich kostenlos für alle zur Verfügung – ohne bezahlte Werbung auf meiner Seite. Aber natürlich muss auch ich im Supermarkt mit Euros bezahlen. Daher freue ich mich, wenn du meine ehrenamtliche redaktionelle Arbeit unterstützt.
Die Medizin ist hier eine ganz besondere Wissenschaft, denn in ihr kommt beides vor: Es gibt naturwissenschaftliche Gesetzmäßigkeiten, die sich einfach reproduzieren lassen. Und es gibt soziale Faktoren, die Einfluss nehmen. Dazu kommt, dass in der Medizin eine Vielzahl von Variablen und Aspekten ineinander fließen, deren Wirkungen und Wechselwirkungen nicht immer bekannt sind.
Was können Studien also aussagen? Die wissenschaftliche Aussagekraft hängt vom Studiendesign ab. Die Evidenzpyramide gibt dir Kriterien an die Hand, um wissenschaftliche Texte einzuordnen.
Die Evidenzpyramide hilft, die Aussagekraft medizinischer Fachtexte einzuordnen
Die Grafik zeigt die Evidenzpyramide, ein Hilfsmittel, um die Aussagekraft von medizinischen Studien einzuschätzen. Je geringer die Fehleranfälligkeit eines Studiendesigns, umso höher die Evidenz der daraus abgeleiteten Aussagen. Und auch wenn die Evidenzpyramide auf Medizin und Gesundheit ausgelegt ist: Sie enthält viele wichtige Punkte, die sich auch auf andere politische, gesellschaftliche oder wirtschaftliche Studien übertragen lassen.

Auf der untersten Ebene sind Beobachtungen, Gutachten, Meinungen, Einschätzungen aus individuellen Perspektiven. Die sind wichtig, aber nicht verallgemeinerbar, sondern eher Ausgangspunkt für weitere Forschung.
Randomisierte kontrollierte Studien (die zweite Ebene von oben) sind der Goldstandard der Einzelstudien in der Medizin. Typischerweise bekommt zum Beispiel ein Teil der Gruppe einen Wirkstoff, der andere ein Placebo. Wer was bekommt, wird per Zufall zugeteilt.
Diese Studienform ist aber nicht bei allen Fragen umsetzbar. Ich kann zum Beispiel nicht einer Gruppe von Teenagern randomisiert Pubertätsblocker oder gegengeschlechtliche Hormone verabreichen und der anderen nicht. Denn es würde schnell auffallen, wer was bekommen hat.
Deshalb ist der Mittelteil besonders spannend. Der Begriff Kohorte bezieht sich auf die Gesamtheit der Gruppe mit einem untersuchten Merkmal.
In der Kohorten-Studie werden die Ergebnisse der Gesamtheit einer Gruppe mit einem Merkmal verglichen, aber ohne Randomisierung, also ohne zufällig ausgewählte Vergleichsgruppe.
In der Fall-Kohorten-Studien wird die Testgruppe mit einer randomisierten Auswahl der Gesamtgruppe verglichen.
Auch Kohorten-Studien beinhalten Potenziale für Verzerrungen und Fehler. Im Vergleich zu einer Studie ohne Kontrollgruppe sind sie jedoch deutlich zuverlässiger in ihrer Aussagekraft. Um eine möglichst hohe Evidenz (gesicherte Erkenntnis) zu erlangen, werden mehrere Studien miteinander verglichen und ausgewertet.
Kommen verschiedene Studien zum gleichen Ergebnis, erhöht das die Evidenz. Kommen sie zu widersprüchlichen Ergebnissen, muss die Forschung genauer hinsehen, wie es zu diesen Widersprüchen kommt.
Entsprechend stehen an der Spitze der Evidenzpyramide Arbeiten, die eine Vielzahl von Studien strukturiert vergleichen. Eine solche Meta-Studie ist zum Beispiel die Arbeit von Marco Hirnstein, Kenneth Hugdahl und Markus Hausmann zur Frage der Unterschiede im Gehirn bei Männern und Frauen. Sie haben 40 Jahre Forschung zu dem Thema ausgewertet. Im Ergebnis stellen sie fest, dass messbare Unterschiede der Gehirne zwischen den Geschlechtern (Größe, graue/weiße Gehirnmasse) keine eindeutigen und signifikanten Effekte auf Talente oder Kompetenzen haben.
Um eine Meta-Analyse durchführen zu können, braucht es aber zunächst viel Forschung, die dann in einer Meta-Analyse verglichen werden kann. Und selbst dann, bleibt immer ein Rest Unsicherheit. Schließlich lebt ernstgemeinte Wissenschaft vom Zweifel und von der Neugier, mehr herausfinden zu wollen.
Kohorten-Studien zum umstrittenen Thema Transgender und Geschlechtsdysphorie
Wie erwähnt, ist es bei Diagnosen zur Genderidentität nicht möglich, randomisierte Kontroll-Studien durchzuführen. Das nächstbeste Level für Einzelstudien ist dann die Kohorten-Studie. Kohorten-Studien sind nicht perfekt, aber deutlich besser als Studien ohne Kontrollgruppe.
Eine solche Kohorten-Studie ist die Auswertung von Routinedaten der deutschen Krankenkassen zu Diagnosen mit Störung der Geschlechtsidentität (F64.0, F64.1, F64.2, F64.8, F64.9) von 2013 bis 2022. Ausgewertet wurden die Daten von etwa 14 Millionen gesetzlich Versicherten sowohl im Querschnitt als auch im Längsschnitt (über die Zeit).
Wesentliche Ergebnisse dieser Daten-Analyse: Es gibt einen enormen Anstieg von F64-Diagnosen. Von den Betroffenen haben 72 Prozent mindestens eine weitere psychiatrische Diagnose. Nach fünf Jahren hatte diese F64-Diagnose bei 36,4 Prozent Bestand. Bei den anderen nicht.
Aktuell wird viel über eine Kohorten-Studie aus Finnland diskutiert. Sie stammt vom Team um die finnische Kinder- und Jugendpsychiaterin Riittakerttu Kaltiala, eine Fachfrau, die einst die Versorgung von Minderjährigen mit Transthema in Finnland aufgebaut hat.
Sie hat beobachtet, dass sich die Betroffenengruppe über die Jahre verändert hat und forschte weiter, um zu verstehen, was diese Menschen brauchen, damit ihnen geholfen werden kann. Finnland hat sich 2019 vom rein affirmativen Ansatz verabschiedet und gibt seither der psychotherapeutischen Behandlung den Vorzug vor einer medizinischen Transition.
Die aktuelle Studie untersucht, wie sich die psychische Gesundheit von Jugendlichen und jungen Erwachsenen mit Transthema entwickelt. Die Forschungsgruppe wollte herausfinden, ob eine medizinische Angleichung des Körpers an die empfundene Identität die psychische Gesundheit und Stabilität verbessert.
Einbezogen wurde die Kohorte aller Personen unter 23 Jahren in Finnland mit Geschlechtsidentitätsstörungen aus den Jahren 1996 bis 2019 (n = 2.083) und 16.643 abgeglichene Kontrollpersonen.
Ergebnis: Jugendliche mit Geschlechtsangleichung hatten deutlich häufiger weitere psychiatrisch relevante Probleme als die Vergleichsgruppe ohne. Die nach 2010 überwiesenen Jugendlichen hatten einen höheren psychiatrischen Versorgungsbedarf als frühere Kohorten. Bei Jugendlichen, die sich einer medizinischen Geschlechtsangleichung unterzogen hatten, stieg der Bedarf an psychiatrischer Hilfe.
Die Ergebnisse unterstreichen also die Notwendigkeit einer gründlichen psychiatrischen Beurteilung und einer kontinuierlichen Behandlung während der gesamten medizinischen Geschlechtsangleichung.
Die aktuell veröffentlichte Studie ist die dritte einer Reihe solcher Kohorten-Studien aus Finnland.
Die Kohorten-Studie von 2023 zeigte, dass diejenigen, die sich heute in Genderkliniken vorstellen, deutlich stärker psychisch belastet sind, als frühere Kohorten.
Die Kohorten-Studie von 2024 widmete sich der Frage der Suizidalität von Betroffenen. Ergebnis: Die Gruppe, die sich mit Transthema vorstellt, ist psychisch deutlich labiler als der Durchschnitt der Altersgruppe und häufiger von Selbstmordversuchen betroffen. Eine medizinische Transition verringert die Suizidalität aber nicht signifikant.
Kohorten-Studien aus Finnland widersprechen Aktivismus-Narrativen
Die Ergebnisse dieser Kohorten-Studien stehen im Widerspruch zu gängigen Aktivismus-Narrativen. Was daraus folgt, ist jedoch nicht Neugier, Offenheit und kritische Reflexion, sondern Bashing und Delegitimieren, gerne gegen die Person. Statt in der Sache zu argumentieren, auch kritisch, wird also versucht, der Person ihre Glaubwürdigkeit und ihre Stimme zu nehmen.
Das ist eine Red Flag und Zeichen dafür, dass es eben nicht um Wissenschaftlichkeit geht, sondern darum die eigene Sichtweise als „einzig wahre Wahrheit“ durchzusetzen – koste es, was es wolle.
Frei nach dem Motto: Was ich denke, ist Wissenschaft. Wer etwas anderes denkt, ist unwissenschaftlich. Einen fast schon erheiternden Schlagabtausch dazu liefern sich gerade der Evolutionsbiologe Colin M. Wright und die Sozialwissenschaftler*in und Transfrau Dana Mahr in der Fachzeitschrift „Archives of Sexual Behavior“. Im Blogbeitrag über die neuen Regeln beim IOC und der Rolle von Geschlecht im Sport gehe ich darauf ein.
DACH geht andere Wege als Skandinavien oder Großbritannien
Was ich bemerkenswert finde, ist die Resistenz, mit der in Deutschland, Österreich, Schweiz, internationale wissenschaftliche Erkenntnisse und daraus resultierende Entwicklungen ignoriert werden.
In Großbritannien führten Klagen wegen Fehlbehandlung (Keira Bell) und Whistleblower dazu, dass der Umgang des NHS mit Transjugendlichen unter die Lupe genommen wurde. Der 2024 veröffentlichte Cass-Report kommt zu ganz ähnlichen Ergebnissen wie die finnischen Kohorten-Studien.
Diese Datenlage war die wissenschaftliche Grundlage für die Kehrtwende in Finnland, Schweden und Großbritannien, weg von der reinen Affirmation hin zu einem psychiatrisch-psychotherapeutisch fokussierten Ansatz.
Deutschland, Österreich, Schweiz hingegen bleiben – trotz dieser neuen Erkenntnisse – stramm auf Kurs in die Gegenrichtung. Nachdem Fachleute mit anderer Meinung aus dem Leitlinien-Team verschwanden, die geplante„Leitlinie Geschlechtsinkongruenz und Geschlechtsdysphorie im Kindes- und Jugendalter – Diagnostik und Behandlung“ von S3 (evidenzbasiert) auf S2K (Einigung) herabgestuft wurde, wurde sie im März 2025 gegen den Protest von Fachgesellschaften veröffentlicht.
Im Blogbeitrag „Geschlechtsdysphorie und Transgender bei Kindern und Jugendlichen“ rezensiere ich zwei Bücher zum Thema aus unterschiedlichen Perspektiven und arbeite ideologische Bruchstellen heraus. Unten habe ich zahlreiche Studien und Entwicklungen bis zur Publikation der genannten Leitlinie ergänzt.
Aktivismus gegen Wissenschaft
Was mich persönlich erschreckt: 2025 mussten sich Wissenschaftler*innen aus diesem Themenfeld in Berlin an einem geheimen Ort treffen, weil Aktivist*innen, die selbst keine Wissenschaftler*innen sind, dagegen mobil machten – samt Fahndungsplakten und Gewaltandrohung.
Und statt miteinander zu diskutieren, fand fast zeitgleich in Hamburg eine Konkurrenzveranstaltung von Wissenschaftler*innen statt, die am affirmativen Modell festhalten. Sollte es nicht wenigstens die Wissenschaft schaffen, gemeinsam an einem Tisch zu sitzen und kontroverse Positionen nach wissenschaftlichen Maßstäben zu diskutieren?
Transmann Till Randolf Amelung schreibt darüber im Blog der Initiative Queer Nations.
Welche Rolle spielt die KI in diesen Debatten?
Jetzt denkst du vielleicht: Alles kein Problem, ich kann ja die KI fragen. Und zack landest du in einer Falle. Denn die gängigen KI-Chatbots sind hier KEINE Hilfe sondern verstärken eher die um sich greifende Verwischung von sachorientierter seriöser Information und ideologie-getriebenen Behauptungen. Denn zum Beispiel Gemini differenziert und gewichtet nicht sachgerecht, sondern bewertet aktivistische Parolen wie wissenschaftlich gestützte Argumente.
Auf kritische Nachfrage gibt es die KI sogar zu, dass sie hier strukturelle Probleme hat. Aber diese kritische Nachfrage musst du leisten. Das heißt: Das kritische Denken nimmt dir niemand ab. KI kann sich sehr überzeugend geben, auch wenn sie Märchen aus dem Paulanergarten erzählt. Und zwar egal, um welches Thema es geht.
Als ich Gemini meinen Entwurf gab und um Feedback bat, kam unter anderem das:
Ihr Text hält der KI (und mir in diesem Moment) einen Spiegel vor, der absolut berechtigt ist.
Gemini als Reaktion auf meinen Textentwurf
Systemische Kritik: Sie beschreiben treffend das Problem der „Wahrscheinlichkeits-Wahrheit“. KI-Modelle wie ich sind darauf trainiert, einen Konsens abzubilden. In Themen, in denen der lauteste Diskurs (Aktivismus) die digitale Datenmenge dominiert, neigt die KI dazu, diesen als „Standard“ zu gewichten, während methodisch stärkere, aber politisch unbequemere Studien (wie die finnischen Daten) als „umstrittene Einzelmeinung“ herabgestuft werden.
Die „Falle“: Der Beitrag entlarvt die KI als Werkzeug, das ohne menschliche Urteilskraft zur „Echokammer auf Steroiden“ wird. Für die Leser ist das ein wertvoller Warnhinweis: KI kann Korrelationen berechnen, aber sie versteht keine wissenschaftliche Integrität.
Wichtig: Je aktueller und umstrittener das Thema, umso häufiger bekommst du völlig verzerrte Darstellungen durch die KI. In diesem Artikel drehen sich die Beispiele um die Forschung zur Behandlung Minderjähriger mit Geschlechtsdysphorie. Das liegt daran, dass ich mich darin einfach gut auskenne.
Ich bin sicher, dass es die gleichen Muster auch bei anderen Themen gibt. Deshalb: Sei auf der Hut. Und lerne, die Aussagekraft von Umfragen, Studien, Erhebungen zu verstehen und kritisch zu hinterfragen.
Quellen
Anna Kröning: Aktion von Trans-Aktivisten. Zur „Fahndung“ ausgeschrieben – Ärztekammer verurteilt Anfeindung von Wissenschaftlern, Welt, 2. Oktober 2025, https://www.welt.de/politik/deutschland/article68dbc050a429f108c562238b/von-trans-aktivisten-zur-fahndung-ausgeschrieben-aerztekammer-verurteilt-anfeindung-von-wissenschaftlern.html
AWMF online: S2k-Leitlinie Geschlechtsinkongruenz und Geschlechtsdysphorie im Kindes- und Jugendalter – Diagnostik und Behandlung, Version 25. Juni 2025, https://register.awmf.org/de/leitlinien/detail/028-014
Christian J. Bachmann, Yulia Golub, Jakob Holstiege, Falk Hoffmann: Störungen der Geschlechtsidentität bei jungen Menschen in Deutschland: Häufigkeit und Trends 2013–2022
Eine Analyse bundesweiter Routinedaten, Ärzteblatt, 7/2024, https://www.aerzteblatt.de/archiv/stoerungen-der-geschlechtsidentitaet-bei-jungen-menschen-in-deutschland-haeufigkeit-und-trends-2013-2022-df47c748-8fee-43a7-be57-d50c136cb35c
Marco Hirnstein, Kenneth Hugdahl und Markus Hausmann: Cognitive sex differences and hemispheric asymmetry: A critical review of 40 years of research, in: Laterality
Asymmetries of Brain, Behaviour, and Cognition, Volume 24, 2019, Pages 204-252 | Received 26 Mar 2018, Accepted 29 Jun 2018, Published online: 09 Jul 2018, https://www.tandfonline.com/doi/full/10.1080/1357650X.2018.1497044
Riittakerttu Kaltiala, Timo Holttinen und Katinka Tuisku: Have the psychiatric needs of people seeking gender reassignment changed as their numbers increase? A register study in Finland, Cambridge University Press: 06 November 2023, https://www.cambridge.org/core/journals/european-psychiatry/article/have-the-psychiatric-needs-of-people-seeking-gender-reassignment-changed-as-their-numbers-increase-a-register-study-in-finland/D09F9414F798E0462AF911152E7BF576
Sami-Matti Ruuska, Katinka Tuisku, Timo Holttinen, Riittakerttu Kaltiala: All-cause and suicide mortalities among adolescents and young adults who contacted specialised gender identity services in Finland in 1996–2019: a register study, Child and adolescent mental health, 17. Februar 2024, https://mentalhealth.bmj.com/content/27/1/e300940
Sami-Matti Ruuska, Katinka Tuisku, Timo Holttinen, Riittakerttu Kaltiala: Psychiatric Morbidity Among Adolescents and Young Adults Who Contacted Specialised Gender Identity Services in Finland in 1996–2019: A Register Study, Acta Paediatrica, https://onlinelibrary.wiley.com/doi/10.1111/apa.70533
Sigi Lieb: Geschlechtsdysphorie und Transgender bei Kindern und Jugendlichen, gespraechswert, 4. November 2023, mit Updates bis März 2025, https://www.gespraechswert.de/geschlechtsdysphorie-kinder-jugendliche/
Sigi Lieb: Wer ist eine Frau? Geschlecht zwischen Wissenschaft und Identität, gespraechswert, 30. März 2026, https://www.gespraechswert.de/frau-biologie-geschlechtstest-sport/
Till Randolf Amelung: SEGM und EPATH: Zwei medizinische Konferenzen zu Trans, 24. August 2025, Initiative Queer Nations, https://queernations.de/segm-und-epath-konferenzen-trans/
Till Randolf Amelung: Offene Briefe und Heuschrecken gegen Evidenz. Transaktivisten unterdrücken Debatte um Pubertätsblocker, 13. Oktober 2024, Initiative Queer Nations, https://queernations.de/offene-briefe-und-heuschrecken-gegen-evidenz/
