Wer seine Symptome einem Chatbot statt einem Arzt schildert, unterschlägt wichtige Informationen – und überschätzt die Fähigkeiten der Anwendung. Sitzt das schwächste Glied der digitalen Diagnostik vor dem Bildschirm?
KI-Chatbots sollen Arztpraxen entlasten, Triage beschleunigen, Versorgungslücken schließen. Das Konzept klingt überzeugend – solange man davon ausgeht, dass Patienten der Maschine genauso offen begegnen wie dem Arzt. Genau das tun sie aber nicht. Eine neue Studie, publiziert in Nature Health, liefert dafür erstmals experimentelle Belege.
Das Design ist schlicht, der Befund eindeutig. 500 Probanden verfassten simulierte Symptomberichte zu zwei Krankheitsbildern: ungewöhnliche Kopfschmerzen und Grippe. Die eine Hälfte glaubte, ihr Bericht werde von einem Arzt gelesen. Die andere Hälfte glaubte, ein KI-Chatbot sei der Empfänger. Gemessen wurde die Eignung der Berichte für eine medizinische Dringlichkeitseinschätzung. Der Unterschied ist numerisch unscheinbar, klinisch aber bedeutsam: Gegenüber vermeintlichem Fachpersonal schrieben die Teilnehmer im Schnitt 255,6 Zeichen, gegenüber dem Chatbot nur 228,7 Zeichen. Das Forschungsteam betont: Selbst diese Differenz von 28 Zeichen kann dazu führen, dass hochleistungsfähige KI-Modelle am Ende falsche medizinische Ratschläge geben. Der Effekt zeigte sich übrigens auch bei Teilnehmern, die zum Zeitpunkt der Befragung tatsächlich symptomatisch waren.
Warum liefern Menschen der KI weniger? Die Autoren benennen einen zentralen psychologischen Mechanismus: die sogenannte „Vernachlässigung der Einzigartigkeit“, der Uniqueness Neglect. „Viele Menschen nehmen an, dass eine KI die individuellen Besonderheiten ihrer persönlichen Situation nicht erfassen kann und stattdessen lediglich standardisierte Muster abgleicht“, erklärt Kunde. Hinzu kommen Skepsis gegenüber der Diagnosefähigkeit von Algorithmen und Datenschutzbedenken – beides führt zu abgekürzten, vagen Angaben. Reis bringt es auf den Punkt: „Wenn wir einer Maschine nicht zutrauen, unsere Einzigartigkeit zu verstehen, enthalten wir ihr unbewusst die Informationen vor, die sie für eine präzise Hilfe bräuchte.“ Medizinisch relevante Details kommen so gar nicht erst im System an.
Die Konsequenz, die das Forschungsteam zieht: Bessere Algorithmen allein reichen nicht. Der Engpass ist menschlich, nicht technisch. Als Ausweg schlagen die Autoren ein durchdachteres Interface-Design vor: konkrete Beispiele für hochwertige Symptombeschreibungen und eine KI, die fehlende Details aktiv und gezielt nachfragt. Nur so – so die Einschätzung des Teams – lassen sich Fehlbehandlungen vermeiden und das Gesundheitssystem effektiv entlasten.
Bildquelle: Jayson Hinrichsen, Unsplash