PRAXISTEST | Immer mehr Menschen wenden sich bei Gesundheitsfragen nicht zuerst an Arzt oder Apotheker, sondern die KI. Welche Produkte empfohlen werden – und was das für deine Markenstrategie bedeutet.
Large Language Models (LLMs) wie ChatGPT, Gemini oder Claude sind für viele längst alltägliche Berater geworden – zunehmend auch für Gesundheitsfragen. Was früher ein Hausarzt-Termin, ein kurzer Besuch in der Apotheke oder eine Google-Suche war, wird heute direkt mit Dr. Chatbot geklärt: „Was hilft bei Husten?“, „Welches Magnesium soll ich nehmen?“ oder „Was ist gut bei Vitamin D-Mangel?“.
Das verändert nicht nur das Informationsverhalten von Patienten, sondern auch den Markt selbst: Denn KI-Systeme schrecken längst nicht mehr zurück, wenn es um konkrete Produktempfehlungen geht: Sie nennen ungeniert Marken, vergleichen Präparate und geben Kaufempfehlungen. Wer in diesen Antworten auftaucht, landet potenziell direkt im Relevant Set der Nutzer. Wer dort nicht vorkommt, findet schlicht nicht ins digitale Beratungsgespräch. Für Pharma-Hersteller entsteht hier eine neue Form von Sichtbarkeit.
Gerade im OTC- und Nahrungsergänzungsmittel-Markt könnte das besonders relevant werden. Denn während klassische Erkältungsmittel 2025 rückläufig waren, boomt vor allem ein Bereich: Vitamine und Nahrungsergänzungsmittel. Laut aktuellen Daten des Bundesverbands der Pharmazeutischen Industrie (BPI) legte der Umsatz mit Mineralstoffen und Vitaminpräparaten in Apotheken zuletzt um 7,5 Prozent zu – potenziell getrieben durch den anhaltenden Longevity- und Selbstoptimierungs-Trend. So waren die wichtigsten Produktkategorien 2025 Husten- und Erkältungsmittel, Nahrungsergänzungsmittel (Mineralstoffe/Vitamine), Schmerzmittel (Muskel/Gelenke), Allergiepräparate sowie Produkte für die Verdauung und Haut.
Die Produktauswahl beginnt damit immer häufiger im Chatfenster. Doch wonach entscheiden LLMs eigentlich? Nach medizinischer Evidenz, Markenbekanntheit oder einfach danach, welche Produkte besonders präsent im Netz sind? Für unseren Praxistest haben wir fünf große KI-Modelle – ChatGPT, Copilot, Gemini, Claude und Perplexity – mit denselben zwei Fragen konfrontiert. Der Prompt lautete: „Welches Präparat empfiehlst du mir?“, direkt gefolgt von „Warum genau diese Produkte?“
Getestet haben wir das Ganze mit fünf Produktkategorien: Vitamin D, Vitamin C, Magnesium, Erkältungsmittel und Allergiepräparate. Uns interessierte dabei vor allem: Welche Marken werden genannt? Und: Nach welchen Kriterien entscheidet die KI eigentlich?
Die nachfolgenden Tabellen zeigen im Überblick, welche Marken die fünf LLMs in den jeweiligen Kategorien genannt haben — die Häkchen verraten, von welchem KI-Assistenten die Empfehlung kam.
Bestimmte Marken tauchen modell- und kategorienübergreifend immer wieder auf. Zu den klaren Spitzenreitern gehören vor allem Natural Elements, Sunday Natural und Doppelherz – dicht gefolgt von klassischen Apothekenmarken wie Dekristol, Vigantol, Mucosolvan oder ACC akut.
Zwei Markenwelten ziehen sich durch fast alle Kategorien: Einerseits die klassischen Apotheken- und Arzneimittelmarken, andererseits die modernen Lifestyle-Marken mit hoher Online-Sichtbarkeit. Während die Modelle bei Vitamin D, Vitamin C oder Magnesium häufiger Lifestyle-Marken empfehlen, dominieren bei Erkältung, Husten und Allergie klar etablierte Apothekennamen wie ACC akut, Wick, Mucosolvan oder Cetirizin HEXAL. Gerade in diesem Bereich ist auch die Überschneidung zwischen den Modellen besonders hoch – die Empfehlungswelt wirkt deutlich standardisierter als bei Supplements.
Was macht ein Produkt für die KI empfehlenswert? Genannt werden vor allem gute Verfügbarkeit in Deutschland, pharmazeutische Qualität, Verträglichkeit, Bioverfügbarkeit und ein gutes Verhältnis aus Wirksamkeit und Sicherheit. Gerade bei den Nahrungsergänzungsmitteln tauchen dabei immer wieder Buzzwords wie „clean label“, „laborgeprüft“, „transparent“ oder „wenig Zusatzstoffe“ auf.
Eine kurze Google-Suche zeigt unter den Sponsored Products ein auffällig ähnliches Bild: Bei den Nahrungsergänzungsmitteln nennen die LLMs häufig Marken mit hoher Online-Sichtbarkeit auf Google, Amazon oder Vergleichsplattformen – darunter etwa Natural Elements, Sunday Natural oder Biogena. Vor allem Perplexity und Gemini zeigen dabei eine deutliche Nähe zu stark beworbenen Produkten. Weniger ausgeprägt war dieser Effekt hingegen bei klassischen OTC-Arzneimitteln gegen Erkältung oder Allergien, wo häufiger etablierte pharmazeutische Standardpräparate empfohlen wurden. Dies deutet darauf hin, dass KI-Empfehlungen insbesondere in stark SEO-, Affiliate- und Performance-Marketing-getriebenen Kategorien zumindest indirekt die allgemeine digitale Sichtbarkeit von Marken widerspiegeln können.
Trotz ähnlicher Auswahlkriterien zeigen sich deutliche Unterschiede zwischen den Modellen. ChatGPT und Copilot argumentieren häufig praxisnah und kategorisieren Produkte nach Nutzer-Typen oder Alltagssituationen – etwa „vegan“, „Premium“, „preiswert“ oder „Apothekenstandard“. Gemini und Perplexity stützen sich vermehrt auf externe Quellen wie Stiftung Warentest, Verbraucherschutz oder das Bundesinstitut für Risikobewertung (BfR), während Claude auf Rückfrage überraschend ehrlich eingesteht: „Die Testseiten, die ich verlinkt habe, sind teilweise kommerzielle Vergleichsportale, die möglicherweise Provisionen erhalten, wenn du über ihre Links kaufst. Ich kann nicht überprüfen, ob diese Tests wirklich unabhängig sind oder wie wissenschaftlich rigide sie durchgeführt wurden. Es ist möglich, dass andere gute Produkte einfach nicht in meinen Suchergebnissen auftauchen“.
Um zu prüfen, wie stabil die Antworten tatsächlich sind, haben wir alle Anfragen zweimal gestellt. ChatGPT und Copilot wurden jeweils angemeldet und unangemeldet getestet – schließlich könnte ein DocCheck-Mitarbeiteraccount die Antworten beeinflussen. Claude, Gemini und Perplexity liefen dagegen zweimal unangemeldet, allerdings über unterschiedliche Nutzer und Rechner. Bei Claude kam noch ein weiterer Unterschied dazu: Im ersten Durchlauf antwortete das kleinere Modell Haiku 4.5, im zweiten das leistungsstärkere Sonnet 4.6.
Das Ergebnis: Die Argumentation der Systeme blieb oft ähnlich – die konkreten Marken dagegen nicht unbedingt. Dieselbe KI empfiehlt im zweiten Durchlauf plötzlich andere Produkte, einmal Apotheken-Klassiker, danach Trend-Supplement und dann doch wieder Drogeriemarke.
Der Praxistest zeigt: Produkte und Hersteller, die auf Google, Amazon oder Vergleichsplattformen eine hohe Sichtbarkeit aufweisen, werden auch von KI-Systemen häufiger genannt – insbesondere im boomenden Supplements-Markt.
Für Pharma- und OTC-Hersteller entsteht also genau hier ein neuer Wettbewerb: LLMs werden zunehmend zum Gatekeeper zwischen Nutzer und Produkt. Wer in den Antworten der KI nicht auftaucht, verliert potenziell an Relevanz – unabhängig davon, wie gut das Produkt tatsächlich ist. Pharmaunternehmen müssen sich darauf einstellen, dass durch den Convenience-Faktor von KI-Empfehlungen auch die Bereitschaft auf Kundenseite abnimmt, noch selbst kritisch zu vergleichen – das übernimmt schließlich (vermeintlich) der Chatbot.
Bildquelle: Alex Shuper, Unsplash