JUGA in der ZfG

Die JUGA gestalten einen Bereich in der monatlich erscheinenden Zeitschrift für Gastroenterologie. Hier findet Ihr eine Auswahl der erschienenen Beiträge.

KI-Werkzeuge als smarte Helfer in Klinik und Forschung

Die Blockchain ist out – Künstliche Intelligenz (KI) ist in! Und wie immer, wenn eine neue Technik den Markt erobert, ist die Euphorie erstmal groß. Im klinischen Alltag trifft man jedoch den Analog-Digital-Wandler-Assistenzarzt, der Medikationspläne vom Papier ins digitale Format überträgt, noch häufiger an als seinen KI-unterstützt effizienzgesteigerten Kollegen. Das liegt nicht nur daran, dass viele Anwendungsfälle noch nicht die Reife für den Einsatz am Patienten haben, sondern auch an ungeklärten ethischen und rechtlichen Fragen. Wir wollen euch ein paar Tools vorstellen, die man in der Klinik und Forschung heute schon sinnvoll einsetzen kann. KI ist ein dynamisches und exponentiell wachsendes Feld, die hier vorgestellten Tools sind zwangsläufig nur eine kleine Auswahl der vielfältigen verfügbaren Tools – wir hoffen, dass für jeden Leser etwas dabei ist.

Klinik

KIs zur Polypenerkennung (Computer aided detection, CADe) stellen die ersten in der Breite sichtbaren KIs in der Gastroenterologie dar und werden mittlerweile von den großen Endoskop-Herstellern angeboten. In einer Meta-Analyse zeigt sich eine Steigerung der Adenom-Detektions-Rate von 10,8% [1]. Da vornehmlich kleine Polypen unter 5mm zusätzlich erkannt werden, wird sich der Stellenwert von CADe in Abhängigkeit von nationalen Vorsorgestrategien noch zeigen müssen. Wer CADe selbst ausprobieren möchte, der kann die CEDe KI von Alexander Hann und Kollegen ausprobieren. Kosten fallen nur für die anzuschaffende Hardware an [2]. Der nächste Schritt, die Polypenklassifikation (Computer aided diagnosis, CADx) wird mittlerweile auch angeboten, beispielsweise im CAD-EYE von Fujifilm. CADx könnte dazu führen, den Leave-in-situ und Resect-and-Discard Strategien neues Leben einzuhauchen. Eine gute Datenbasis dafür fehlt aber noch.

Darüber hinaus ist das Feld von KI in der Gastroenterologie überschaubar: Eine aktuelle Übersichtsarbeit hat ClinicalTrails.gov nach KI-Projekten in der Gastroenterologie durchsucht und 103 registrierte Studien gefunden [3]. In 74% davon wird KI in der Endoskopie eingesetzt, tatsächlich dreht sich die Hälfte aller Projekte um CADe und CADx. Die Forschergemeinschaft sucht anscheinend noch nach sinnvollen Anwendungsfällen in der Gastroenterologie…

Generative KI

In Abwesenheit spezifischer KI-Lösungen bleibt nur der Blick auf allgemeiner anwendbare generative KI wie OpenAIs ChatGPT, Googles Bard und META AIs Llama 2. In der Medizin und Forschung wirft der Einsatz von KI-Tools gleichermaßen widersprüchliche Gefühle auf. Während einige großes Potential von ChatGPT & Co. in der Anwendung als Schreibassistent, Übersetzer bis zur Projektplanung sehen, stehen diesen berechtigte Bedenken zu Datenschutz und Sicherheit gegenüber. Sensible Patientendaten auf ausländische Server privatwirtschaftlicher Unternehmen hochzuladen, verbietet sich aus Gründen des Datenschutzes, was den Einsatz generativer KI in der Klinik einschränkt. Die einfache und schnelle Zugänglichkeit von ChatGPT & Co. auf medizinische Fragen im schnellen Klinikalltag ist verlockend, jedoch kann die Qualität und Verlässlichkeit nicht geprüft werden. Dazu kommt die Neigung dieser Modelle zur Halluzination, also zum Erfinden von Informationen: Sucht man beispielsweise nach einem Paper zu einem bestimmten Thema, bekommt man auch eines – nur ob es wirklich existiert, ist fraglich. Ein schönes dokumentiertes Beispiel für diese Halluzination sind ausgedachte Gerichtsurteile, die einen New Yorker Anwalt in Bedrängnis brachten [4].

Um die Stärken und Schwächen von KI-Tools zu verstehen, muss man sich die Basis der zugrundeliegenden Systeme anschauen. Diese sogenannten Large Language Models (LLMs) sind große generative Sprachmodelle, welche auf Basis von gigantischen Datensätzen trainiert werden. Die Qualität und der Wissensschwerpunkt des Trainingsdatensatzes bestimmt die Qualität des Outputs der LLMs. Basierend auf diesem Trainingsdatensatz bauen LLMs ihre Antwort aus Wörtern und Phrasen – ohne eigenes Bewusstsein – nach den wahrscheinlichsten Kombinationsmöglichkeiten zusammen. Diese Antwort muss weder richtig noch auf Basis tatsächlicher Fakten basieren und ist zudem direkt abhängig von der Genauigkeit unserer Fragestellung. Generell gilt, je klarer und präziser die Aufgabe (“Kürze diesen Abstract um 4 Worte”), desto besser sind die Ergebnisse. Diese lassen sich weiter verbessern, indem kontextuelle Informationen mitgeliefert werden: Welche Rolle hat der Fragesteller? In welcher Form wird die Antwort gewünscht? Sollen bestimmte Dokumente für die Antwort berücksichtigt werden? Die systematische Verbesserung der Eingabeaufforderungen nennt sich Prompt Engineering und hat wesentlichen Einfluss auf die Qualität der Ergebnisse. Unter diesem Stichwort finden sich zahlreiche Tipps im Internet [5].

Auch wenn die Hersteller über die genaue Herkunft der Trainingsdatensätze schweigen, ist bekannt, dass die größten LLMs, wie ChatGPT & Co. mit sehr breit aufgestellten Wissensquellen trainiert wurden [6]. Das macht diese LLMs stark in der breiten Beantwortung von Wissensfragen und Anwendungen, jedoch fehlt es ihnen teilweise an Tiefenschärfe in spezialisierten Wissensgebieten, wie der Medizin und Forschung [7].

Hier bieten Medizin-spezifische Generative KIs großes Potential. Med-PaLM 2 von Google besteht in internen Benchmarks das Mediziner-Staatsexamen in den USA (USMLE) zuverlässig . Leider steht es der Öffentlichkeit ebenso wie sein Vorgänger noch nicht zur Verfügung. Wer dennoch generative KI in der Klinik nutzen möchte, kann Glass AI (https://glass.health/ai/) ausprobieren. Durch Limitierung des Funktionsumfang (Fallzusammenfassung, Differentialdiagnose und Behandlungsplan) und klare Anweisung für den Promptaufbau, sowie weiteres Prompt Engineering im Hintergrund vor Eingabe in GPT-4 und einer (nicht KI-lichen) Qualitätsprüfung werden durchaus nützliche Informationen generiert, die sich in eigenen Versuchen etwa auf der Ebene eines Alt-Assistenten oder jungen Facharztes bewegen.

Forschung

Auch in der Forschung gibt es eine enorme Entwicklung in KI-Tools, die speziell auf die Bedürfnisse in der Forschung zugeschnitten sind. Wer hat sich nicht schon gewünscht, während der Literaturrecherche, dem Lesen und Schreiben wissenschaftlicher Publikationen einen Begleiter an seiner Seite zu haben? Einen, der jederzeit für Brainstorming und Fragen zur Verfügung steht, der knappe, prägnante Zusammenfassungen liefert und Empfehlungen für weiterführende Literatur parat hat?

Persönliche KI-basierte Forschungsassistenten, wie SciSpace Copilot, stehen bei der Literaturrecherche und Lesen von Publikationen zur Seite. Die Chrome Erweiterung ermöglicht Echtzeit-Unterstützung bei der Zusammenfassung von Webseiten und wissenschaftlichen Artikeln und bietet Erklärungen zu enthaltenen Tabellen, Diagrammen oder Fachjargon direkt auf dem Bildschirm an.

Wissenschaftliche Chatbots wie Elicit.com und Scite.ai geben wissenschaftliche Antworten, basierend auf echter Literaturrecherche und Angabe hochwertiger Publikationen mit direkter Export-Möglichkeit zu etablierten Literaturverwaltungsprogrammen.

ResearchRabbit.ai, das “Spotify der Forschung”, hilft dabei auf dem Laufenden zu bleiben und visualisiert die wissenschaftliche Netzwerke hinter relevanten Papern. Mit

KI-gepowerten Suchmaschinen wie Sematic Scholar wird passende Literatur effizient aus über 200 Millionen wissenschaftlichen Publikationen gefunden. Für systematische Literaturrecherchen kann man mit Rayyan.ai oder SystemPro AI arbeiten. Automatische Zusammenfassungen einer oder mehrerer ausgewählter Paper generieren Humata.ai und Scholarcy.com. Mit Chat-Funktion kann man gezielt Informationen aus den Publikationen extrahieren.

Auch beim wissenschaftlichen Schreiben können eine Reihe von KI-Plattformen unterstützen. Vom Forschungsantrag (mit grantable.co), über die Literaturrecherche und Verfassung des ersten Manuskriptdrafts (mit Jenni.ai) bis zum Finden des richtigen Journals und Finalisierung des Manuskripts inklusive Korrekturlesen, wissenschaftlicher Tonanpassung, Kürzen, Prüfung der Referenzen, Konsistenz- und Plagiatscheck, sowie Einhaltung der regulatorischen Anforderungen vom Journal (mit Trinka.ai).

Englisch ist nicht deine Muttersprache? Übersetzungsplattformen, wie DeepL Translate oder direkte Sprachkorrekturassistent-Plugins in Word, wie Quillbot oder Grammarly, geben während des Schreibens direktes Feedback zur Rechtschreibung, Grammatik, aber auch Formulierungen.

Aber auch allgemeine KI-Tools für das optimierte Projekt- und Contentmanagement (mit Notion.ai oder Iris.ai), Meeting Notes (z.B. Fathom.video, Fireflies.ai), Präsentationen erstellen (mit z.B. decktopus AI, beautiful.ai oder slidesai.io) oder Bildgenerierung (Midjourney, Canva.com) können den Alltag in der Forschung effizienter gestalten.

So vielseitig die Einsatzmöglichkeiten von KI-Tools in der Forschung sind, dabei gilt immer: KI-Plattformen sollten immer ethisch und verantwortungsbewusst genutzt werden, um den Forschungsprozess zu unterstützen, aber können und sollen niemals die Originalität von Forschern ersetzen.

Fazit und Ausblick

KI bietet großes Potential für Klinik und Forschung. Dem steht insbesondere in der Klinik ein noch ungeklärter rechtlicher und ethischer Rahmen sowie Datenschutzbedenken entgegen. Generelle Generative KI wie ChatGPT & Co brillieren durch ihre schnelle Zugänglichkeit und breite Anwendung, aber auch durch die Gefahr für Falschinformationen und fehlende Tiefenschärfe. In den nächsten Jahren werden spezialisierte Medizin KI verfügbar werden, die den Stellenwert in der Patientenversorgung erst definieren.

KI ist als Helfer in der Forschung schon breiter einsetzbar als bei der Arbeit am Patienten und kann den Workflow von der Konzeption bis zur Veröffentlichung effektiv unterstützen. Mit einem tieferen Verständnis für KI können wir zum sicheren Einsatz dieser vielversprechenden Technologie beitragen.

Infobox:

KI birgt in Forschung und Klinik enormes Potenzial, doch Datenschutzfragen und der ethisch-rechtlich Rahmen sind noch ungeklärt. Spezialisierte KIs könnten bald die Klinik revolutionieren. In der Forschung bieten KI-Tools bereits leistungsstarke Assistenten für Literaturrecherche, Manuskripterstellung und sogar Brainstorming.

Literatur:

[1] Sivananthan A, Nazarian S, Ayaru L, et Does computer-aided diagnostic endoscopy improve the detection of commonly missed polyps? A meta-analysis. Clin Endosc. 2022;55(3):355-364. doi:10.5946/ce.2021.228

[2] Lux TJ, Banck M, Saßmannshausen Z, et Pilot study of a new freely available computer-aided polyp detection system in clinical practice. Int J Colorectal Dis. 2022;37(6):1349-1354. doi:10.1007/s00384-022-04178-8

[3] Koleth G, Emmanue J, Spadaccini M, et al. Artificial intelligence in gastroenterology: Where are we heading?. Endosc Int 2022;10(11):E1474-E1480. Published 2022 Nov 15. doi:10.1055/a-1907-6569

[4][4]

https://www.spiegel.de/netzwelt/apps/new-york-anwalt-blamiert-sich-mit-fake-urteilen-aus-ch

 atgpt-a-8935d1c8-b6c2-4079-8ecd-1cf4c2d33259, abgerufen am 03.10.2023

[5] Ng , & Fulford I. (2023, May 30). ChatGPT prompt engineering for developers. DeepLearning.AI.

https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/

[6] Zandt (2023, May 11). Infografik: Womit werden ChatGPT & Co. trainiert? Statista Daily Data. https://de.statista.com/infografik/29968/kategorien-in-googles-c4-korpus/

[7] AlZaabi , ALAmri A., Albalushi H., Aljabri R., & AAlAbdulsalam, A.K. (2023). ChatGPT applications in Academic Research: A Review of Benefits, Concerns, and Recommendations. bioRxiv.

[8] Singhal K, Tu T, Gottweis J, et Towards Expert-Level Medical Question Answering with Large Language Models. https://arxiv.org/abs/2305.09617

Ein Beitrag von Miriam Bittel, Bamberg und Jakob Garbe, Halle

© 2023