Beim letzten KI-Treff ergriffen wir die Gelegenheit, zwei nicht mehr ganz neue KI-Werkzeuge genauer zu betrachten, die versprechen, uns die oft etwas lästige Alltagsaufgabe des Protokollierens abzunehmen: den Zoom AI Companion und Fathom AI. Wir betrachten Kosten, Zugänglichkeit und Zuverlässigkeit dieser Tools.

Zoom AI Companion: KI-Begleitung im und nach dem Meeting

Zooms Companion wurde schon im vergangenen Jahr veröffentlicht, hatte aber in der Startphase große Probleme mit Deutsch bzw. anderen Sprachen als Englisch. In den Monaten seitdem hat sich aber einiges getan und der Companion kann inzwischen auch Meetings auf Deutsch gut verarbeiten. Wir haben uns den Companion also nochmal vorgenommen und getestet, was er inzwischen kann. Dabei haben wir uns vor allem auf die protokollierenden und zusammenfassenden Funktionen konzentriert.

Um Zugriff auf die KI-Funktionen von Zoom zu haben, braucht man ein kostenpflichtiges Zoom-Abo. Im Basic-Modell ist der Companion nicht enthalten. Wer das Abo hat, hat automatisch Zugriff: Unter „Kontoverwaltung“ finden sich die entsprechenden Einstellungen, um den Companion zu aktivieren. Praktisch ist natürlich, dass die Eigenentwicklung von Zoom auch für die bestmögliche integration im Meeting sorgt, man braucht keine externen Tools, offenen Fenster, eingebundenen Plugins o.Ä., sondern bekommt einfach einen neuen Button im Meeting, neben den anderen Zoom-Kontrollelementen (Kamera, Ton, Breakout usw.). Wenn aktiviert, können Teilnehmer:innen des Zoom-Meetings mit dem Zoom Companion chatten wie mit einem Chatbot und Fragen zum laufenden Meeting stellen – Was wurde bisher besprochen? Wurde mein Name erwähnt? Welche Aufgaben wurden bisher festgehalten? Es kann sogar eingestellt werden, dass später hinzukommende Teilnehmer:innen auch rückwirkend Fragen zu dem Teil des Meetings stellen können, den sie verpasst haben.

Die vielleicht noch spannendere Funktion des Companions ist allerdings die sogenannte intelligente Zusammenfassung, die man auch direkt im Meetings starten kann. Mit dieser Funktion protokolliert der Companion automatisch das gesamte Meeting. Im Anschluss an dauert es einige Minuten, dann kann die Zusammenfassung im eigenen Zoom-Konto abgerufen werden. Automatisch erzeugt die KI hierfür thematisch gegliederte Abschnitte aus den Themen des Meetings und fasst darunter das besprochene zusammen. Zudem endet die Zusammenfassung mit einer Auflistung aller vom Companion erkannten Aufgaben, die sich eventuell aus der Besprechung ergeben haben. Diese Zusammenfassung kann man entweder automatisch an alle Teilnehmenden senden lassen oder zunächst direkt im Zoom-Konto händisch nachbearbeiten (dazu würden wir, nach unseren Tests, unbedingt raten).

Das klingt alles toll – aber wie gut funktioniert das? Ohne die Begeisterung direkt dämpfen zu wollen: Die Ergebnisse sind durchwachsen. Die Fragen, die man während des Meetings an den Companion stellen konnte, wurden im Schnitt bei unserem Ausprobieren ganz gut beantwortet. Allerdings kann man sich eindeutig nicht alleine auf die Informationen hier verlassen, weil die KI doch immer wieder nicht ganz verstanden hat, was besprochen wurde und die Fragen falsch beantwortet. Für die intelligente Zusammenfassung gilt im Grunde dasselbe. Sie funktioniert sehr gut als Gedächtnisstütze, als Stichpunkte für ein selbst erarbeitetes Protokoll bzw. als Rohfassung, mit der man sich noch gründlich auseinandersetzen muss. Die Herausforderung für die KI besteht vor allem darin, die wirklich wichtigen Aspekte eines Gesprächs präzise zu erkennen, was vermutlich daran liegt, dass dem Companion das genaue Thema der Veranstaltung nicht bekannt ist. Den Kontext des Meetings im Gespräch nochmal klar und deutlich zu benennen, könnte hier Abhilfe schaffen und die Ergebnisse verbessern.

Fathom AI: Aufzeichnung mit KI-Analyse

Neben Zoom Companion als nativer Lösung für automatisierte Protokolle gibt es zahlreiche andere Apps und Tools, die dasselbe versprechen. Ein Beispiel dafür ist Fathom, ein ziemlich ausgereiftes Angebot für Meeting-Zusammenfassungen. Fathom kann in einer kostenlosen Version ziemlich umfangreich genutzt werden und zwingt nicht zu einem kostenpflichtigen Abo, lockt aber mit vielen praktischen Funktionen in der Premium-Version. Anders als beim Zoom Companion muss man für Fathom den Fathom-Bot als Meeting-Teilnehmer hinzufügen und das Meeting vollständig (mit Video) aufzeichnen. Diese Aufzeichnung steht einem dann im Fathom-Konto zur Verfügung und in der kostenlosen Version hat man die Option, sich eine eher stichpunktartige, chronologische Zusammenfassung des Meetings anzuschauen. Daneben kann man sich auch das gesamte Transkript der ganzen Veranstaltung anzeigen lassen und durchsuchen, wobei Fathom dann immer auch die dazu passende Stelle in der Video-Aufzeichnung anzeigt. Während des Meetings kann man Fathom ein Signal geben, wenn man etwas, was gerade gesprochen wird, als „Highlight“ markieren möchte.

An sich hat Fathom spürbar weniger Probleme damit, die Inhalte eines Meetings zu erkennen und passend wiederzugeben. Allerdings kommt Fathom mit einigen anderen Nachteilen. Der größte ist sicherlich, dass die Anwendung vollständig auf Englisch funktioniert und dass auch die Zusammenfassung des Meetings automatisch auf Englisch generiert wird. Wir haben keine Möglichkeit gefunden, das zu ändern. Im Gegensatz zur intelligenten Zusammenfassung von Zoom Companion, deren Ausgabe schon dicht an ein Fließtext-Protokoll herankommt, strukturiert Fathom eben viel kleinteiliger und knapper. Auch hier ist man also darauf angewiesen, selbst umfangreich mit dieser Gedächtnisstütze weiterzuarbeiten und die Formulierungsarbeiten selbst zu übernehmen.

Abschließende Gedanken: Intime Räume und automatische Protokolle

Wir fahren stellenweise beeindruckt von unseren Tests, aber noch längst nicht restlos begeistert. Als Gefühl blieb aber zurück, dass sich in den kommenden Monaten auf dem Gebiet von automatisierten Zusammenfassungen für digitale Meetings noch einiges tun wird. Besonders von Zoom Companion kann man sicher erwarten, dass er in kurzer Zeit noch um einiges besser werden wird. Das automatische aufzeichnen und auswerten von Gesprächen ist sicher eine Stärke von KI, die in Form von KI-Protokollen noch viel Potenzial hat, zeitraubende Alltagsaufgaben zu verkürzen.

Zu bedenken ist allerdings, wie man die Tools einsetzt. Zoom Companion lässt sich automatisch zu jedem Meeting starten – dazu würden wir nicht raten. So entstehen keine intimen, vertrauensvollen Gesprächsräume mehr, jedes Wort könnte potenziell im Protokoll landen. Stattdessen würden wir empfehlen, an passender Stelle transparent zu kommunizieren, dass man ab diesem Zeitpunkt den Zoom Companion einschaltet und dieser dementsprechend als Chatbot zur Verfügung steht – und die Zusammenfassung übernimmt, sodass alle Teilnehmenden wissen, wenn ihre Beiträge protokolliert werden. Insbesondere ist das relevant, weil Zoom Companion eben noch Schwierigkeiten hat, private und fachliche Äußerungen zu trennen und, anders als ein:e menschliche:r Protokollant:in, bemüht ist, alles gesagte festzuhalten.

Für die Verwendung von Fathom ist die Zustimmung der Teilnehmenden ohnehin unumgänglich, da Fathom eine Videoaufzeichnung des Meetings macht und Zoom allen Teilnehmenden automatisch die Wahl lässt, ob sie das Meetings verlassen wollen, wenn sie nicht mit der Aufzeichnung zufrieden sind. Diese videobasierte Art des protokollieren ist noch weniger geeignet für intime Räume und führt, unserer Meinung nach, eher zu sterilen Settings – trotz aller Vorteile von Fathom hat sich auch deswegen für uns der Einsatz nicht ganz stimmig angefühlt.

Für die Zukunft bleiben noch viele weitere Tools zum Thema KI-Protokolle zu testen. Der Zoom Companion bietet zudem noch weitere KI-Funktionen, die mit Zoom-Elementen wie dem fortlaufenden Meeting-Chat usw. interagieren, um die es uns hier nicht ging. Spannend wäre auch, wie die Zusammenarbeit zwischen den Ergebnissen einer protokollierenden KI und beispielsweise ChatGPT funktionieren kann. Kann ChatGPT automatisch protokollierte Stichworte zu einem guten Protokoll umschreiben? Gibt es in ChatGPT 4.0 vielleicht schon Custom GPTs (hier haben wir Custom GPTs besprochen), die auf Protokolle hin trainiert sind – oder wie könnte man selbst ein solches Custom GPT erstellen? Diese Fragen behalten wir im Hinterkopf, um sie an passender Stelle nochmal einzubringen im KI-Treff.