Umfragen auswerten, große Feedback-Datensätze analysieren, hunderte von Excel-Zeilen bearbeiten – das alles sind anstrengende, zeitaufwendige Aufgaben des Alltags. Können wir uns hierbei Hilfe von KI erhoffen? Im letzten KI-Treff stand die Datenverarbeitung mit künstlicher Intelligenz im Mittelpunkt. Mit einem komplexen Beispieldatensatz haben wir den aktuellen Stand der Datenauswertung mit Julius.ai, Vizly und ChatGPT getestet. Alle Tools können eingeschränkt kostenfrei genutzt werden.

Julius: Vielversprechende Analyse mit Raum für Verbesserung

Julius.ai erwies sich als ein vielversprechendes Tool für die demografische Analyse und die Visualisierung von Daten. Besonders in der grafischen Darstellung von demografischen Informationen konnte Julius punkten und lieferte präzise und ansprechende Diagramme. Diese Stärke zeigte sich insbesondere in der Fähigkeit, numerische und kategorische Daten sinnvoll darzustellen, was es für viele Anwendungsfälle interessant macht. Es ist beeindruckend zu sehen, wie in wenigen Sekunden beispielsweise ein Graph der Altersverteilung einer Umfrage erstellt wird. Die Auswertung solcher simplen Datenbezüge funktionierte sehr gut.

Allerdings zeigte Julius Schwächen bei der Analyse qualitativer Korrelationen. Das Tool hatte Schwierigkeiten, komplexere Zusammenhänge zwischen nicht-numerischen Datenpunkten zu erkennen und korrekt zu interpretieren. Hier wurde deutlich, dass für eine optimale Nutzung von Julius mehr Übung und Anpassung der Methoden und der Ausgangsdaten erforderlich sind. Dennoch bleibt Julius ein leistungsfähiges Tool, das mit gezielten Verbesserungen und weiterem Training eine wertvolle Ergänzung für die Datenanalyse sein kann, insbesondere da Julius als KI speziell für diesen Anwendungsfall entwickelt wurde. Julius bietet auch zahlreiche Vorlagen für einen leichten Einstieg in bestimmte Arten der Datenanalyse. Obwohl die Website nur auf Englisch verfügbar ist, versteht Julius auch Deutsch.

Vizly: Potenzial mit deutlichen Einschränkungen

Vizly haben wir mit demselben Datensatz getestet wie Julius, das Tool konnte uns jedoch nicht vollständig überzeugen. Auf den ersten Blick bietet Vizly ähnliche Funktionen wie Julius und ChatGPT, doch in der Praxis traten schnell Probleme auf. Bei den gleichen Prompts und Aufgaben, die auch für die anderen Tools verwendet wurden, zeigte Vizly eine höhere Fehleranfälligkeit. Es wurden unerwartete Ergebnisse produziert, und die Analyseprozesse schienen weniger stabil zu sein. Die KIs funktionieren nur, wenn sie die Daten gut verarbeiten können. Dafür müssen die Daten natürlich gut aufbereitet sein, aber Vizly produzierte häufiger Fehler als Julius mit der selben Beispieldatei. Das Problem lag also nicht nur bei nicht zutreffenden oder ungenauen Datenanalysen, sondern bei der technischen Herausforderung, die Daten einzulesen. Wir haben Vizly dementsprechend nur kurz angetestet. Als Tool ist es aber noch auf einem spannenden Entwicklungsweg und hat das Potenzial, mit einer Anwendung wie Julius in der Zukunft mitzuhalten. Insbesondere für kleinere, weniger komplexe Datensätze kann es sehr gut genutzt werden.

ChatGPT: Der klare Favorit in der Datenverarbeitung

ChatGPT zeigte sich in unseren Tests als das leistungsstärkste Tool, insbesondere in der Analyse numerischer Daten und deren Visualisierung. Das war zunächst eine Überraschung für uns – schon in der Vergangenheit hatte jede:r von uns mal getestet, Tabellen von ChatGPT auswerten zu lassen und im Schnitt keine brauchbaren Ergebnisse erhalten. Die offenbar kürzlich erfolgten Verbesserungen in der Datenverarbeitung von ChatGPT machen es aber jetzt zu einem äußerst nützlichen Werkzeug für die Analyse von Datensätzen. Besonders beeindruckend war die Fähigkeit, statistische Relevanzen zu erkennen und klar darzustellen. Außerdem können die Analysen jetzt auch als normale und interaktive Graphen dargestellt und heruntergeladen werden.

Für ChaGPT haben wir zunächst die Möglichkeiten getestet, indem wir ChatGPT selbst um einen komplexen Beispieldatensatz aus dem Bildungsbereich gebeten haben. ChatGPT hat umfangreiche fiktive Feedback-Daten ausgedachter Kurse erstellt, die gut mit unseren möglichen Anwendungsfällen übereinstimmten. Die Analyse dieser Daten funktionierte natürlich besonders gut, da die Formatierung der von ChatGPT selbst erzeugten Excel-Datei vom Tool besonders gut zu verarbeiten war.

Im Anschluss haben wir den schon zuvor mit Julius und Vizly verwendeten Datensatz auch mit ChatGPT genutzt und auch hier gute Analysen bekommen. Allerdings sind wir auf ein spannendes Problem gestoßen, das ein gutes Beispiel für die Herausforderungen der Datenaufbereitung für KI ist: Bei der Korrelation der Daten von Umfrage-Antworten mit dem Geschlecht der Antwortenden hat ChatGPT aus für uns zunächst nicht nachvollziehbaren Gründen darauf bestanden, dass alle Teilnehmenden der Umfrage männlich waren. Erst nach einigen Tests ist klar geworden: Das Geschlecht war im Beispieldatensatz auf Englisch notiert und aufgrund der Tatsache, dass das Wort „female“ das Wort „male“ enthält, interpretierte ChatGPT alle Teilnehmerinnen fälschlicherweise als männlich. Im Gespräch mit ChatGPT konnte dieses Problem aber behoben werden, indem wir darum gebeten haben, auf den Unterschied zwischen „female“ und „male“ zu achten, anstatt alle Instanzen des Wortes „male“ zu zählen. Diese Erfahrung unterstreicht aber die Notwendigkeit, Datensätze sorgfältig zu überprüfen, bevor sie einer KI zur Analyse übergeben werden.

Neben dieser kleineren Herausforderung überzeugte ChatGPT aber mit Abstand am meisten, vor allem durch seine Fähigkeit, sowohl quantitative als auch qualitative Daten erfolgreich zu verarbeiten und zu visualisieren.

Fazit

Wir waren überrascht, hier von ChatGPT so überzeugt zu sein. Die Neuerungen in ChatGPTs Datenverarbeitung waren bisher an uns vorbei gegangen, obwohl sie die Nützlichkeit des Tools nochmal deutlich erhöhen. Auch Julis und Vizly sind als Tool beeindruckend, aber ChatGPT hat natürlich den Vorteil, dass man viele Anwendungsfälle auf einer Plattform bearbeiten kann. Insbesondere Julius ist aber für Anwendungsfälle wie naturwisschenschaftliche Analysen, die wir in unserem Bereich nicht haben, sicherlich ein kompetenter Begleiter mit vielen spannenden Anwendungsbeispielen, aus denen man als Nutzer:in viel über die Datenanalyse mit KI lernen kann. Insgesamt beeindruckend uns die Ergebnisse aller Plattformen im Allgemeinen – Im Gegensatz zum KI-gestützten Protokollieren, wo noch einiger Raum zur Verbesserung deutlich war, sehen wir hier die deutlichen Arbeitsentlastungen, die diese Entwicklungen jetzt schon und in Zukunft sowieso bedeuten werden.