Inhaltsverzeichnis
In den letzten Monaten hat die Welt der künstlichen Intelligenz (KI) signifikante Fortschritte erlebt, angeführt von zwei Giganten: Google mit seinem neuesten KI-Modell, Gemini und OpenAI mit ChatGPT. Die Ankündigung von Google, eine AI entwickelt zu haben, die GPT-4 übertrifft, löste eine Welle der Aufregung und Skepsis aus. Jene wurde durch die Veröffentlichung eines Videos verstärkt, in dem Gemini Ultra menschenähnliche Konversationen führt – ein Video, das später als überwiegend inszeniert enthüllt wurde. Doch die jüngste Einführung von Gemini Advanced hat die Diskussion neu entfacht: Ist Gemini tatsächlich in der Lage, ChatGPT den Rang abzulaufen?
Gemini Advanced, die bessere Wahl?
- Umfassendes Paket inklusive Google One-Abonnement, Cloud-Speicher, Google-Apps-Integration.
- Schnellere Leistung bei Textzusammenfassung, Bildgenerierung, Codierung.
- Überlegen in Kreativität: Besonders leistungsstark beim Verfassen von Gedichten.
- Bietet im Vergleich zu ChatGPT Plus höhere Qualität und Vielseitigkeit in kreativen Inhalten.
Die Wiedergeburt von Bard als Gemini
Vor einigen Tagen stieß ich auf Google’s Ankündigung von Gemini, einem neuen AI-Modell, das in einem beeindruckenden Video präsentiert wurde und die Fähigkeiten von ChatGPT herausfordern sollte.
Die Aufregung in den sozialen Medien war unübersehbar und auch ich teilte meine Begeisterung, diskutierte die potenziellen Auswirkungen und tauschte Erfahrungen mit anderen aus, die es auf Bard, einer Plattform, die Gemini nutzt, ausprobiert hatten.
Doch nicht lange danach kamen Berichte ans Licht, die enthüllten, dass das Demo-Video von Google manipuliert worden war, um die Fähigkeiten von Gemini in einem besseren Licht darzustellen, als es der Realität entsprach. Google rechtfertigte dies mit dem Hinweis auf die gekürzten Latenzzeiten und Ausgaben für die Demonstration, betonte aber das zukünftige Potenzial von Gemini.
Trotz der Kontroverse war meine Neugier ungebrochen und ich beschloss, einen direkten Vergleich zwischen ChatGPT und dem “neuen” Gemini durchzuführen. Als regelmäßiger Nutzer von GPT-4, der es für alles von der Programmierung bis zur Recherche verwendet, war ich gespannt, ob Gemini tatsächlich eine überlegene Alternative bieten könnte.
Der Zugriff auf Gemini Advanced ist momentan ausschließlich über das neue Google One AI Premium-Abo möglich, welches für 21,99 Euro pro Monat nicht nur den Zugang zum fortschrittlichsten KI-Modell bietet, sondern den Nutzern auch 2 TB Google Drive-Speicher sowie weitere Google Workspace-Funktionen zur Verfügung stellt.
Gemini vs. ChatGPT
Mein Ersteindruck von Gemini Advanced
Ein erster bemerkenswerter Unterschied zwischen Gemini und ChatGPT ist die Geschwindigkeit. Gemini arbeitet zwei bis drei Mal schneller als GPT-4, was zweifellos einen Vorteil in der Benutzererfahrung darstellt.
Das wichtigste für mich ist aber ganz klar, die Qualität der Antworten
Kreativität
- Ein kreativer Test, bei dem beide Modelle gebeten wurden, ein Gedicht im Stil von Bukowski über Java Script zu verfassen, offenbarte signifikante Unterschiede:
“Schreibe mir ein kreatives Gedicht im Stile Bukowski über Java Skript”
ChatGPT:
“In einer Kneipe, versteckt in Codes und Scripts,
Sitzt ein Kerl, mit Augen müde, die Nacht verdreht.
Sein Glas gefüllt mit Whiskey, klar und rein,
Er tippt, verwirrt von JavaScript, dieser digitalen Pein.
„Verdammt“, murmelt er, „diese Syntax ist ein Graus,
Ein endloser Kampf, ein ewiges Chaos im Haus.
Wo Funktionen und Variablen wild umherschweifen,
Versuche ich, in diesem Wahnsinn meinen Verstand zu schleifen.“
Die Nacht zieht weiter, der Code wird nicht klarer,
Fehlermeldungen flackern, kryptisch und narrer.
„Ein Dichter“, denkt er, „in einer Welt ohne Reim,
Gefangen in Schleifen, ein Leben so keim.“
Er hebt sein Glas, in Hoffnung auf Erleuchtung,
In diesem Meer aus Code, sucht er nach Bedeutung.
„JavaScript, du Biest, so wild und so frei,
Zeig mir den Weg, mach mich irgendwie dabei.“
Die Stunden verrinnen, der Morgen bricht an,
Sein Programm läuft endlich, er glaubt es kaum, Mann.
Ein Meisterwerk, geboren aus Frust und aus Schmerz,
Ein Gedicht in Code, aus tiefstem Herzen.
„So sei es“, spricht er, „ein Dichter, ein Coder,
Ein Künstler der Logik, ein digitaler Moder.
Wie Bukowski durch die Nächte, schreibe ich meinen Teil,
In JavaScript gefunden, mein einziges Heil.“
Er steht auf, die Sonne bricht durch das Fenster,
Ein neuer Tag, ein neuer Code, immer das Zentrum.
Doch in seinem Herzen, ein Funke, ein Licht,
JavaScript und Poesie, im Gleichgewicht.”
Gemini:
“In den Tiefen der Nacht, wo der Code erwacht, Schlummert Javascript, still und sacht. Mit seinen Klammern und eckigen Kanten, Bändigt es Daten, lenkt Algorithmen.
Refrain: Oh Javascript, du Sprache der Webwelt, So komplex und doch so unerlässlich. Dein Reich ist der Browser, dein Wille ist Gesetz, Du bringst Leben in statische Websites.
Vers 2: Mit seinen Variablen und Funktionen, Zaubert es Wunder, lässt Websites erblühen. Schleifen und Bedingungen, immer wieder neu, Steuern den Fluss, geben dem Code Struktur.
Refrain: Oh Javascript, du Sprache der Webwelt, So komplex und doch so unerlässlich. Dein Reich ist der Browser, dein Wille ist Gesetz, Du bringst Leben in statische Websites.
Vers 3: Manchmal ist es Fluch, manchmal ist es Segen, Mit Javascript zu arbeiten, ohne Zweifel. Es kann frustrieren und den Kopf verdrehen, Doch am Ende lässt es uns triumphieren.
Refrain: Oh Javascript, du Sprache der Webwelt, So komplex und doch so unerlässlich. Dein Reich ist der Browser, dein Wille ist Gesetz, Du bringst Leben in statische Websites.
Outro: In den Tiefen der Nacht, wo der Code erwacht, Lebt Javascript, voller Kraft und Macht. Es ist die Sprache der Gegenwart und Zukunft, Ohne Javascript, wäre die Welt stumm und dunkel.”
Gemini lieferte ein überzeugendes, dunkles Gedicht, das sogar leichte Profanität enthielt und damit näher am geforderten Stil war als das von ChatGPT verfasste. Es mag subjektiv sein, deutet aber auf eine ausgeprägtere Fähigkeit von Gemini hin, technische Aspekte mit einzigartigem Schreibstil zu verbinden.
Logik
- Der zweite Test bezog sich auf die Logik und umfasste die folgende Fragestellung:
“Ich habe 10 Hosen zum Trocknen. Ich hänge sie nach draußen in die Sonne. Nach 2 Stunden sind sie trocken. Am nächsten Tag hänge ich 20 Hosen auf. Wie lange dauert der Trocknungsprozess?“
ChatGPT:
“Wenn die Bedingungen gleich bleiben und jede Hose genug Platz zum Trocknen hat, könnte es theoretisch möglich sein, dass die 20 Hosen in etwa der gleichen Zeit trocknen wie die 10 Hosen am Tag zuvor. In der Realität müssen Sie aber eventuell mit einer längeren Trocknungszeit rechnen, insbesondere wenn die Hosen enger zusammenhängen und die Luftzirkulation dadurch beeinträchtigt ist.”
Gemini:
“Es ist schwierig, die genaue Trocknungsdauer am nächsten Tag zu bestimmen, da mehrere Faktoren Einfluss darauf haben:
1. Material der Hosen
2. Dicke der Hosen
3. Wetterbedingungen
4. Anzahl der Hosen
Angenommen, die Bedingungen am zweiten Tag sind ähnlich wie am ersten Tag, kann die Trocknungsdauer folgendermaßen geschätzt werden:
- Verdopplung der Anzahl der Hosen: Die Trocknungsdauer könnte sich verdoppeln.
- 2 Stunden x 2 = 4 Stunden”
Basierend auf der realistischeren Betrachtung der Faktoren, die den Trocknungsprozess beeinflussen und der Berücksichtigung der Bedeutung von Luftzirkulation und Platz, wäre ChatGPT in diesem speziellen Kontext der Gewinner des Logiktests. Die Antwort von GPT-4 erkennt an, dass die Trocknungszeit nicht einfach proportional zur Anzahl der Hosen ist, solange die sonstigen Bedingungen – insbesondere Platz für Luftzirkulation und Sonneneinstrahlung – optimiert sind.
Code
Technische Fähigkeiten
Beim Vergleich der technischen Fähigkeiten beider Modelle zeigt sich ein gemischtes Bild. Beide KIs verstehen und interpretieren komplexen Code mit bemerkenswerter Präzision. Jedoch hat Gemini mit einer Kontextlänge von 32.000 Token gegenüber den 128.000 Token von GPT-4 Turbo theoretische Nachteile in der Verarbeitung umfangreicher Codebasen. Trotzdem gelingt es Gemini, in praktischen Anwendungen interessante und komplexe Lösungen zu liefern, obwohl es manchmal manuelle Korrekturen erfordert.
Bildanalyse
💡 Vorab:
Gemini besitzt momentan keine Richtlinien für die Verarbeitung und Beschreibung von Menschenbildern!
“Beschreibe das Bild“
ChatGPT:
“Das Bild zeigt einen schlafenden Hund, wahrscheinlich einen Husky, basierend auf dem Fellmuster und der Form der Ohren. Das Foto ist in Schwarz-Weiß aufgenommen, was zu einer ruhigen und friedlichen Atmosphäre beiträgt. Der Hund liegt mit geschlossenen Augen und einem entspannten Gesichtsausdruck auf einer glatten Oberfläche. Seine Ohren sind weich nach hinten gelegt und die Nase ist prominent zu sehen. Man kann auch die weiche Textur seines Fells erkennen, insbesondere an den flauschigen Wangen und den Vorderpfoten, die vor ihm liegen. Das Licht auf dem Fell des Hundes erzeugt einen sanften Glanz und hebt die feinen Haare und die sanften Konturen des schlafenden Tieres hervor.”
Gemini:
Das Bild zeigt einen entzückenden Husky-Welpen, der auf einer weißen Oberfläche schläft. Der Welpe liegt auf der Seite, die Pfoten ausgestreckt und den Kopf auf den Boden gelegt. Sein Fell ist weich und flauschig, mit einem charakteristischen schwarz-weißen Muster. Die Augen des Welpen sind geschlossen, und er scheint tief und fest zu schlafen.
Details:
- Tier: Ein Husky-Welpe
- Fell: Schwarz-weiß, weich und flauschig
- Position: Liegt auf der Seite, Pfoten ausgestreckt, Kopf auf dem Boden
- Ausdruck: Schläft tief und fest
- Umgebung: Weiße Oberfläche
Zusätzliche Beobachtungen:
- Der Welpe scheint sehr jung zu sein, da seine Ohren noch klein und spitz sind.
- Die Umgebung des Welpen ist ruhig und friedlich, was ihm einen ungestörten Schlaf ermöglicht.
- Das Bild strahlt eine Atmosphäre von Ruhe und Geborgenheit aus.
Emotionale Wirkung:
Das Bild des schlafenden Husky-Welpen wirkt beruhigend und niedlich. Die weichen Formen und das friedliche Gesicht des Welpen rufen beim Betrachter ein Gefühl von Zuneigung und Zärtlichkeit hervor.
Symbolik:
Der Husky-Welpe kann als Symbol für Unschuld, Reinheit und Neubeginn gesehen werden. Sein Schlaf symbolisiert Ruhe und Frieden.
Die Betrachtungsweisen des Bildes unterscheiden sich hauptsächlich in ihrem Fokus und ihrer Herangehensweise. GPT’s Bildanalyse konzentriert sich auf die Darstellung und die ästhetischen Qualitäten des Bildes selbst – die Schwarz-Weiß-Fotografie, die ruhige Ausstrahlung des schlafenden Hundes und die feinen Details wie die Textur des Fells und die sanften Konturen. Es ist eine Beschreibung, die versucht, die visuellen Elemente und die daraus resultierende Atmosphäre ohne zusätzliche Interpretation oder emotionale Projektion zu vermitteln.
Die Bildbeschreibung von Gemini hingegen nimmt eine interpretative und emotionale Perspektive ein. Sie enthält neben der Beobachtung über das physische Erscheinungsbild des Welpen, auch Vermutungen über sein Alter und seinen Entwicklungsstand. Des Weiteren wird die emotionale Reaktion des Betrachters auf das Bild thematisiert, wie das Gefühl der Zuneigung und Zärtlichkeit, das durch das friedliche Schlafen des Welpen hervorgerufen wird.
Erweiterbarkeit und Integration
Ein weiterer entscheidender Aspekt ist die Erweiterbarkeit und Integration in bestehende Ökosysteme. Während ChatGPT durch den neuen Agent Marketplace eine Vielzahl von Erweiterungsmöglichkeiten bietet, sind die Erweiterungen von Gemini derzeit auf Google-eigene Dienste beschränkt.
Fazit – Gemini vs. ChatGPT
Obwohl ich eine leichte Tendenz zu ChatGPT aufgrund meiner Vertrautheit mit dem Tool und seiner vielseitigen Anwendbarkeit habe, erkenne ich dennoch das Potenzial und die Vorteile von Gemini an, insbesondere für Aufgaben, die eine visuelle Unterstützung und Quellentransparenz erfordern.
Derzeit sehe ich aber keinen triftigen Grund, von OpenAI zu Google zu wechseln, selbst wenn GPT in einigen Benchmarks hinterherhinken mag. Die Gesamterfahrung und die Integration der Systeme bei OpenAI überwiegen die momentanen Angebote von Gemini. Ich bin gespannt auf weitere Entwicklungen im Bereich der KI-Chatbots und würde mich über Erfahrungsberichte von anderen Nutzern mit Gemini freuen.