Einführung in Google Gemini
Google Gemini, ein neues KI-Modell von Google DeepMind, wurde als Antwort auf OpenAI’s GPT-4 entwickelt. Gemini stellt einen bedeutenden Fortschritt für Google dar, markiert jedoch nicht unbedingt einen großen Sprung für das gesamte Feld der KI. Laut Google DeepMind übertrifft Gemini GPT-4 in 30 von 32 Standardleistungsmessungen, die Unterschiede zwischen beiden Modellen sind jedoch gering. Gemini kombiniert die besten aktuellen Fähigkeiten der KI in einem leistungsstarken Paket [❞].
Multimodale Fähigkeiten
Wie GPT-4 ist Gemini multimodal, was bedeutet, dass es Text-, Bild- und Audioeingaben verarbeiten kann. Es kann diese verschiedenen Formate kombinieren, um Fragen zu beantworten, die von Haushaltsaufgaben über College-Mathematik bis hin zu Wirtschaftsfragen reichen [❞].
Demonstration und Anwendungsbereiche
In einer Demonstration zeigte Google Gemini’s Fähigkeit, einen Screenshot eines Diagramms zu analysieren und dann das Diagramm mit neuen Informationen zu aktualisieren. In einem anderen Beispiel antwortete Gemini auf die Frage, ob ein Omelett in einer Pfanne fertig sei [❞].
Verfügbarkeit und Varianten
Die vollständige Veröffentlichung von Gemini wird in den kommenden Monaten stattfinden. Die neue, mit Gemini verstärkte Version von Bard wird zunächst in mehr als 170 Ländern in englischer Sprache verfügbar sein. Gemini wird in drei Größen angeboten: Ultra, Pro und Nano. Entwickler und Unternehmen werden ab dem 13. Dezember Zugang zu Gemini Pro haben. Gemini Ultra wird „Anfang nächsten Jahres“ verfügbar sein [❞].
Hintergrund und Entwicklung
Gemini ist das Ergebnis einer langen Entwicklungszeit. Im April 2023 gab Google bekannt, dass es seine KI-Forschungseinheit Google Brain mit DeepMind zusammenlegt. Google stand unter starkem Druck, Investoren zu zeigen, dass es mit Konkurrenten im Bereich KI mithalten und diese überholen kann [❞] [❞].
Herausforderungen und Kritik
Google hat weder die Probleme mit fehlerhaften Produkten noch das Problem der „Halluzination“ gelöst. Die Lösung für dieses letztere Problem besteht darin, den Menschen zu ermöglichen, Googles Suche zu verwenden, um die Antworten des Chatbots zu überprüfen [❞] [❞].
Zukunft von Gemini
Gemini könnte der Höhepunkt dieser Welle generativer KI sein. Einige Forscher glauben, dass dies eher ein Plateau als der Fuß des nächsten Gipfels sein könnte [❞].