Google kündigt offiziell das Gemini 3.5 Flash auf der Google I/O 2026 an

2026-05-19T17:37:13.612Z

Ein Nahaufnahmefoto eines ordentlich organisierten Schreibtisches mit zwei Monitoren, die Leistungsmetriken in Echtzeit anzeigen, und einem Tablet, das die Keynote der Google I/O überträgt.

Am Dienstag, den 19. Mai 2026 (UTC), kündigte der Technologieriese Google offiziell den weltweiten Start seines neuen Hochgeschwindigkeits-KI-Modells, Gemini 3.5 Flash, während der Eröffnungskonferenz der Google I/O 2026 in Mountain View an. Diese Neuheit wurde als das Hauptangebot des Unternehmens für Entwickler präsentiert, die hohe Leistung und extrem niedrige Reaktionszeiten in der Produktion benötigen. Das neue Modell steht ab heute für Tests und kommerzielle Integration auf den Plattformen Google AI Studio und Vertex AI zur Verfügung.

Während der Veranstaltung hob der CEO von Google, Sundar Pichai, die strategische Positionierung des Modells hervor:

„Mit dem Gemini 3.5 Flash liefern wir eine außergewöhnliche Verarbeitungsgeschwindigkeit, ohne auf die tiefe Intelligenz zu verzichten, die Entwickler von unserer Modellfamilie erwarten. Es ist unsere endgültige Antwort auf die Notwendigkeit von Echtzeitanwendungen mit massiver Skalierung und extrem wettbewerbsfähigen Kosten in der Cloud.“

Benchmarks für Leistung und Latenz unter 200 ms

Im Gegensatz zu früheren Ansätzen, die sich rein auf die extreme Kostensenkung pro Token auf Kosten der kognitiven Qualität konzentrierten, hat die Abteilung Google DeepMind die Architektur des Gemini 3.5 Flash basierend auf neuen Wissensdestillationsalgorithmen verfeinert. Unter der Leitung von Demis Hassabis, Mitbegründer von Google DeepMind, erreichte das Modell in der Produktion eine Verarbeitungslatenz, die bei den meisten komplexen Text- und Computer Vision-Anfragen konstant unter 200 Millisekunden liegt. Dies positioniert das Modell als hoch wettbewerbsfähige Lösung gegen schnelle Alternativen auf dem Markt, wie das Claude 3.5 Haiku.

Neben der reinen Reaktionsgeschwindigkeit bietet die Neuerung eine der größten operationellen Kapazitäten ihrer Kategorie, indem sie eine Kontextgröße von 1 Million Tokens beibehält. Diese Kapazität ermöglicht es dem System, große Dokumentvolumen, ganze Programmcodes und sogar Stunden von Video auf einmal zu verarbeiten und nahezu sofort strukturierte Antworten zurückzugeben.

Preisstruktur und Verfügbarkeit auf dem Markt

Die offizielle Ankündigung bestätigte die Gebühren für das Standarddienstniveau. Die Betriebskosten wurden auf 1,50 US-Dollar pro Million Eingabe-Tokens und 0,60 US-Dollar pro Million Ausgabe-Tokens festgelegt, was es zu einer Premium- und robusten Option für den Einsatz in kritischen Unternehmenssystemen für Kundenservice, automatisierte Finanzanalyse und dynamische Echtzeitdatenverarbeitung macht. Die Cloud-Infrastruktur von Google Cloud bietet bereits ab diesem Keynote eine vollständige Unterstützung für das neue Modell in allen globalen Regionen.

Dieser Inhalt wurde von unserem Team erstellt und überprüft (iatoskill.com). Wenn Sie Probleme finden, bitte kontaktieren Sie uns

War dies hilfreich?

Google kündigt offiziell das Gemini 3.5 Flash auf der Google I/O 2026 an

Benchmarks für Leistung und Latenz unter 200 ms

Preisstruktur und Verfügbarkeit auf dem Markt

Teilen

Weitere Nachrichten

Startup Meng Xiaoyi bringt KI-Halsband auf den Markt, das Haustiergebell 'übersetzt'

Weißes Haus schließt Abkommen mit Anthropic zur Nutzung von KI in der NSA

DeepSeek senkt dauerhaft Preise des V4-Pro um 75%