DeepSeek senkt dauerhaft Preise des V4-Pro um 75%

Reale Entwicklungsumgebung mit Bildschirm, der Codes und Preistabellen der DeepSeek-V4-Pro-API anzeigt.

Der künstliche Intelligenz Entwickler DeepSeek hat offiziell am Freitag, den 22. Mai 2026 (UTC), angekündigt, dass die temporäre Preistabelle mit 75% Rabatt für ihr Hauptsprachmodell DeepSeek-V4-Pro dauerhaft beibehalten wird. Mit dieser Entscheidung werden Entwickler, die die API des Unternehmens nutzen, nicht von der vorgesehenen Preisanpassung betroffen sein, welche für das Ende der Aktion am 31. Mai 2026 (UTC) geplant war, womit eine der günstigsten Sprachverarbeitungsoptionen auf dem globalen Technologiemarkt konsolidiert wird. Die offizielle Ankündigung wurde direkt in die Kommunikationskanäle der Marke und in die offizielle Preisdokumentation integriert.

Ein endgültiger Preisbruch auf dem API-Markt

Ursprünglich im April 2026 (UTC) mit offenen Gewichten unter der MIT-Lizenz lanciert, ist das DeepSeek-V4-Pro ein Mixture-of-Experts (MoE) Modell mit insgesamt 1,6 Billionen Parametern, von denen 49 Milliarden während der Verarbeitung aktiv sind. Die Architektur wurde speziell für komplexe Programmieraufgaben, fortgeschrittenes logisches Denken und agentische Workflow-Dichten entwickelt. Praktisch gesehen stellt die endgültige Preistabelle eine extrem wettbewerbsfähige Gebühr pro Million Tokens dar. Der Einstiegspreis bei einem Cache-Fehler wurde auf 3 Yuan festgelegt, was ungefähr 0,435 USD entspricht, aber der Ausgangspreis wurde auf 6 Yuan, etwa 0,87 USD pro Million Tokens, festgelegt. Die größte Ersparnis liegt jedoch bei den Cache-Treffern, die nur 0,025 Yuan oder 0,0036 USD pro Million Tokens kosten.

Dahinter schafft die Aufrechterhaltung dieser aggressiven Preise eine nahezu unüberwindbare wirtschaftliche Barriere für die Branchenriesen. Marktanalysten wie @faraz0x und @hqmank weisen darauf hin, dass die neuen API-Preise des asiatischen Unternehmens 3 bis 35 Mal günstiger sind als die geschätzten Kosten für gleichwertige Aufgaben auf dem GPT-5.5 von OpenAI oder dem kürzlich eingeführten Claude Opus 4.7 von Anthropic. Das Ergebnis dieses enormen Unterschieds dürfte die drastische Beschleunigung der Technologieübernahme durch Startups und unabhängige Programmierer sein, die Systeme mit großem Kontextvolumen entwickeln, da das Modell Unterstützung für Kontextrahmen von bis zu 1 Million Tokens bietet.

Druck auf das Infrastruktur-Ökosystem der KI

Die Entscheidung des chinesischen Unternehmens, seine Tarife nicht anzupassen, löste eine sofortige Reaktion in der gesamten Vertriebskette der künstlichen Intelligenz aus. Beliebte API-Aggregatoren und Drittanbieter von Cloud-Diensten wie OpenRouter und DeepInfra begannen in den letzten Stunden, ihre jeweiligen Weitergabetabellen zu aktualisieren, um die neue Kostenrealität des Modells widerzuspiegeln. Darüber hinaus erleichtert die direkte Kompatibilität mit der OpenAI Bibliothek die sofortige Migration von Altsystemen und ermöglicht es Unternehmen, ihre Verarbeitungs-Backends zu ersetzen, ohne große Codeblöcke umschreiben zu müssen.

In der Zwischenzeit projizieren Branchenexperten bereits die operativen Entwicklungen für das zweite Halbjahr 2026. Die Erwartung neuer Hardwarelieferanten ist, dass die Verarbeitungskosten in den kommenden Monaten weiter sinken werden, da lokal mehr Grafikbeschleuniger-Chips der Ascend-Linie aus Asien verfügbar sind. Mit effizienteren Servern und optimierten Energiekosten konsolidiert das Unternehmen sein Geschäftsmodell, das auf einem massiven Volumen von Anfragen basiert, und zwingt westliche Anbieter, ihre Gewinnspannen zu überdenken, um ihre Unternehmenskunden zu halten.

Teilen

Dieser Inhalt wurde von unserem Team erstellt und überprüft (iatoskill.com). Wenn Sie Probleme finden, bitte kontaktieren Sie uns

War dies hilfreich?
Lerne

Weitere Nachrichten

Alle ansehen
DeepSeek senkt dauerhaft Preise des V4-Pro um 75%