What are input and output tokens?

Input tokens are the text you provide to the model, while output tokens are the text the model generates in response.

How does the context window affect quality and speed?

A larger window size typically results in higher quality output because the model can take more context into account when generating text.

What are the input and output token prices for GPT-3.5, GPT-4, and GPT-4o?

For input tokens, the pricing per 1 million tokens is: GPT-3.5: 0.47 EUR, GPT-4: 27.9 EUR, GPT-4o: 4.65 EUR. For output tokens: GPT-3.5: 1.40 EUR, GPT-4: 55.80 EUR, GPT-4o: 13.95 EUR.

How does the context window of GPT-4 compare to GPT-3.5?

GPT-4 supports sequences up to 4096 tokens in length, significantly expanding its span compared to earlier models like GPT-3.5, which can handle sequences up to 2048 tokens.

OpenAIs API-Preise: Kosten für GPT-3.5, GPT-4 und GPT-4o

dida

10th October 2024

Mit den regelmäßigen Veröffentlichungen von OpenAIs GPT-Modellen und hohen Nutzerzahlen, stellt sich nutzenden Unternehmen schnell die Frage nach den damit verbundenen Kosten.

Dieser Artikel präsentiert Ihnen Einblicke, wie sich die Preise und Kosten der GPT-Modelle zusammensetzen und zeigt eine Musterrechnung für anfallende Kosten einer Optical-Character-Recognition.

Notiz: Sollten Sie sich für Implementierungshilfe bzgl. Ihrer ChatGPT-Enterprise-Umgebung interessieren, schauen Sie sich gerne unsere ChatGPT-Enterprise-Services an.

Was ist eine API?

Eine API (Application Programming Interface) ist eine Schnittstelle, die es einem Softwareprogramm ermöglichen, mit einem anderen Programm zu interagieren. Sie definiert die Methoden und Datenstrukturen, die Entwickler verwenden, um mit einem externen System oder Dienst zu kommunizieren.

Die GPT-API ermöglicht es Entwicklern, die natürliche Sprachverarbeitung von GPT in ihre Anwendungen, Websites oder Dienste zu integrieren.

Worauf basiert die API-Preisgestaltung für GPT-Modelle?

Die Preisgestaltung der OpenAI-API richtet sich nach der Anzahl der verwendeten Tokens. Dies wirft natürlich die Frage auf: „Was genau ist ein Token?“ Laut der Dokumentation von OpenAI ist ein Token „ein Stück eines Wortes, das zur Verarbeitung natürlicher Sprache verwendet wird“. Typischerweise entspricht ein Token ungefähr 4 Zeichen oder 0,75 Wörtern.

Zum besseren Verständnis betrachten wir ein Beispiel. Der Satz „Hallo, willkommen auf unserer Website“ besteht aus 7 Tokens. Dieses tokenbasierte Preismodell hilft, die API-Nutzung genau zu messen und abzurechnen.

Es gibt jedoch einige weitere Punkte, die bei der Preisgestaltung zu beachten sind: der Unterschied zwischen Input- und Output-Preisgestaltung und das Kontextfenster des GPT-Modells.

Was sind Eingabe-/Ausgabe-Token?

Eingabe-Tokens sind der Text, den Sie dem Modell zur Verfügung stellen, während Ausgabe-Tokens der Text sind, den das Modell als Antwort generiert. Die Kosten werden berechnet, indem die Anzahl beider Tokens summiert wird. Zum Beispiel, wenn Sie eine Eingabe mit 10 Einheiten senden und eine Antwort mit 15 Einheiten erhalten, beträgt die Gesamtmenge der abrechenbaren Tokens 25. Beachten Sie auch, dass Ausgabe-Tokens in der Regel teurer sind als Eingabe-Tokens.

Was bedeutet der Begriff "Kontextfenster"?

Das Kontextfenster eines "Generative Pre-trained Transformers" bezieht sich auf die Anzahl der vorangegangenen Tokens, die das Modell berücksichtigt, wenn es das nächste Token in einer Sequenz generiert oder vorhersagt. Einfacher ausgedrückt ist es der Textbereich oder die Tokenspanne, die das Modell "betrachtet", um den Kontext des aktuell verarbeiteten Tokens zu verstehen.

GPT-3.5 Turbo, eine verbesserte Version von GPT-3.5, behält in der Regel ein Kontextfenster bei, das dem von GPT-3.5 ähnelt. Es kann Sequenzen von bis zu 2048 Tokens verarbeiten, was es ermöglicht, längere Abhängigkeiten im Text zu erfassen und kohärentere und kontextuell bessere Ergebnisse zu erzeugen.

GPT-4 unterstützt Sequenzen von bis zu 4096 Tokens Länge und erweitert damit signifikant seine Reichweite im Vergleich zu früheren Modellen wie GPT-3.5 und GPT-3.5 Turbo. Dies ermöglicht es GPT-4, noch längere Texte und Abhängigkeiten zu verarbeiten und seine Fähigkeit für komplexe natürliche Sprachverarbeitungsaufgaben zu verbessern, wodurch nuancierte Ausgaben generiert werden können.

GPT-4o, optimiert für Effizienz und verbesserte Leistung, behält in der Regel eine ähnliche Kontextfenstergröße wie GPT-4 bei. Es balanciert die Recheneffizienz mit der Leistung aus und gewährleistet eine effektive Verarbeitung großer Textsequenzen, während es die Ressourcennutzung für verschiedene Anwendungen optimiert.

Wie beeinflusst das Kontextfenster Qualität und Geschwindigkeit?

Ein größeres Kontextfenster führt in der Regel zu einer höheren Ausgabequalität, da das Modell mehr Kontext berücksichtigen kann, wenn es Text generiert. Dadurch neigt der generierte Text dazu, inhaltlich relevanter und kohärenter zu sein.

Es hat auch Auswirkungen auf die Verarbeitungsgeschwindigkeit. Modelle mit größeren Kontextfenstern benötigen möglicherweise mehr Rechenressourcen und Zeit, um jedes Token zu verarbeiten, was zu langsameren Inferenzgeschwindigkeiten im Vergleich zu Modellen mit kleineren Kontextfenstern führen kann. Effizienzoptimierte Modelle wie GPT-4o balancieren die Kontextfenstergröße mit der Recheneffizienz aus. Sie zielen darauf ab, wettbewerbsfähige Verarbeitungsgeschwindigkeiten zu bieten, während sie ausreichend Kontext erhalten, um hochwertige Ausgaben zu produzieren.

OpenAI GPT API Preisgestaltung - Unterschied zwischen Eingabe- und Ausgabe-Tokens

Die Preisstruktur für OpenAIs GPT-API-Versionen – GPT-3.5, GPT-4 und GPT-4o – basiert auf einem tokenbasierten Modell, wobei die Kosten auf der Anzahl der verarbeiteten Tokens beruhen. Stand der letzten Aktualisierung betragen die Preise pro 1 Million Eingabe-Tokens:

GPT-3.5: 0,47 EUR
GPT-4: 27,90 EUR
GPT-4o: 4,65 EUR

Für Ausgabe-Tokens betragen die Preise pro 1 Million Tokens:

GPT-3.5: 1,40 EUR
GPT-4: 55,80 EUR
GPT-4o: 13,95 EUR

Diese Preismethode stellt sicher, dass Nutzer entsprechend ihrer tatsächlichen Nutzung bezahlen, was sie für eine Vielzahl von Anwendungen von Chatbots bis hin zu Content-Generierungsplattformen geeignet macht.

Die Nutzung von generativer KI in der automatisierten Dokumentenverarbeitung - ein aufschlussreiches Beispiel

Um ein tieferes Verständnis dafür zu vermitteln, was 1 Million Tokens repräsentieren, betrachten wir ein Beispiel aus der Praxis:

Angenommen, ein Unternehmen möchte seine Dokumentenverarbeitung mithilfe der OCR (Optical Character Recognition) Technologie automatisieren. OCR, unterstützt von OpenAI's freigegebenen Modellen und trainiert auf umfangreichen Trainingsdaten, wandelt Dokumente in bedeutungsvolle Daten um, indem es Fortschritte in großen Sprachmodellen (LLM), Finetuning und Worteinbettungen (Embeddings) nutzt. Diese Integration spart effektiv Zeit und reduziert manuelle Fehler.

Nehmen wir ein Beispiel, das auf einem nicht existierenden Unternehmen basiert, aber mit Zahlen, mit denen wir regelmäßig zu tun haben: Ein mittelgroßes Unternehmen mit 200-300 Mitarbeitern und einer aktiven Vertriebsabteilung verarbeitet etwa 4500 Dokumente pro Monat. Hochgerechnet auf ein Jahr bedeutet das die Verarbeitung von ca. 55.000 Dokumenten pro Jahr, wobei jedes Dokument im Durchschnitt 2,6 Seiten umfasst. Basierend auf den aktuellen Preisen von OpenAI betragen die Kosten pro Seite bei Verwendung verschiedener GPT-Modelloptionen wie folgt:

- GPT-3.5: 0,0023 EUR pro Seite

- GPT-4: 0,13 EUR pro Seite

- GPT-4o: 0,023 EUR pro Seite

Diese Vergleich zeigt, wie unterschiedliche GPT-Versionen unterschiedliche Effizienzen und Kostenstrukturen bieten, die es Unternehmen ermöglichen, Lösungen für ihre spezifischen Anforderungen in der Dokumentenautomatisierung und -verarbeitung auszuwählen.

Der Vergleich dieser Preise veranschaulicht, dass GPT-4 die fortschrittlichsten Fähigkeiten zu höheren Kosten bietet, während GPT-4o eine Balance zwischen Leistung und Erschwinglichkeit bietet. GPT-3.5 bleibt die wirtschaftlichste Option, geeignet für Anwendungen mit Budgetbeschränkungen. Unter Berücksichtigung dieser Informationen sehen wir, wie viel ein Unternehmen in einem Jahr für GPT zahlen muss. Das folgende Diagramm veranschaulicht diese Kosten basierend auf Daten von Juni 2024 (ungefähre Werte):

Wir empfehlen daher, je nach Anwendungsfall und individuellen Anforderungen das richtige GPT-Modell zu wählen. Für einige Aufgaben könnte GPT-3.5 das wirtschaftlichste Modell sein, das gleichzeitig eine ausreichende Genauigkeit bietet, während für andere Aufgaben die Kosten nicht im Vordergrund stehen und stattdessen die maximale Leistung von größter Bedeutung ist (und GPT-4 die beste Wahl darstellt).

Zusätzlich zu den Kosten für GPT sind die Implementierung von OCR-Technologie und Cloud-Speicherung erforderlich. Diese zusätzlichen Ausgaben sind jedoch minimal im Vergleich zu den leistungsstarken Vorteilen und Möglichkeiten, die GPT bietet.

Um herauszufinden, wie datenautomatisierte maschinelle Lernprozesse Ihre Geschäftsprozesse verbessern können, besuchen Sie unsere Website und entdecken Sie unsere innovativen Produkte.

Zeit für Ihre individuellen GPT-Projekte

Wir bei dida sind auf die Entwicklung maßgeschneiderter KI-Lösungen für mittlere bis große Unternehmen spezialisiert.

Wenn Sie an maßgeschneiderten Lösungen rund um die Modelle von OpenAI für Ihr Unternehmen interessiert sind, sprechen Sie uns an. Wir freuen uns darauf, Ihre individuellen Projekte zu besprechen.

Kontaktformular