Um ein tieferes Verständnis dafür zu vermitteln, was 1 Million Tokens repräsentieren, betrachten wir ein Beispiel aus der Praxis:
Angenommen, ein Unternehmen möchte seine Dokumentenverarbeitung mithilfe der OCR (Optical Character Recognition) Technologie automatisieren. OCR, unterstützt von OpenAI's freigegebenen Modellen und trainiert auf umfangreichen Trainingsdaten, wandelt Dokumente in bedeutungsvolle Daten um, indem es Fortschritte in großen Sprachmodellen (LLM), Finetuning und Worteinbettungen (Embeddings) nutzt. Diese Integration spart effektiv Zeit und reduziert manuelle Fehler.
Nehmen wir ein Beispiel, das auf einem nicht existierenden Unternehmen basiert, aber mit Zahlen, mit denen wir regelmäßig zu tun haben: Ein mittelgroßes Unternehmen mit 200-300 Mitarbeitern und einer aktiven Vertriebsabteilung verarbeitet etwa 4500 Dokumente pro Monat. Hochgerechnet auf ein Jahr bedeutet das die Verarbeitung von ca. 55.000 Dokumenten pro Jahr, wobei jedes Dokument im Durchschnitt 2,6 Seiten umfasst. Basierend auf den aktuellen Preisen von OpenAI betragen die Kosten pro Seite bei Verwendung verschiedener GPT-Modelloptionen wie folgt:
- GPT-3.5: 0,0023 EUR pro Seite
- GPT-4: 0,13 EUR pro Seite
- GPT-4o: 0,023 EUR pro Seite