paint-brush
Was ist der wahre Preis der generativen KI?von@itrex
940 Lesungen
940 Lesungen

Was ist der wahre Preis der generativen KI?

von ITRex18m2024/01/17
Read on Terminal Reader

Zu lang; Lesen

Ein gut durchdachter Plan hilft Ihnen nicht nur dabei, die Technologie risikofrei einzuführen und schneller von den Vorteilen zu profitieren, sondern senkt auch die Kosten der Gen-KI.
featured image - Was ist der wahre Preis der generativen KI?
ITRex HackerNoon profile picture
0-item
1-item

TL;DR

  • Die Kosten für die Implementierung generativer KI in Unternehmen können zwischen einigen hundert Dollar pro Monat und 190.000 Dollar (und mehr) für eine maßgeschneiderte generative KI-Lösung auf der Grundlage eines fein abgestimmten Open-Source-Modells liegen.
  • Dieser Kostenunterschied bei der generativen KI wird durch mehrere Faktoren bestimmt, darunter die Aufgaben, die Sie verbessern möchten, das Modell, das am besten zu diesen Aufgaben passt, und der gewählte Implementierungsansatz.
  • Um die damit verbundenen Kosten zu optimieren, müssen Sie Ihre Projektanforderungen sorgfältig prüfen, die Kosten für die Infrastruktur vor Ort und in der Cloud bewerten und sich zwischen der Einstellung interner KI-Talente und der Auslagerung des Projekts an einen Dritten entscheiden


Wir haben Ihnen bereits erklärt , wie generative künstliche Intelligenz (Gen AI) im Vergleich zu traditioneller KI abschneidet und welche Vor- und Nachteile die Technologie hat . Das ITRex-Beratungsteam für generative KI hat sich auch intensiv mit den Anwendungsfällen von Gen AI in mehreren Branchen befasst, darunter Gesundheitswesen , Einzelhandel und Lieferketten .


Darüber hinaus haben wir die Kosten für den Aufbau künstlicher Intelligenzsysteme, der Infrastruktur usw. bewertet und uns auf die Kosten für maschinelles Lernen (ML) konzentriert, indem wir die Kosten berechnet haben, die mit der Vorbereitung von Trainingsdaten, der Feinabstimmung von Modellen und der Bereitstellung ML-gestützter Lösungen verbunden sind .

Jetzt ist es an der Zeit, die Kosten der generativen KI-Implementierung in Unternehmen zu entschlüsseln.


Diese Analyse kann eine Herausforderung sein, da uns die Besonderheiten Ihres Projekts noch nicht bekannt sind.

Wir könnten jedoch unsere Beratungskompetenz im Bereich generative KI nutzen, um die Preise für Gen-AI-Dienste zu untersuchen und die Schlüsselfaktoren für die Kosten von Gen-AI-Projekten aufzuzählen. Auf diese Weise statten wir Sie mit dem Wissen aus, das Sie benötigen, um fundierte Entscheidungen zu treffen, was Ihrem Unternehmen in dieser sich schnell entwickelnden Technologielandschaft potenziell erhebliche Zeit- und Ressourceneinsparungen bescheren kann.


Interessiert? Dann lasst uns gleich eintauchen!

Die Wahl eines Modells und der Implementierungsansatz sind die Schlüsselfaktoren, die die Kosten generativer KI beeinflussen

Wenn Sie darüber nachdenken, generative künstliche Intelligenz in den Technologie-Stack Ihres Unternehmens zu integrieren, ist es wichtig, Folgendes zu berücksichtigen:


  • Welche Geschäftsaufgaben werden Sie mit generativer KI verbessern?
  • Welches Modell würde für diese Aufgaben ausreichen?


Das Herzstück generativer KI-Lösungen sind Basismodelle – also große Modelle, die auf riesigen Datenmengen trainiert werden. Im Wesentlichen dienen Grundlagenmodelle als Grundlage für die Erstellung maßgeschneiderter Gen-KI-Lösungen, die Vereinfachung des Entwicklungsprozesses und die Senkung der Kosten für generative KI. Zu ihren Fähigkeiten gehören typischerweise die Verarbeitung natürlicher Sprache (NLP), Computer Vision (CV) und die Generierung von Inhalten.


Die kognitiven Fähigkeiten von Foundation-Modellen hängen weitgehend von der Anzahl der Parameter ab, auf die sie trainiert wurden. Parameter beziehen sich in diesem Zusammenhang auf Modellelemente, die aus Trainingsdaten gelernt werden, beispielsweise Gewichte in einem neuronalen Netzwerk. Diese Parameter helfen dem Modell, Entscheidungen und Vorhersagen zu treffen. Die folgende Tabelle veranschaulicht die Korrelation zwischen der Anzahl der Parameter – im Wesentlichen dem Umfang dieser Entscheidungselemente – und den kognitiven Fähigkeiten des Modells.

Anzahl der Trainingsparameter

Modellleistungsmerkmale

Anwendungsmöglichkeiten

1 Milliarde Parameter

Grundkenntnisse der Welt; Mustervergleich

Analyse der Kundenstimmung in Bewertungen

10 Milliarden Parameter

Größeres Wissen über die Welt; Befolgen Sie die grundlegenden Anweisungen

Chatbots erleichtern die Produktbestellung (HoReCa, E-Commerce)

Über 100 Milliarden Parameter

Reichhaltiges Wissen über die Welt; komplexe Argumentation

Datenanalyse, Recherche und Inhaltsgenerierung

Die Anzahl der Parameter ist jedoch nicht der einzige Faktor, der die Leistungsfähigkeit von Grundlagenmodellen beeinflusst. Ebenso wichtig sind Qualität und Vielfalt der Trainingsdaten. Trainingsdaten sind die Informationen, die in das Modell eingespeist werden, um daraus zu lernen. Sie umfassen eine Vielzahl von Beispielen, die dem Modell helfen, neue Daten zu verstehen und zu interpretieren. Darüber hinaus spielen die Architektur des Modells – also das strukturelle Design der Interaktion zwischen Parametern und Daten – und die Effizienz der Lernalgorithmen, die bestimmen, wie effektiv das Modell aus Daten lernt, eine entscheidende Rolle. Dadurch kann bei manchen Aufgaben ein Modell mit weniger Parametern, aber besseren Trainingsdaten oder einer effizienteren Architektur ein größeres Modell übertreffen.

Wie könnte Ihr Unternehmen ein Basismodell auswählen, das sowohl effektiv ist als auch Ihre Erwartungen hinsichtlich der Kosten generativer KI erfüllt?


Alle bestehenden generativen KI-Modelle können grob in zwei Typen eingeteilt werden:


  • Closed-Source-Modelle werden von großen Technologieunternehmen wie Google, Meta, Microsoft und OpenAI entwickelt. Ihr Quellcode, ihre Architektur und ihre Anwendungsprogrammierschnittstellen (APIs) können vollständig proprietär sein oder Dritten zur Verfügung gestellt werden (normalerweise gegen eine Gebühr, die im Wesentlichen den Kosten der generativen KI-Lösung entspricht). In einigen Fällen können Sie die Leistung von Closed-Source-Modellen mithilfe Ihrer Daten optimieren. In diesem Artikel beziehen wir uns auf Closed-Source-Modelle als kommerziell verfügbare generative KI-Lösungen. Der große Vorteil solcher Modelle besteht darin, dass sie über eine Cloud-Infrastruktur verfügen und vollständig vom ursprünglichen Entwickler gepflegt werden.
  • Bei Open-Source-Modellen stehen der Quellcode, die Trainingstechniken und manchmal sogar die Trainingsdaten zur öffentlichen Nutzung und Änderung zur Verfügung. Ihr Unternehmen könnte solche Modelle „wie sie sind“ verwenden oder sie anhand Ihrer eigenen Daten neu trainieren, um eine bessere Genauigkeit und Leistung zu erzielen. Sie müssen jedoch eine lokale oder Cloud-Infrastruktur einrichten, damit das Modell ausgeführt werden kann. Die Kosten für solche generativen KI-Modelle umfassen daher Rechenkosten und, wenn Sie sich für die Erweiterung der Gen-KI-Lösung entscheiden, die mit dem Modelltraining verbundenen Kosten.


Schauen Sie sich die Tabelle unten an, um einen schnellen Überblick über die Eigenschaften der Closed-Source- und Open-Source-Modelle zu erhalten.

Closed-Source-Modelle

Open-Source-Modelle

-Mühelose Integration mithilfe von APIs -Erweiterte kognitive Fähigkeiten -Relativ niedrige Kosten für generative KI (Anbietergebühren, verbrauchsbasiertes Modell) -Mögliches Risiko einer Anbieterbindung -Kann auf Ihrer eigenen Infrastruktur ausgeführt werden (abhängig vom Anbieter)

– Vollständige Kontrolle über die Leistung des Modells – Läuft auf Ihrer eigenen Infrastruktur (lokal, in der Cloud) – Geringeres Risiko von Datenschutz- und Sicherheitsverletzungen – Die Kosten für generative KI steigen mit der Arbeitslast

Fassen wir zusammen.


Wenn Ihr Unternehmen über die Implementierung generativer KI nachdenkt, gibt es vor allem vier Möglichkeiten:


  1. Verwendung von Closed-Source-Modellen ohne Anpassung . Pioniere der generativen KI können mithilfe von APIs Standardprodukte wie ChatGPT, Google Bard, Claude und Synthesia von OpenAI in ihre Anwendungen integrieren. Der Integrationsprozess ist ziemlich unkompliziert, ebenso wie die generative KI-Preisgestaltung (dazu später mehr). Im Handel erhältliche Produkte werden regelmäßig aktualisiert und bieten eine umfangreiche Dokumentation für KI-Entwickler. Der Nachteil? Ihre Anpassungsmöglichkeiten sind begrenzt und Sie sind bei wichtigen Geschäftsaufgaben, wie der Bearbeitung von Kundensupportanfragen oder der Erstellung visueller Inhalte, stark auf ein externes Unternehmen angewiesen.
  2. Umschulung handelsüblicher Lösungen auf Ihre Unternehmensdaten . In diesem Szenario wählt Ihr internes KI-Team ein vorhandenes generatives KI-Produkt aus, das von einem bestimmten Anbieter wie OpenAI entwickelt wurde, und optimiert es anhand Ihrer eigenen Daten. Maßgeschneiderte Gen-KI-Lösungen werden Benutzerfragen besser verstehen und genauere Antworten geben. Der Anbieter erhebt jedoch weiterhin eine geringe Gebühr für die Ausführung Ihrer Abfragen, sodass die endgültigen Kosten für generative KI sowohl Betriebs- als auch Anpassungskosten umfassen.
  3. Verwendung von Open-Source-Grundlagenmodellen „wie sie sind“. Übertrieben ausgedrückt könnte Ihr Unternehmen RoBERTa, GPT-2, GPT-Neo oder ein anderes Open-Source-Modell wählen und es ohne weitere Schulung auf Geschäftsaufgaben wie die Beantwortung von Kunden-E-Mails anwenden. Die Kosten generativer KI werden jedoch durch die vom Modell verbrauchten Rechenressourcen bestimmt. Außerdem kann es sein, dass Ihre KI-Lösung der Generation bei unbekannten Daten und Aufgaben leistungsschwach ist.
  4. Umschulung von Open-Source-Modellen auf Ihren Daten . In diesem Fall müssen Sie spezifische Daten für das Gen AI-Modelltraining abrufen und vorbereiten, lokale oder Cloud-Server für Modelltraining und -betrieb bereitstellen und das Modell weiterhin optimieren und aktualisieren, wenn sich Ihre Aufgaben weiterentwickeln. Dieser maßgeschneiderte Ansatz garantiert zwar eine überlegene Modellleistung, bringt aber auch höhere generative KI-Kosten mit sich.


Nachdem Sie nun Ihre Implementierungsoptionen kennen, werfen wir einen genaueren Blick auf die Kosten generativer KI, die diese Optionen mit sich bringen.

Einblick in die Preisgestaltung generativer KI basierend auf dem Implementierungsszenario

Die Kosten für kommerziell erhältliche Gen-KI-Tools

Standarddienste, die die Textverarbeitung und -generierung erleichtern, berechnen Unternehmen in der Regel eine Gebühr basierend auf der Anzahl der Zeichen oder Token – d. h. Grundeinheiten des Textes, die von Satzzeichen bis hin zu Wörtern und anderen Elementen der Syntax reichen können – im Eingabe- oder Ausgabetext .

So funktioniert das in der Praxis:


  1. Zeichenbasierte Abrechnung . Einige Lösungen, wie zum Beispiel Gen-AI-Tools, die auf Googles Vertex AI basieren, berechnen den Nutzern die Rechnung auf der Grundlage der Anzahl der Zeichen im Eingabe- und Ausgabetext. Sie zählen jeden Buchstaben, jede Zahl, jedes Leerzeichen und jedes Satzzeichen als Zeichen. Die generative KI-Preisgestaltung für das von Vertex unterstützte PaLM 2 for Text-Modell beginnt beispielsweise bei 0,0005 USD pro 1.000 Zeichen für Eingabe- und Ausgabetext (separate Abrechnung).

  2. Tokenbasierte Abrechnung . Fortgeschrittenere Gen-KI-Tools neigen dazu, Text in Token statt in Zeichen zu zerlegen. Abhängig von den Trainings- und Verarbeitungsmethoden eines Modells kann ein Token ein Satzzeichen, ein Wort oder ein Teil eines Wortes sein. OpenAI definiert beispielsweise einen Token als eine Gruppe von etwa vier Zeichen. Ein einfacher Satz wie „Tom hat Jill Blumen mitgebracht.“ würde somit aus acht Token bestehen, da die Wörter „mitgebracht“ und „Blumen“ die Schwelle von vier Zeichen leicht überschreiten. Die Kosten für solche generativen KI-Lösungen hängen weitgehend von Ihrem gewählten Sprachmodell ab. GPT-4 Turbo von OpenAI, eines der fortschrittlichsten Tools auf dem Markt, berechnet 0,01 US-Dollar pro 1.000 Token für Eingabetext und 0,03 US-Dollar pro 1.000 Token für Ausgabetext. Für GPT-3.5 Turbo, die ältere Version, sind die Preise deutlich niedriger und reichen von 0,001 $ pro 1.000 Token für Eingabetext bis zu 0,002 $ pro 1.000 Token für Ausgabetext.

    Es ist zu beachten, dass verschiedene Anbieter generativer KI unterschiedliche Vorstellungen von Zeichen und Token haben. Um die kostengünstigste Option auszuwählen, sollten Sie deren Dokumentation und Pläne studieren und überlegen, welches Produkt am besten zu Ihren individuellen Geschäftsanforderungen passt. Wenn es bei Ihren Aufgaben beispielsweise eher um die Generierung von Texten als um die Analyse geht, ist ein generativer KI-Dienst mit geringeren Ausgaberaten besser geeignet.


Bei Gen-KI-Diensten für die Erstellung visueller Inhalte werden den Benutzern tendenziell Gebühren pro generiertem Bild berechnet, wobei die Gebühren an die Bildgröße und -qualität gebunden sind. Ein einzelnes Bild mit 1024 x 1024 Pixeln, das von DALL·E 3 in Standardqualität erstellt wurde, würde Sie 0,04 $ kosten. Für größere Bilder (1024 x 1792 Pixel) sowie hochauflösende Bilder würde der Preis auf 0,08 bis 0,12 US-Dollar pro Stück steigen.


Und vergessen Sie nicht die schlüsselfertigen Gen-KI-Plattformen wie Synthesia.io, die bei der Preisgestaltung einen traditionelleren Ansatz verfolgen. Wenn Ihr Marketingteam den Prozess der Videoerstellung beschleunigen möchte, können Sie das Tool für nur 804 US-Dollar pro Jahr testen.

Die Kosten für die Anpassung kommerziell erhältlicher Gen-AI-Produkte

Wie Sie im vorherigen Abschnitt sehen können, nutzen die meisten vorgefertigten Gen-AI-Produkte die Pay-as-you-go-Monetarisierungsstrategie.


Während ihre Preismodelle auf den ersten Blick recht einfach erscheinen, kann es schwierig sein, vorherzusagen, wie viele Abfragen Ihre Mitarbeiter ausführen werden, insbesondere wenn Sie mehrere Anwendungsfälle generativer KI in verschiedenen Abteilungen untersuchen möchten.


Dies führt wie in den Anfängen des Cloud Computing zu Verwirrung hinsichtlich der Preise und Gesamtbetriebskosten von Gen-AI-Tools.


Ein weiterer Nachteil der Verwendung kommerzieller Gen-AI-Lösungen besteht darin, dass es Allzweckprodukten wie ChatGPT an Kontextwissen mangelt, beispielsweise an der Vertrautheit mit der Struktur, den Produkten und Dienstleistungen Ihres Unternehmens. Dies macht es schwierig, Vorgänge wie Kundensupport und Berichtserstellung mit KI-Funktionen zu erweitern, selbst wenn Sie Prompt Engineering beherrschen.


Laut Eric Lamarre, Senior Partner bei McKinsey, müssen Unternehmen zur Lösung dieses Problemseine Datenumgebung schaffen, die vom Modell genutzt werden kann.“ „Mit anderen Worten: Sie müssen kommerziell verfügbare Gen-AI-Tools auf Ihre Unternehmensdaten sowie auf Informationen, die über APIs aus externen Quellen bezogen werden, umschulen.


Es gibt zwei Möglichkeiten, das Ziel zu erreichen – und mehrere Faktoren, die sich in jedem Szenario auf die Kosten generativer KI auswirken:


  • Nutzung von Software-as-a-Service (SaaS)-Plattformen mit generativen KI-Funktionen . Viele bekannte SaaS-Anbieter, darunter SAP, TIBCO Spotfire und Salesforce, führen generative KI-Dienste ein, die anhand von Kundendaten feinabgestimmt werden können. Salesforce hat beispielsweise Einstein Copilot auf den Markt gebracht, einen dialogorientierten KI-Assistenten, der proprietäre Daten aus der Salesforce Data Cloud abruft, um personalisierte Antworten auf Kundenfragen zu erstellen. Zu den vom intelligenten Assistenten genutzten Informationen gehören Slack-Konversationen, Telemetrie, Unternehmensinhalte und andere strukturierte und unstrukturierte Daten . Salesforce-Kunden können auch benutzerdefinierte KI-Modelle, Fertigkeiten und Eingabeaufforderungen erstellen, indem sie den Prompt Builder und Model Builder von Einstein Copilot Studio ohne Code verwenden. Ab sofort unterstützt das letztgenannte Instrument die großen Sprachmodelle (LLMs) von OpenAI, es gibt jedoch Pläne, das Produkt mit anderen Lösungen von Drittanbietern zu integrieren, darunter Amazon Bedrock und Vertex AI. Da sich Einstein Copilot noch in der Pilotphase befindet (kein Wortspiel beabsichtigt), wurden die Preisinformationen für generative KI noch nicht veröffentlicht. Die Kosten für den generativen AI Sales GPT-Assistenten, die sich derzeit auf insgesamt 50 US-Dollar pro Benutzer und Monat belaufen , könnten Ihnen jedoch eine allgemeine Vorstellung davon geben, was Sie erwartet.
  • Integrieren Sie Ihre Unternehmenssoftware mit Gen-AI-Lösungen über APIs und trainieren Sie Modelle auf Ihren Daten neu . Um die Kosten der generativen KI-Implementierung zu senken, könnten Sie die zwischengeschalteten SaaS-Tools eliminieren und Ihre Apps direkt mit kommerziellen Gen-KI-Lösungen auf API-Ebene zusammenführen. Wenn Sie beispielsweise Ihren Kundensupport-Chatbot mit Gen-AI-Funktionen aufrüsten möchten, können Sie ihn mithilfe der OpenAI-API mit einem der OpenAI-Modelle – z. B. GPT-3.5 oder GPT-4 – synchronisieren. Als Nächstes müssen Sie Ihre Daten für maschinelles Lernen vorbereiten , die Daten auf OpenAI hochladen und den Feinabstimmungsprozess mithilfe des OpenAI-CLI-Tools und der Open AI-Python-Bibliothek verwalten. Während der Feinabstimmung des Modells werden Ihnen 0,008 US-Dollar pro 1.000 Token (GPT-3.5) berechnet. Sobald Ihr Modell in Produktion geht, betragen die Eingabe- und Ausgaberaten 0,003 USD pro 1.000 Token bzw. 0,006 USD pro tausend Token. Zu den Gesamtkosten generativer KI gehören auch Speicherkosten, sofern Sie sich dafür entscheiden, Ihre Daten auf OpenAI-Servern zu hosten. Die Kosten für die Datenspeicherung könnten die endgültige Schätzung um 0,2 US-Dollar pro 1 GB Daten pro Tag erhöhen . Und vergessen Sie nicht die Datenaufbereitung und die Feinabstimmung des Modells. Sofern Ihre IT-Abteilung nicht über die erforderlichen Fähigkeiten verfügt, müssen Sie mit einem zuverlässigen Unternehmen für KI-Entwicklungsdienstleistungen zusammenarbeiten.

Die Kosten für die Verwendung von Open-Source-Gen-KI-Modellen „wie sie sind“

Haftungsausschluss : Wir schlagen nicht vor, dass Sie von Grund auf ein benutzerdefiniertes Basismodell wie ChatGPT entwickeln – das ist ein Unterfangen, das man am besten denjenigen überlassen sollte, die über beträchtliche Unterstützung verfügen, wie zum Beispiel die Unterstützung von OpenAI durch Microsoft, um ihre 540-Millionen-Dollar-Verluste auszugleichen .


Selbst einfachere Basismodelle wie GPT-3 können anfängliche Schulungs- und Bereitstellungskosten von über 4 Millionen US-Dollar verursachen. Darüber hinaus ist die Komplexität dieser Stiftungsmodelle in den letzten Jahren erstaunlich schnell gestiegen.


Der Bedarf an Rechenressourcen für das Training großer KI-Modelle verdoppelt sich alle 3,5 Monate . Auch die Komplexität der Grundlagenmodelle verändert sich. Beispielsweise wurde Bert-Large im Jahr 2016 mit 340 Millionen Parametern trainiert. Im Vergleich dazu wurde das GPT-3-Modell von OpenAI mit rund 175 Milliarden Parametern trainiert .


Die gute Nachricht ist, dass es bereits grundlegende Modelle gibt, was es für Unternehmen relativ einfach macht, mit ihnen zu experimentieren und gleichzeitig die Kosten für die Implementierung generativer KI zu optimieren.


Grundsätzlich könnten wir Grundlagenmodelle als Toolkit für KI-Softwareentwickler betrachten, da sie einen Ausgangspunkt für die Lösung komplexer Probleme bieten und gleichzeitig Raum für individuelle Anpassungen lassen.


Wir könnten bestehende Stiftungsmodelle grob in drei Kategorien einteilen:


  • Sprachmodelle sind für die Aufgaben der Textübersetzung, -generierung und -beantwortung konzipiert
  • Computer-Vision-Modelle zeichnen sich durch Bildklassifizierung, Objekterkennung und Gesichtserkennung aus
  • Die dritte Kategorie, generative KI-Modelle, erstellt Inhalte, die den Daten ähneln, die ein Modell verbraucht hat. Dieser Inhalt kann neue Bilder, Simulationen oder in einigen Fällen Textinformationen enthalten.


Sobald Sie ein Open-Source-Modell ausgewählt haben, das Ihren Anforderungen am besten entspricht, können Sie es mithilfe von APIs in Ihre Software integrieren und Ihre eigene Serverinfrastruktur nutzen.

Dieser Ansatz ist mit den folgenden generativen KI-Kosten verbunden:


  1. Hardwarekosten . Das Ausführen von KI-Modellen, insbesondere von großen, erfordert erhebliche Rechenressourcen. Wenn Ihrem Unternehmen die entsprechende Hardware fehlt, müssen Sie möglicherweise in leistungsstarke GPUs oder CPUs investieren, was teuer sein kann. Wenn Ihr Modell relativ klein ist, könnte eine High-End-GPU wie eine NVIDIA RTX 3080 oder ähnliches ausreichen. Die Kosten für eine solche GPU können zwischen 700 und 1.500 US-Dollar liegen. Für große Modelle wie GPT-2 oder ähnliches benötigen Sie mehrere High-End-GPUs oder sogar spezielle KI-Beschleuniger. Eine einzelne NVIDIA A100-GPU kann beispielsweise zwischen 10.000 und 20.000 US-Dollar kosten. Ein Setup mit mehreren GPUs kann daher zwischen 30.000 und 50.000 US-Dollar kosten.
  2. Kosten für Cloud Computing . Alternativ zum Kauf von Hardware können Sie Cloud-Computing-Ressourcen von Anbietern wie Amazon Web Services (AWS), Google Cloud Platform (GCP) oder Microsoft Azure mieten. Die Kosten für diese Dienste richten sich nach der Nutzung, sodass die Kosten davon abhängen, wie viel Sie ihre Ressourcen in Bezug auf Rechenzeit und Speicherplatz nutzen. Beispielsweise können GPU-Instanzen auf AWS (wie P3 oder P4) je nach Instanztyp zwischen 3 und 24 US-Dollar pro Stunde kosten.
  3. Strom und Wartung . Wenn Sie Ihre eigene Hardware verwenden, fallen Stromkosten für den Betrieb der Maschinen und möglicherweise zusätzliche Kühlsysteme an. Auch die Wartungskosten für die Hardware können sich summieren.
  4. Integration und Bereitstellung . Die Integration des KI-Modells in Ihre bestehenden Systeme und dessen Bereitstellung (insbesondere in einer Produktionsumgebung) erfordern möglicherweise zusätzlichen Softwareentwicklungsaufwand, der Arbeitskosten verursachen kann. Die Kosten für die Auslagerung der KI-Entwicklung an ein Softwareentwicklungsunternehmen können zwischen 50 und 200 US-Dollar pro Stunde liegen, wobei die Gesamtkosten zwischen einigen Tausend und Zehntausenden US-Dollar liegen.
  5. Datenspeicherung und -verwaltung . Das Speichern und Verwalten der vom Modell verwendeten Daten kann kostspielig sein, insbesondere wenn es um große Datensätze oder die Verwendung von Cloud-Speicherlösungen geht. Bei Installationen vor Ort können die Kosten für die Speicherung generativer KI-Daten zwischen 1.000 und 10.000 US-Dollar liegen, abhängig von der Größe des Trainingsdatensatzes und den Redundanzanforderungen. Die Gebühren für cloudbasierte Datenspeicherlösungen wie AWS S3 können zwischen 0,021 und 0,023 US-Dollar pro GB und Monat variieren, wobei zusätzliche Kosten für Betrieb und Datenübertragung anfallen.


Wie viel könnte es Ihr Unternehmen letztendlich kosten, ein generatives KI-Grundlagenmodell „so wie es ist“ zu übernehmen und es in Ihrer eigenen Infrastruktur bereitzustellen?

Für ein mittelständisches Unternehmen, das ein mittelgroßes Modell wie GPT-2 vor Ort nutzen möchte, könnten die damit verbundenen Kosten für generative KI Folgendes umfassen:


  • Hardware : 20.000–50.000 US-Dollar (für ein paar High-End-GPUs oder ein einfaches Multi-GPU-Setup)
  • Strom und Wartung : Etwa 2.000 bis 5.000 US-Dollar pro Jahr
  • Integration und Bereitstellung : 10.000–30.000 US-Dollar (bei moderater Integrationskomplexität)
  • Datenspeicherung und -verwaltung : 5.000–15.000 US-Dollar (variiert je nach Datengröße)

Die Gesamtkosten für die Einrichtung und den Betrieb einer generativen KI-Lösung würden Folgendes umfassen:

  • Kosten für die Erstbereitstellung : Ungefähr 37.000 bis 100.000 US-Dollar (Hardware + Erstintegration und Speichereinrichtung)
  • Wiederkehrende Ausgaben : 7.000 bis 20.000 US-Dollar (einschließlich Kosten für Strom, Wartung, laufende Integration und Datenverwaltung)


Diese groben Schätzungen können je nach spezifischen Anforderungen, Standort und Marktbedingungen erheblich variieren. Für einen individuelleren und genaueren Kostenvoranschlag ist es immer am besten, einen Fachmann zu konsultieren. Darüber hinaus empfiehlt es sich, die aktuellen Marktpreise für Hardware und Cloud-Dienste zu prüfen, um die aktuellsten Preise zu ermitteln.

Die Kosten für die Umschulung von Open-Source-Gen-KI-Lösungen mithilfe Ihrer Daten

Wenn Ihr Unternehmen darüber nachdenkt, ein Open-Source-Grundlagenmodell anzupassen, ist es wichtig, die Faktoren zu berücksichtigen, die sich auf die Kosten der Implementierung generativer KI auswirken können.

Zu diesen Faktoren gehören:


  1. Modellgröße . Größere Modelle wie GPT-3 erfordern mehr Ressourcen für die Feinabstimmung und Bereitstellung. Infolgedessen steigen die Kosten generativer KI mit der Größe und Komplexität des Modells. Einfachere Open-Source-Grundlagenmodelle wie GPT-2, XLNet und StyleGAN2 können hingegen keine Inhalte mit dem gleichen Maß an Kohärenz und Relevanz generieren.
  2. Rechenressourcen . Die Neuausrichtung eines Basismodells mithilfe der Daten Ihres Unternehmens erfordert erhebliche Rechenleistung. Die Kosten einer generativen KI-Lösung hängen daher davon ab, ob Sie Ihre eigene Hardware oder Cloud-Dienste nutzen, wobei der Preis für letztere je nach Cloud-Anbieter und Umfang Ihres Betriebs variiert. Wenn Sie sich für ein einfacheres Modell entscheiden und es vor Ort bereitstellen, werden Sie voraussichtlich 10.000 bis 30.000 US-Dollar an GPU-Kosten für die Feinabstimmung der generativen KI-Lösung ausgeben. Beim Cloud Computing können die Kosten je nach Instanztyp zwischen 1 und 10 US-Dollar pro Stunde liegen. GPT-3-ähnliche Open-Source-Modelle erfordern ein erweitertes GPU-Setup, das zwischen 50.000 und 100.000 US-Dollar übersteigt. Die damit verbundenen Cloud-Computing-Kosten können für High-End-GPU-Instanzen zwischen 10 und 24 US-Dollar pro Stunde liegen.
  3. Datenaufbereitung . Der Prozess des Sammelns, Bereinigens und Vorbereitens Ihrer Daten zur Feinabstimmung von Grundmodellen kann ressourcenintensiv sein. Die Kosten für die Implementierung generativer KI umfassen daher die Kosten für die Datenspeicherung, -verarbeitung und möglicherweise den Kauf von Trainingsdatensätzen, wenn Ihrem Unternehmen keine eigenen Daten zur Verfügung stehen oder diese aus Sicherheits- und Datenschutzgründen nicht verwendet werden können.
  4. Entwicklungszeit und Fachwissen . Talente im Bereich der künstlichen Intelligenz sind nicht billig. Ein in den USA ansässiger interner KI-Ingenieur kostet Ihr Unternehmen jährlich 70.000 bis 200.000 US-Dollar , zuzüglich der Einstellungs-, Gehalts-, Sozialversicherungs- und anderen Verwaltungskosten. Sie können die Kosten für generative KI senken, indem Sie mit einem Offshore-Softwareentwicklungsunternehmen mit KI-Entwicklungskompetenz zusammenarbeiten. Abhängig vom Standort können die Stundensätze solcher Unternehmen für leitende Entwicklungstalente an wichtigen Outsourcing-Standorten wie Mitteleuropa und Lateinamerika zwischen 62 und 95 US-Dollar liegen .
  5. Instandhaltungskosten . Sie sind allein für die Wartung, Aktualisierung und Fehlerbehebung des Modells verantwortlich, was fortlaufenden Aufwand und Fachwissen in den Bereichen Machine Learning Engineering und Operations (MLOps) erfordert.


Wie hoch sind unter Berücksichtigung der oben genannten Faktoren die realistischen Kosten für die Erstellung einer maßgeschneiderten generativen KI-Lösung auf der Grundlage eines leicht verfügbaren Basismodells?

Für ein mittelständisches Unternehmen, das ein mittelgroßes Modell wie GPT-2 verfeinern möchte, könnten die damit verbundenen Kosten für die generative KI-Implementierung Folgendes umfassen:


  • Hardware : 20.000–30.000 US-Dollar (für ein moderates GPU-Setup)
  • Entwicklung : Unter der Annahme einer sechsmonatigen Entwicklungszeit mit einer Mischung aus internen und ausgelagerten Talenten:
    • Intern: 35.000–100.000 US-Dollar (Halbjahresgehalt)
    • Outsourcing: 20.000–40.000 US-Dollar (unter der Annahme von 400 Stunden bei einem durchschnittlichen Stundensatz von 75 US-Dollar)
  • Datenvorbereitung : 5.000–20.000 US-Dollar (variiert je nach Datengröße und -komplexität)
  • Wartung : 5.000–15.000 US-Dollar pro Jahr (laufende Kosten)

Die Gesamtkosten für die Einrichtung und den Betrieb einer generativen KI-Lösung würden Folgendes umfassen:

  • Kosten für die anfängliche Bereitstellung : Ungefähr 80.000 bis 190.000 US-Dollar (einschließlich Kosten für Hardware, Entwicklung und Datenvorbereitung)
  • Wiederkehrende Ausgaben : 5.000 bis 15.000 US-Dollar (Wartung und laufende Kosten)


Die tatsächlichen Kosten für die Entwicklung und Implementierung von KI der Generation können je nach spezifischen Projektanforderungen, der Verfügbarkeit von Schulungsdaten und internen KI-Talenten sowie dem Standort Ihres Outsourcing-Partners variieren. Für eine genaue und aktuelle Preisgestaltung ist es ratsam, sich direkt an Fachleute oder Dienstleister zu wenden.


Während 190.000 US-Dollar für ein generatives KI-System unangemessen teuer erscheinen mögen, könnten die Kosten für den Aufbau einer generativen KI-Lösung unter Verwendung von Open-Source-Basismodellen niedriger sein als für die Entscheidung für ein kommerziell erhältliches Tool.


Bevor ChatGPT Aufmerksamkeit erregte, nutzte Latitude, ein bahnbrechendes Startup, das für das KI-basierte Abenteuerspiel namens AI Dungeon verantwortlich ist, das GPT-Modell von OpenAI zur Textgenerierung.

Mit dem Wachstum ihrer Nutzerbasis wuchsen auch die Rechnungen von OpenAI und die Infrastrukturkosten von Amazon. Irgendwann zahlte das Unternehmen 200.000 US-Dollar pro Monat an damit verbundenen Kosten, um die steigende Zahl von Benutzeranfragen zu bearbeiten.


Nach dem Wechsel zu einem neuen Anbieter generativer KI senkte das Unternehmen die Betriebskosten auf 100.000 US-Dollar pro Monat und passte seine Monetarisierungsstrategie an, indem es ein monatliches Abonnement für erweiterte KI-gestützte Funktionen einführte.


Um den richtigen Implementierungsansatz auszuwählen und gleichzeitig die Preisgestaltung für generative KI zu optimieren, ist es daher wichtig, Ihre Projektanforderungen im Vorfeld gründlich zu analysieren. Und deshalb ermutigen wir unsere Kunden immer, ihre KI-Entwicklungsinitiativen mit einer Entdeckungsphase zu beginnen.

Dinge, die bei der Implementierung von Gen AI in Unternehmen zu beachten sind

Nachdem Sie nun wissen, was Sie von der generativen KI kostenmäßig erwarten können, ist es an der Zeit, über die Fallstricke und Überlegungen bei der Implementierung der Technologie zu sprechen:


  • Foundation-Modelle, insbesondere große Sprachmodelle, könnten halluzinieren und scheinbar legitime, aber völlig falsche Antworten auf Benutzerfragen liefern. Ihr Unternehmen könnte dieses Szenario vermeiden, indem es die Trainingsdaten verbessert, mit verschiedenen Modellarchitekturen experimentiert und effektive Benutzer- Feedbackschleifen einführt.
  • Gen-KI-Lösungen werden mit riesigen Datenmengen trainiert, die schnell veraltet sind. Infolgedessen müssen Sie Ihr Modell regelmäßig neu trainieren, was die Kosten für die Implementierung generativer KI erhöht.
  • Foundation-Modelle, die auf bestimmte Daten, wie z. B. Einträge in elektronischen Gesundheitsakten (EHR), trainiert wurden, könnten außerhalb ihres unmittelbaren Fachwissens Schwierigkeiten haben, gültige Inhalte zu erstellen. Allzweckmodelle hingegen haben Probleme mit domänenspezifischen Benutzerabfragen. Zu den Möglichkeiten, dieses Problem anzugehen, gehören die Erstellung hybrider Modelle, die Nutzung von Transferlerntechniken und die Feinabstimmung der Modelle durch Benutzerfeedback.
  • Gen-KI-Lösungen sind von Natur aus Black-Box-Lösungen, was bedeutet, dass selten klar ist, warum sie bestimmte Ergebnisse liefern und wie ihre Genauigkeit zu bewerten ist. Dieses mangelnde Verständnis könnte Entwickler davon abhalten, die Modelle zu optimieren. Durch die Befolgung erklärbarer KI-Prinzipien während des generativen KI-Modelltrainings, wie z. B. die Einführung von Modellinterpretierbarkeitstechniken, Aufmerksamkeitsmechanismen und Audit-Trails, können Sie Einblicke in den Entscheidungsprozess des Modells gewinnen und seine Leistung optimieren.


Darüber hinaus muss Ihr Unternehmen mehrere Fragen beantworten, bevor es mit der Implementierung generativer KI beginnt:


  • Gibt es eine solide Buy-vs-Build-Strategie, um sicherzustellen, dass Ihr Unternehmen generative KI nur in Funktionen einsetzt, in denen die Technologie ein Unterscheidungsmerkmal darstellt und gleichzeitig eine Anbieterbindung verhindert? Diese Strategie sollte durch eine detaillierte Roadmap für das Änderungsmanagement und die Skalierung der Gen-KI sowie durch Bestimmungen zur Neugestaltung ganzer Geschäftsprozesse bei Bedarf ergänzt werden.
  • Verfügt Ihre interne IT-Abteilung über ausreichende MLOps-Fähigkeiten, um die Qualität komplexer ML-Modelle und ihrer Trainingsdaten zu testen, zu optimieren und aufrechtzuerhalten? Wenn nicht, haben Sie bereits ein zuverlässiges KI-Entwicklungsunternehmen ausgewählt, das sich um diese Aufgaben kümmert?
  • Verfügen Sie über eine beträchtliche Menge an Rechenressourcen, sowohl in der Cloud als auch am Edge? Außerdem ist es wichtig, die Skalierbarkeit Ihrer IT-Infrastruktur sowie die Möglichkeit der Wiederverwendung von Gen-AI-Modellen für verschiedene Aufgaben, Prozesse und Einheiten zu bewerten.
  • Verfügt Ihr Unternehmen oder Ihr KI-Entwicklungspartner über die Fähigkeiten, die Machbarkeit von Gen AI durch Proof of Concept (PoC) zu testen und Ihre Experimente außerhalb der kontrollierten Sandbox-Umgebung zu skalieren?
  • Und nicht zuletzt: Verfügt Ihr Unternehmen über wirksame Datenschutz- und Sicherheitsmechanismen, um vertrauliche Informationen zu schützen und die Einhaltung branchen- und regionalspezifischer Vorschriften sicherzustellen?


Ein gut durchdachter Implementierungsplan hilft Ihnen nicht nur dabei, die Technologie risikofrei einzuführen und schneller von den Vorteilen zu profitieren, sondern senkt auch die Kosten generativer KI.


Nutzen Sie unsere Beratungsdienste für generative KI, um herauszufinden, ob Gen AI Ihnen bei der Neugestaltung von Geschäftsprozessen, der Auswahl des richtigen Gen AI-Implementierungsansatzes und der Optimierung der Kosten für generative KI hilft. Schreiben Sie uns, um den Stein ins Rollen zu bringen!


Auch hier veröffentlicht.