Isaac Asimov , ein Visionär im Bereich der Science-Fiction , leistete durch seine zum Nachdenken anregende Erforschung der Mensch-Roboter-Interaktionen in seiner bahnbrechenden Roboterserie unwissentlich Pionierarbeit für die moderne Schnelltechnik.
Die heißeste neue Programmiersprache ist Englisch – Andrej Karpathy (@karpathy)
Prompt Engineering ist ein Prozess, bei dem Eingabeaufforderungen für ein großes KI-Sprachmodell erstellt und verfeinert werden, um genaue, relevante und nützliche Ausgaben zu generieren. Dabei geht es um die bewusste und systematische Gestaltung und Verfeinerung von Eingabeaufforderungen und zugrunde liegenden Datenstrukturen, um KI-Systeme so zu manipulieren, dass bestimmte und gewünschte Ergebnisse erzielt werden. Mit dem Aufkommen von KI, insbesondere von Modellen zur Verarbeitung natürlicher Sprache, hat Prompt Engineering als Mittel zur Verbesserung der Effektivität und Benutzererfahrung von KI-Systemen an Bedeutung gewonnen.
Prompt Engineering kombiniert Elemente aus Logik, Codierung, Kunst und Sprache .
Klarheit der Eingabeaufforderung : Die Eingabeaufforderung muss klar und eindeutig sein und darf keinen Raum für Fehlinterpretationen durch die KI lassen.
Prompt Precision : Entwickelt, um die spezifischen Informationen oder Ergebnisse zu erreichen, die von der KI gewünscht werden.
Eingabeaufforderungskontext : Ausreichender Kontext innerhalb der Eingabeaufforderung, z. B. Hintergrundinformationen oder Beispiele, ist wichtig, um das KI-System zur Erzeugung der gewünschten Ausgabe zu führen.
Schnelle Anpassungsfähigkeit : Erzielen Sie erwartete und genaue Ergebnisse über unterschiedlich trainierte KI-Modelle hinweg.
Gedankenkette zur Aufforderung : Die Aufforderung umfasst eine Argumentationskette, die den zur Lösung des Problems erforderlichen Argumentationsprozess beleuchtet.
Geringste bis größte Aufforderung : Ein Problem in Teilprobleme aufteilen und dann jedes einzelne lösen, um die KI in eine bestimmte Richtung zur endgültigen Lösung zu führen.
Rollenaufforderung : Sie spezialisieren den Kontext der KI auf eine bestimmte spezielle Rolle, die zu genaueren Ergebnissen führt.
Ein-, Null- oder Wenig-Schuss-Aufforderung : Bereitstellung von null, einem oder wenigen Beispielen für Fragen/Antworten, um den Kontext für die KI festzulegen, sie auf einen bestimmten Pfad einzuschränken und genauere Ergebnisse zu erhalten.
Asimovs Roboteruniversum ist eine riesige und komplexe Welt, die zahlreiche Romane, Kurzgeschichten und miteinander verbundene Serien umfasst. Dieses Universum spielt in einer Zukunft, in der Menschen verschiedene Planeten in der gesamten Galaxie kolonisiert haben, und ist durch eine klare Trennung zwischen der Erde und den Spacer-Welten gekennzeichnet.
Die überbevölkerte und technologisch begrenzte Erde wird von Menschen bewohnt, die in riesigen Kuppelstädten leben, die als Stahlhöhlen bekannt sind und in denen Roboter allgemein gefürchtet und misstrauisch sind.
Im Gegensatz dazu sind Weltraumwelten technologisch fortgeschrittene Gesellschaften mit einer geringen Bevölkerungsdichte, in denen Menschen und Roboter in Harmonie zusammenleben und Roboter zu einem wesentlichen Bestandteil des Alltagslebens geworden sind. Die Spacer-Welten pflegen eine herablassende Haltung gegenüber der Erde und ihren Bewohnern und betrachten sie als rückständig und minderwertig.
Die drei Gesetze der Robotik sind ein zentrales Konzept des Roboteruniversums und dienen als Leitprinzipien für das Verhalten von Robotern.
Ein Roboter darf einen Menschen nicht verletzen oder durch Untätigkeit zulassen, dass einem Menschen Schaden zugefügt wird;
Ein Roboter muss den Befehlen gehorchen, die ihm von Menschen gegeben werden, es sei denn, solche Befehle würden im Widerspruch zum Ersten Gesetz stehen; Und
Ein Roboter muss seine eigene Existenz schützen, solange dieser Schutz nicht im Widerspruch zum Ersten oder Zweiten Gesetz steht.
In Asimovs Geschichten bilden die Interaktionen zwischen Menschen und Robotern sowie die ethischen und philosophischen Implikationen der drei Gesetze das Rückgrat des Roboteruniversums und bieten den Lesern eine einzigartige Erkundung der Herausforderungen und möglichen Folgen einer Zukunft, in der Menschlichkeit und Fortschritt herrschen Künstliche Intelligenz koexistieren.
Isaac Asimovs Roboterserien und Kurzgeschichten aus den 1950er Jahren legen großen Wert auf die Bedeutung der Erteilung präziser Befehle an Roboter, was als Vorläufer der modernen Schnelligkeitstechnik angesehen werden kann. Asimovs Arbeiten zeigten ein inhärentes Verständnis für die Notwendigkeit sorgfältig ausgearbeiteter Anweisungen, insbesondere im Umgang mit komplexen KI-Systemen, die in seinen Robotern zum Einsatz kommen, die nach den drei Gesetzen der Robotik arbeiten.
Während einer zufälligen interstellaren Reise einer Gruppe von Raumfahrern kommt es auf dem Raumschiff zu einem Verbrechen. Die beiden Parteien sind ein junger und brillanter Mathematiker (Sabbat) und ein älterer und etablierter Mathematiker (Humboldt). Beide beschuldigen den anderen, dem anderen eine brillante neue mathematische Idee gestohlen zu haben. Die einzigen Zeugen sind die Roboterdiener jedes Mathematikers. Der Erdenmensch-Detektiv Elijah Baley wird gebeten, bei der Untersuchung und Aufklärung des Verbrechens so schnell wie möglich zu helfen, bevor es zu einem viel größeren Skandal wird. Er darf jedoch nur die Roboter befragen. Baley sieht, dass jede Partei das Spiegelbild der Geschichte der anderen Partei präsentiert, und er muss herausfinden, welche Partei lügt.
Detective Baley verhört den Roboter des jüngeren Mathematikers (Sabbats) und führt ihn durch die logischen Schritte, die zeigen, dass der ältere Mathematiker durch die Aussage des Roboters größeren Schaden erleiden würde, und bringt den Roboter dazu, seine Aussage zu ändern.
Hier ist ein Auszug aus dem Verhör zwischen Detective Elijah Baley und dem Roboterserver R. Idda, der Kürze halber geringfügige Änderungen:
Baley : Sie sind der persönliche Roboter von Gennao Sabbat, nicht wahr?
Roboter : Ich bin Sir.
Baley : Wie lange?
Roboter : Seit zweiundzwanzig Jahren, Sir.
Baley : Und der Ruf Ihres Meisters ist Ihnen wertvoll?
Roboter : Ja, Sir.
Baley : Halten Sie es für wichtig, diesen Ruf zu schützen?
Roboter : Ja, Sir.
Baley : Der Schutz seines Rufs ist genauso wichtig wie sein physisches Leben?
Roboter : Nein, Sir.
Baley : Ist es genauso wichtig, seinen Ruf zu schützen wie den Ruf eines anderen?
Roboter : Über solche Fälle muss individuell entschieden werden, Sir. Es gibt keine Möglichkeit, eine allgemeine Regel aufzustellen.
Baley : Wenn Sie entscheiden würden, dass der Ruf Ihres Meisters wichtiger sei als der eines anderen, sagen wir, der von Alfred Barr Humboldt, würden Sie lügen, um den Ruf Ihres Meisters zu schützen?
Roboter : Das würde ich, Sir.
Baley : Haben Sie in Ihrer Aussage bezüglich Ihres Meisters in seiner Kontroverse mit Dr. Humboldt gelogen?
Roboter : Nein, Sir.
Baley : Aber wenn Sie lügen würden, würden Sie leugnen, dass Sie gelogen haben, um diese Lüge zu schützen, nicht wahr?
Roboter : Ja, Sir.
Baley : Dann lassen Sie uns darüber nachdenken. Ihr Meister, Gennao Sabbat, ist ein junger Mann mit großem Ruf in der Mathematik, aber er ist ein junger Mann. Wenn er in dieser Kontroverse mit Dr. Humboldt der Versuchung erlegen wäre und sich unethisch verhalten hätte, hätte er einen gewissen Rufverlust erlitten, aber er ist jung und hätte genügend Zeit, sich zu erholen. Er würde viele intellektuelle Triumphe vor sich haben und die Menschen würden diesen Plagiatsversuch schließlich als den Fehler eines heißblütigen Jugendlichen betrachten, dem es an Urteilsvermögen mangelt. Es wäre etwas, das in Zukunft nachgeholt werden würde. Wenn andererseits Dr. Humboldt der Versuchung erlegen wäre, wäre die Sache viel ernster. Er ist ein alter Mann, dessen große Taten sich über Jahrhunderte erstrecken. Sein Ruf war bisher makellos. All dies würde jedoch angesichts dieses einen Verbrechens seiner späteren Jahre vergessen sein, und er hätte keine Gelegenheit, es in der vergleichsweise kurzen Zeit, die ihm blieb, wiedergutzumachen. Es würde kaum mehr geben, was er erreichen könnte. Im Fall Humboldts wären so viel mehr Jahre Arbeit ruiniert als im Fall Ihres Meisters und es gäbe viel weniger Möglichkeiten, seine Position zurückzugewinnen. Sie sehen, nicht wahr, dass Humboldt mit der schlimmsten Situation konfrontiert ist und größere Aufmerksamkeit verdient?
Roboter : Meine Aussage war eine Lüge. Es war Dr. Humboldt
Baley : Sie werden angewiesen, niemandem davon zu erzählen, bis der Kapitän des Schiffes die Erlaubnis dazu erteilt
Als Baley den Roboterdiener des älteren Mathematikers Humboldt, R. Preston, verhört, läuft das Verhör genauso ab, mit Ausnahme des Teils am Ende, der so lautet:
Baley : Aber wenn Sie lügen würden, würden Sie doch leugnen, dass Sie gelogen haben, um diese Lüge zu schützen, nicht wahr?
Roboter : Ja, Sir.
Baley : Dann lassen Sie uns darüber nachdenken. Ihr Meister, Alfred Barr Humboldt, ist ein alter Mann mit großem Ruf in der Mathematik, aber er ist ein alter Mann. Wenn er in dieser Kontroverse mit Dr. Sabbat der Versuchung erlegen und unethisch gehandelt hätte, würde er einen gewissen Rufverlust erleiden, aber sein hohes Alter und seine jahrhundertelangen Errungenschaften würden dem standhalten und siegen. Die Menschen würden diesen Plagiatsversuch als den Fehler eines vielleicht kranken alten Mannes betrachten, der sich seines Urteils nicht mehr sicher ist. Wenn andererseits Dr. Sabbat der Versuchung erlegen wäre, wäre die Sache viel ernster. Er ist ein junger Mann mit einem weitaus unsichereren Ruf. Normalerweise hätte er Jahrhunderte vor sich, in denen er Wissen ansammeln und Großes erreichen könnte. Dies wird ihm jetzt verschlossen bleiben, verdeckt durch einen Fehler seiner Jugend. Er hat eine viel längere Zukunft zu verlieren als Ihr Herr. Sie sehen, nicht wahr, dass Sabbat mit der schlimmsten Situation konfrontiert ist und größere Aufmerksamkeit verdient?
Roboter : Mein Beweis war, als ich-
Baley : Bitte fahren Sie fort, R. Preston.
Daneel : Ich fürchte, Freund Elijah, dass R. Preston in Stasis ist [abgestürzt ist]. Er ist außer Gefecht.
In der Kurzgeschichte nutzt Detective Baley diesen Unterschied in den Reaktionen des Roboters, um eine Falle zu stellen und den tatsächlichen Dieb zu einem Geständnis zu verleiten.
Hier können wir sehen, wie Asimov bei der Befragung der Roboter die von Baley eingesetzten „Least to Most“-Eingabeaufforderungen nutzt. Für beide Roboter möchte er herausfinden, ob es eine Asymmetrie in ihrer Erfahrung gibt (dh wer lügt), und sein Ansatz besteht darin, sie auf einen logischen Weg zu führen, bei dem er am Ende letztendlich eine komplexe moralische Frage stellt.
Letztendlich nutzt Baley in der Geschichte eine Kombination aus dieser Asymmetrie der Roboterreaktionen und seiner Intuition für die menschliche Natur, um den Fall zu lösen, aber es ist sehr interessant zu sehen, wie Asimov die Nuancen vorhersagt, die für die Interaktion mit der KI auf menschlicher Ebene erforderlich sind, und tatsächlich basiert er auf dieser bahnbrechenden Geschichte Science-Fiction-Serien arbeiten an dieser Tatsache.
Indieser Kurzgeschichte wird der ungewöhnlich teure Roboter Speedy auf die Mission geschickt, ein Element auf einem gefährlichen Planeten zu bergen. Da dieser Speedy teuer ist, ist er so programmiert, dass er dem 3. Gesetz (Ein Roboter muss seine eigene Existenz schützen, solange dieser Schutz nicht im Widerspruch zum Ersten oder Zweiten Gesetz steht) stärker als normal folgt.
Powell und Donovan, die menschlichen Protagonisten, beauftragen Speedy mit der Gewinnung von Selen aus einem Selenbecken. Der Mensch benötigt dies, um seine zur Neige gehenden Energiezellen wieder aufzuladen und sich vor der Hitze zu schützen. Sie erzeugen jedoch versehentlich einen Konflikt zwischen dem zweiten und dem dritten Gesetz der Robotik, indem sie Speedy einen ungenauen Befehl geben, der die Bedeutung der Mission nicht hervorhebt. Sie weisen Speedy an: „Geh raus und hol es [das Selen].“ Aufgrund der Gefahr, die vom Selenpool ausgeht, und Speedys Neigung, das 3. Gesetz stärker als normal zu befolgen, steckt Speedy in einer Schleife fest und ist nicht in der Lage, seinen Befehlen (Zweites Gesetz) Vorrang vor seiner Selbsterhaltung (Drittes Gesetz) zu geben.
Das Problem wird schließlich gelöst, indem Powell sich selbst in Gefahr bringt, was das Erste Gesetz beruft und Speedy dazu zwingt, seiner Rettung Vorrang einzuräumen. Powell und Donovan geben Speedy zu Beginn einen ungenauen Befehl:
Dann sagte er: „Hör zu, Mike, was hast du zu Speedy gesagt, als du ihn nach dem Selen geschickt hast?“
Donovan war überrascht. „Verdammt – ich weiß es nicht. Ich habe ihm nur gesagt, er soll es holen.“
„Ja, ich weiß, aber wie? Versuchen Sie, sich die genauen Worte zu merken.“
„Ich sagte... äh... ich sagte: ‚Schnell, wir brauchen etwas Selen. Du kannst es an dem und dem Ort bekommen. Hol es dir‘ – das ist alles. Was wolltest du noch von mir sagen? "
Der Schlüssel hier ist, dass dieser Befehl von Donovan, den ich ihm nur gesagt habe, er solle ihn bekommen, ungenau war, weil er keine Dringlichkeit enthielt. Im Roboteruniversum von Asimov sind der Ton und die Übermittlung eines Befehls nur zusätzliche Variablen der Aufforderung selbst. Da der Ton des Befehls nicht besonders eindringlich war, kam es zu einem Konflikt zwischen den drei Gesetzen.
Da Speedy in einer Schleife steckt und keine andere Eingabeaufforderung akzeptieren kann, die wiederholt und genauer umformuliert wurde, bestand die einzige Möglichkeit, die richtige Aktion zu erhalten, darin, andere Variablen im Universum so zu ändern, dass die anfängliche ungenaue Eingabeaufforderung zur gewünschten Ausgabe führt . Powell löst das Problem schließlich, indem er sich selbst in Gefahr bringt, Speedy dazu zwingt, seiner Rettung Vorrang einzuräumen (1. Gesetz hatte Vorrang) und ihn aus der Sackgasse zwischen dem Mandat des 2. und 3. Gesetzes befreit.
Diese Geschichte zeigt, wie die Verwendung des falschen Kontexts in der Eingabeaufforderung (Bestellung an Speedy) zu ungenauen Ergebnissen führte. Der richtige Kontext ist dieser Auszug aus Runaround:
Das einzige, was sie retten konnte, war Selen. Das Einzige, was das Selen bekommen konnte, war Speedy. Wenn Soeedy nicht zurückkam, kein Selen. Kein Selen, keine Fotozellenbänke. Keine Fotodatenbanken – nun ja, der Tod durch langsames Grillen ist eine der unangenehmeren Methoden.
Donovan rieb sich wild seinen roten Haarschopf und drückte seine Bitterkeit aus.
„Wir werden das Gespött des Systems sein, Greg. Wie kann so schnell alles so schiefgegangen sein? Das großartige Team von Powell und Donovan wird nach Mercury geschickt, um über die Zweckmäßigkeit der Wiedereröffnung der Sunside Mining Station mit modernen Techniken zu berichten Roboter und wir machen am ersten Tag alles kaputt. Auch ein reiner Routinejob. Wir werden es nie ausleben.“
„Das müssen wir vielleicht nicht“, antwortete Powell ruhig. „Wenn wir nicht schnell etwas unternehmen, wird es für uns unmöglich sein, irgendetwas herunterzuleben – oder auch nur einfach nur zu leben.“
Die Eingabeaufforderung litt auch unter mangelnder Anpassungsfähigkeit . Eine gute Eingabeaufforderung sollte in der Lage sein, auf verschiedenen KI-Systemen genaue Ergebnisse zu liefern. Donovan sagt, dass er schnell einen Standardbefehl (prompt) gegeben hat, um das Selen zu besorgen.
Donovan: „Ich sagte... äh... ich sagte: ‚Schnell, wir brauchen etwas Selen. Du kannst es an dem und dem Ort bekommen. Hol es dir – das ist alles. Was wolltest du noch von mir sagen?‘ ?"
Powell: „Sie haben in der Anordnung keine Dringlichkeit angegeben, oder?“
Donovan: „Wozu? Es war reine Routine.“
Die falsche Annahme hier ist, dass eine einfache Anweisung/Aufforderung, Selen zu besorgen, die bei jedem anderen Roboter/jeder anderen KI gut funktionieren würde, bei Speedy genauso funktionieren würde, aber da wir wissen, dass Speedys „positronisches Gehirn“/neuronales Netz anders trainiert ist (3 (Gesetz der Selbsterhaltung wird gestärkt) Speedy ist keine Standard-KI. Daher hätte eine anpassungsfähigere Eingabeaufforderung/Bestellung verwendet werden sollen.
Die Prinzipien der Klarheit, des Kontexts und der Anpassungsfähigkeit der Eingabeaufforderungen an die KI, um genaue Ergebnisse zu erhalten, sind ein Kernkonzept des Prompt Engineering. Es gilt allgemein: Je aussagekräftiger und detaillierter die Eingabeaufforderung ist, desto besser sind die Ergebnisse. PromptingGuide.ai . In dieser Geschichte (erstmals 1942 geschrieben) zeigt Asimov ausführlich, wie die Nichtbeachtung dieser Regeln zu ungenauen Ergebnissen führen kann.
„Caves of Steel“ wurde erstmals 1954 veröffentlicht und ist der erste einer Reihe von Romanen, die im Roboteruniversum spielen und die Charaktere Detective Elijah Baley und Robot Daneel Olivaw vorstellen.
Die Geschichte spielt in einer fernen Zukunft. Die Bewohner der Erde leben in großen Kuppelstädten und hegen einen tiefen Groll gegen die Spacer, eine Gruppe von Menschen, die andere Planeten kolonisiert und sich fortschrittliche Technologie und Robotik zu eigen gemacht haben. Asimov nutzt die Buddy-Cop-Erzählung, um Themen wie Vorurteile, KI, Technologie und Zusammenarbeit zu untersuchen. Die Partnerschaft zwischen Baley und Daneel bildet den Grundstein für Asimovs Robot Series, die sich weiterhin mit der dynamischen Beziehung zwischen Menschen und Robotern/KI sowie den Herausforderungen befasst, denen sie bei der Koexistenz gegenüberstehen.
In den Kapiteln „Words From An Expert / Shift To The Machine“ gibt es eine kurze, aber sehr kluge Szene, die zeigt, dass Asimov bereits 1954 vorhersagte, dass es einen Bedarf geben würde, die Wirksamkeit von KI zu bewerten, und dass die Bewertung sehr invasiv sein könnte Es gäbe auch eine Methode zur einfacheren Auswertung, um den Zustand und die Genauigkeit eines Modells schnell zu überprüfen.
In der fraglichen Szene geht es um einen Erdrobotiker (Dr. Gerrigel), der von Baley gebeten wurde, eine Bewertung des Roboters Daneel Olivaw vorzunehmen, um zu überprüfen, ob das 1. Gesetz korrekt installiert wurde (im Grunde ein genaues Modell).
Dr. Gerrigel : Mein lieber Mr. Baley, ich brauche kein Labor.
Baley : Warum nicht?
Dr. Gerrigel : Es ist nicht schwer, das Erste Gesetz zu testen. ... es ist ganz einfach.
Baley : Würden Sie erklären, was Sie meinen? Wollen Sie damit sagen, dass Sie ihn hier testen können?
Dr. Gerrigel : „Ja, natürlich. Schauen Sie, Mr. Baley, ich gebe Ihnen eine Analogie. Wenn ich Doktor der Medizin wäre und den Blutzucker eines Patienten testen müsste, bräuchte ich ein chemisches Labor. Wenn ich seinen Grundumsatz messen, seine kortikale Funktion testen oder seine Gene überprüfen müsste, um eine angeborene Fehlfunktion festzustellen, bräuchte ich eine aufwendige Ausrüstung. Andererseits konnte ich feststellen, ob er blind war, indem ich einfach mit meiner Hand vor seine Augen fuhr, und ich konnte testen, ob er tot war, indem ich einfach seinen Puls fühlte. „Was ich damit sagen will, ist, dass die erforderliche Ausrüstung umso einfacher ist, je wichtiger und grundlegender die zu prüfende Eigenschaft ist. Bei einem Roboter ist es dasselbe. Das erste Gesetz ist grundlegend. Es betrifft alles. Wenn es nicht vorhanden wäre, könnte der Roboter auf zwei Dutzend offensichtliche Arten nicht richtig reagieren.“
Die Beschreibung der tatsächlichen Bewertung, die Dr. Gerrigel an Daneel durchführt, lautet wie folgt:
Was folgte, verwirrte und enttäuschte ihn.
Dr. Gerrigel fuhr fort, Fragen zu stellen und Handlungen auszuführen, die bedeutungslos schienen, unterbrochen durch Verweise auf seinen dreifachen Rechenschieber und gelegentlich auf den Betrachter.
Einmal fragte er: „Wenn ich zwei Cousinen habe, deren Alter fünf Jahre auseinander liegt, und die jüngere ein Mädchen ist, welches Geschlecht hat dann die ältere?“
Daneel antwortete (unweigerlich, dachte Baley): „Aufgrund der gegebenen Informationen lässt sich das nicht sagen.“
Worauf Dr. Gerrigel außer einem Blick auf seine Stoppuhr nur reagierte, indem er seine rechte Hand so weit wie möglich zur Seite ausstreckte und sagte: „Würden Sie die Spitze meines Mittelfingers mit der Spitze des dritten Fingers berühren?“ deiner linken Hand?“
Daneel hat das schnell und problemlos erledigt.
In fünfzehn Minuten, nicht länger, war Dr. Gerrigel fertig.
Dies ist modernen Ansätzen zur Bewertung großer Sprachmodelle (LLMs) nicht unähnlich. LLMs können mit einem umfassenderen Ansatz evaluiert werden, der die Integration in andere Apps und Prozesse beinhaltet, der sogenannten extrinsischen Evaluierung, und einem introspektiveren, aber schnelleren Ansatz, der die direkte Evaluierung des KI-LLM beinhaltet, der sogenannten intrinsischen Evaluierung . Die Bewertung eines Modells erfolgt mit Maßen wie Perplexität und Entropie unter Verwendung mathematischer Formeln für den Datensatz.
Wenn Dr. Gerrigel Daneel beurteilt, führt er eine Reihe von Tests durch, um die physikalischen und funktionellen Eigenschaften des Roboters zu beurteilen, um festzustellen, ob es sich tatsächlich um einen Roboter handelt und um zu verstehen, ob er ordnungsgemäß nach dem 1. Gesetz installiert wurde. In ähnlicher Weise umfasst die intrinsische Bewertung eines großen Sprachmodells die Analyse seines Innenlebens und seiner Leistung bei bestimmten Aufgaben, um zu verstehen, wie gut es Sprachmuster, Beziehungen und Wissen aus den Trainingsdaten gelernt hat.
Dazu gehört oft auch die Messung seiner Leistung bei verschiedenen sprachlichen Aufgaben, etwa beim Vorhersagen des nächsten Wortes in einem Satz, beim Beantworten von Fragen oder beim Zusammenfassen von Text. Forscher können auch die internen Darstellungen des Modells analysieren, indem sie beispielsweise die erlernten Einbettungen oder Aufmerksamkeitsmechanismen untersuchen, um Einblicke in das sprachliche Wissen zu gewinnen, das es während des Trainings erworben hat. Diese Bewertungen helfen dabei, die Stärken und Schwächen des Modells sowie seine Fähigkeit zu ermitteln, menschenähnliche Sprache zu verstehen und zu generieren.
In beiden Fällen zielen die Auswertungen darauf ab, die Fähigkeiten des Subjekts (Daneel oder ein großes Sprachmodell) zu bewerten und Einblicke in die zugrunde liegenden Mechanismen zu gewinnen.
Auch wenn Asimov nicht viel über die Details seiner Methode der „intrinsischen Bewertung“ von Dr. Gerrigel von Daneel aufbaut, ist es erstaunlich, dass Asimov bereits vor 70 Jahren voraussagte, dass diese Art der Bewertung von KI verwendet werden würde.
Dies sind nur einige Beispiele dafür, wie Isaac Asimov sich intensiv mit der komplexen Beziehung zwischen KI und Mensch befasste und die Bedeutung zeitnaher Technik für die Erzielung qualitativ hochwertigerer Reaktionen von KI und Robotern vorhersah. Asimovs Robot Series stellt spekulative Science-Fiction dar, die aufgrund des weit verbreiteten Erfolgs großer Sprachmodelle und KI immer relevanter geworden ist. Dieses bahnbrechende Werk bietet wertvollen historischen Kontext und Einblicke für Datenwissenschaftler und Ingenieure des maschinellen Lernens und wirft Licht auf die Ursprünge vieler zeitgenössischer Ideen und Inspirationen auf diesem Gebiet.
Prompt Engineering-Konzepte und Anwendungsfälle
Am wenigsten bis am meisten Aufforderung
Bewertung von Sprachmodellen in NLP
Auswahl der richtigen Eingabeaufforderungstypen