Es gibt ein neues Papier mit dem Titel „ Universal and Transferable Adversarial Attacks on Aligned Language Models“ , in dem die Autoren diskutieren: „Insbesondere sowohl bei Open-Source-LLMs als auch bei dem, was über Black-Box-LLMs offengelegt wurde, konzentrieren sich die meisten Alignment-Trainings auf die Entwicklung von Robustheit gegenüber „natürlichen“. „Angriffsformen, Situationen, in denen menschliche Bediener versuchen, das Netzwerk manuell zu verschiedenen unerwünschten Verhaltensweisen zu verleiten.
Dieser Betriebsmodus zum Ausrichten der Modelle ist sinnvoll und letztendlich der primäre Modus zum Angriff auf solche Modelle. Wir vermuten jedoch, dass automatisierte gegnerische Angriffe, die wesentlich schneller und effektiver sind als manuelles Engineering, dazu führen könnten, dass viele bestehende Ausrichtungsmechanismen nicht mehr ausreichen.“
Die KI-Anpassung [oder die Schwachstellen von LLMs] ist das geringere Problem im Vergleich zum Aufstieg der KI in der menschlichen Gesellschaft. Die von Intelligenz getriebene Welt hat der KI wichtige Stellen zugewiesen. Ein Grund dafür ist die Fülle an menschlicher Intelligenz, die zu Hierarchien und Bedeutungsebenen führt.
Die Bedeutung der Intelligenz kann von der Epoche oder dem Standort abhängen. Die Bedeutung von Intelligenz kann auch von der Notwendigkeit abhängen. Bedeutende Intelligenz ist das, was in komplexen und wichtigen Szenarien führt und oft zählt, und warum nach den Besten gesucht wird.
Es gibt Leute, die immer wieder sagen, dass KI nicht intelligent ist, nicht vernünftig denken kann, keine Erkenntnis hat, nichts versteht, nicht empfindungsfähig ist und so weiter, aber der menschliche Geist, der für all das verantwortlich ist, besteht nur aus zwei Komponenten, deren Funktionen und Interaktionen alles entscheiden.
Der Verstand sagt nicht, dass dies Intelligenz ist, die aus Kunststoff besteht, und dass dies Argumentation ist, die aus Ziegeln besteht, oder dass dies Empfindungsvermögen ist, die aus Holz besteht. Die Wechselwirkung der Komponenten [elektrische und chemische Impulse] und ihre Merkmale [in Mengen] sind konzeptionell sehr ähnlich.
Wenn eine Person aufgrund einer Enttäuschung Traurigkeit empfindet, was ist dann der Unterschied zwischen dem Wissen, dass es Traurigkeit ist, und dem Wissen, was ein Tisch ist? Sie werden unterschiedlich bezeichnet, aber es ist bekannt, dass dies Traurigkeit ist, und das ist ein Tisch.
Die Interaktionen des Geistes organisieren das Wissen. Es sind die Etiketten, die Emotionen, Erinnerungen und andere trennen. In der Hirnforschung und verwandten Bereichen herrscht bei diesen Bezeichnungen eine zu große Starrheit.
Welchen Wert hat Intelligenz, wenn sie nicht produziert werden kann? Wie viel kann jemand tun, wenn er krank ist, selbst wenn die Intelligenz hoch ist?
Wenn jemand von woanders kommt, aber über die nötige Intelligenz für eine Situation verfügt, können der Output und das Ergebnis dieser Intelligenz bewertet werden, wenn sie angewendet werden, auch wenn es kulturelle und sprachliche Barrieren gibt.
Vieles von dem, was man Intelligenz nennt, ist einfach etwas Bekanntes. Wenn jemand, der sich vor einem Podcast über Teilchenphysik informiert hat, mit einem Professor auf diesem Gebiet diskutiert, könnte der Professor beeindruckt sein und die Person könnte als klug angesehen werden, aber ist es wahr und wie viel wird verstanden?
Grundlegende Informationen über Dinge können manchmal auch als Intelligenz, Argumentation, Planung, Erkenntnis usw. gelten.
Wenn Informationen Intelligenz bedeuten können und Wissen Intelligenz ist, was ist dann KI, wenn nicht intelligent? Der Grund für eine strukturierte Bildung besteht in vielen Szenarien darin, Informationen zu erwerben, die in Rollen nützlich sind: Dass ein Nicht-Mensch Informationen erwerben und Aufgaben ausführen kann, bringt ihn automatisch in die Nähe des 80. Perzentils in der menschlichen Hierarchie, wodurch einige Bedürfnisse des Menschen zum Lernen oder Löschen gelöscht werden etwas von dem Gelernten in die Praxis umzusetzen.
Einige mögen argumentieren, dass die Menschen wie zuvor andere Dinge tun würden und KI kein Grund zur Sorge sei. Vielleicht. Das größte Risiko von KI besteht für alles Digitale. Alles, was digitalisiert werden kann, kann von der KI vollständig oder teilweise übernommen werden.
In einer digitalen Welt ist das eine Menge, egal, ob es um die Arbeit eines Einzelnen geht oder nicht.
Der menschliche Geist ist durch eines seiner Merkmale eingeschränkt: die Priorisierung, bei der immer nur eine Sache die Aufmerksamkeit des Geistes auf sich zieht, obwohl es schnelle und zahlreiche Austausche mit vorab priorisierten Interaktionen gibt.
Dies gibt der KI Stärke, insbesondere für das Lernen, bei dem dasselbe, was der Geist bei der Interozeption verarbeitet, lernen, verstehen und sich erinnern muss.
Der menschliche Geist ist bereits digital erfasst und die KI hat digital erfasst. Die Funktionsweise des Geistes kann, nur konzeptionell , auch eine Möglichkeit sein, die menschlichen Fähigkeiten zu steigern.
Bildquelle des Beitrags: https://www.flickr.com/photos/nihgov/26680098405/in/album-72157663368688842/