Wie Auto
AKTUALISIERT 19:55 EDT / 06. JUNI 2023
von Kyt Dotson
Chatbots mit künstlicher Intelligenz wie ChatGPT von OpenAI LP erfreuen sich in letzter Zeit großer Beliebtheit, nicht nur wegen ihrer Fähigkeit, menschenähnliche Gespräche zu führen, sondern auch, weil sie Wissensaufgaben wie Recherche, Suche und Inhaltsgenerierung ausführen können.
Jetzt gibt es einen neuen Konkurrenten, der die sozialen Medien im Sturm erobert und die Möglichkeiten des OpenAI-Angebots erweitert, indem er seine Fähigkeiten noch weiter automatisiert: Auto-GPT. Es ist Teil einer neuen Klasse von KI-Tools namens „autonome KI-Agenten“, die die Leistung von GPT-3.5 und GPT-4, den generativen KI-Technologien hinter ChatGPT, nutzen, um eine Aufgabe anzugehen, auf ihrem eigenen Wissen aufzubauen und Apps zu verbinden Dienste zur Automatisierung von Aufgaben und zur Durchführung von Aktionen im Namen der Benutzer.
ChatGPT mag für Benutzer magisch erscheinen, da es in der Lage ist, Fragen zu beantworten und Inhalte basierend auf Benutzereingaben zu erstellen, beispielsweise große Dokumente zusammenzufassen, Gedichte und Geschichten zu erstellen oder Computercode zu schreiben. Die Möglichkeiten sind jedoch begrenzt, da jeweils nur eine Aufgabe ausgeführt werden kann. Während einer Sitzung mit ChatGPT kann ein Benutzer die KI jeweils nur mit einer Frage auffordern, und die Verfeinerung dieser Aufforderungen oder Fragen kann eine langsame und mühsame Angelegenheit sein.
Auto-GPT, entwickelt vom Spieleentwickler Toran Bruce Richards, beseitigt diese Einschränkungen, indem es Benutzern ermöglicht, der KI ein Ziel und eine Reihe von Zielen vorzugeben, die es zu erreichen gilt. Dann erzeugt es einen Bot, der sich wie eine Person verhält und das GPT-Modell von OpenAI verwendet, um KI-Eingabeaufforderungen auszuführen, um dieses Ziel zu erreichen. Dabei lernt es, seine Eingabeaufforderungen und Fragen zu verfeinern, um mit jeder Iteration bessere Ergebnisse zu erzielen.
Es verfügt außerdem über eine Internetverbindung, um zusätzliche Informationen aus Suchanfragen zu sammeln. Darüber hinaus verfügt es über ein Kurz- und Langzeitgedächtnis durch Datenbankanbindungen, um den Überblick über Teilaufgaben zu behalten. Und es verwendet GPT-4, um bei Bedarf Inhalte wie Text oder Code zu erstellen. Auto-GPT ist auch in der Lage, sich selbst herauszufordern, wenn eine Aufgabe unvollständig ist, und die Lücken zu schließen, indem es seine eigenen Eingabeaufforderungen ändert, um bessere Ergebnisse zu erzielen.
Laut Richards sind aktuelle KI-Chatbots zwar äußerst leistungsfähig, ihre Unfähigkeit, ihre eigenen Eingabeaufforderungen im Handumdrehen zu verfeinern und Aufgaben zu automatisieren, stellt jedoch einen Engpass dar. „Diese Inspiration veranlasste mich, Auto-GPT zu entwickeln, das die Argumentation von GPT-4 auf umfassendere, komplexere Probleme anwenden kann, die eine langfristige Planung und mehrere Schritte erfordern“, sagte er gegenüber Vice.
Auto-GPT ist als Open Source auf GitHub verfügbar. Für den Zugriff auf GPT-4 ist ein Anwendungsprogrammierschnittstellenschlüssel von OpenAI erforderlich. Und um es nutzen zu können, müssen Benutzer Python und eine Entwicklungsumgebung wie Docker oder VS Code mit einer Dev Container-Erweiterung installieren. Daher ist möglicherweise ein wenig technisches Know-how erforderlich, um loszulegen, obwohl eine umfangreiche Dokumentation zur Einrichtung vorhanden ist.
In einer Textoberfläche fordert Auto-GPT den Benutzer auf, der KI einen Namen, eine Rolle, ein Ziel und bis zu fünf Ziele zu geben, die sie erreichen soll. Jeder dieser Punkte definiert, wie die KI-Agenten die vom Benutzer gewünschte Aktion angehen und wie sie das Endprodukt liefern.
Zunächst legt der Benutzer einen Namen für die KI fest, beispielsweise „RestaurantMappingApp-GPT“, und legt dann eine Rolle fest, beispielsweise „Entwickeln Sie eine Web-App, die interaktive Karten für Restaurants in der Nähe bereitstellt.“ Der Benutzer kann dann eine Reihe von Zielen festlegen, beispielsweise „Ein Backend in Python schreiben“ und „Ein Frontend in HTML programmieren“ oder „Links zu Menüs anbieten, falls verfügbar“ und „Link zu Bereitstellungs-Apps“.
Sobald der Benutzer die Eingabetaste drückt, beginnt Auto-GPT mit dem Starten von Agenten, die Eingabeaufforderungen für GPT-4 erstellen und sich dann der ursprünglichen Rolle und den einzelnen Zielen nähern. Schließlich beginnt es mit der Verfeinerung und Rekursion durch die verschiedenen Eingabeaufforderungen, die es ihm ermöglichen, mithilfe von Python oder JavaScript eine Verbindung zu Google Maps herzustellen.
Dazu wird die Gesamtaufgabe in kleinere Aufgaben aufgeteilt, an denen jeweils gearbeitet wird, und es wird ein primärer Überwachungs-KI-Bot verwendet, der als „Manager“ fungiert, um sicherzustellen, dass sie koordiniert werden. Diese spezielle Eingabeaufforderung fordert den Bot dazu auf, eine etwas komplexe App zu erstellen, die schief gehen könnte, wenn sie nicht den Überblick über eine Reihe unterschiedlicher beweglicher Teile behält, sodass möglicherweise viele Schritte erforderlich sind, um dorthin zu gelangen.
Bei jedem Schritt „erzählt“ jede KI-Instanz, was sie tut, und kritisiert sich sogar selbst, um ihre Aufforderungen entsprechend ihrer Herangehensweise an das vorgegebene Ziel zu verfeinern. Sobald ein bestimmtes Ziel erreicht ist, schließt jede Instanz ihren Prozess ab und gibt ihre Antwort an die Hauptverwaltungsaufgabe zurück.
Der Versuch, ChatGPT oder sogar das fortgeschrittenere, abonnementbasierte GPT-4 dazu zu bringen, dies ohne Aufsicht zu tun, würde eine große Anzahl manueller Schritte erfordern, die von einem Menschen erledigt werden müssten. Auto-GPT erledigt sie selbstständig.
Die Funktionen von Auto-GPT sind für unerfahrene Entwickler von Vorteil, die im Spiel vorankommen möchten, sagte Brandon Jung, Vizepräsident des Ökosystems beim Anbieter von KI-Code-Vervollständigungstools Tabnine Ltd., gegenüber SiliconANGLE.
„Ein Vorteil besteht darin, dass es eine gute Einführung für diejenigen ist, die mit dem Programmieren noch nicht vertraut sind, und dass es ein schnelles Prototyping ermöglicht“, sagte Jung. „Für Anwendungsfälle, die keine Genauigkeit erfordern oder Sicherheitsbedenken haben, könnte es den Erstellungsprozess beschleunigen, ohne Teil eines umfassenderen Systems sein zu müssen, das einen Experten zur Überprüfung einbezieht.“
Die Möglichkeit, aus einer einfachen Reihe von Textaufforderungen schnell Apps zu erstellen, einschließlich des gesamten Codes auf einmal, würde den Entwicklern viele neue Vorlagen für Code in die Hände bringen. Im Wesentlichen bieten wir ihnen schnelle Lösungen und Grundlagen, auf denen sie aufbauen können. Allerdings müssten sie zunächst eine gründliche Prüfung durchlaufen, bevor sie in Produktion gehen.
Das ist nur ein Beispiel für die Fähigkeiten von Auto-GPT. Mit seinen Fähigkeiten verfügt es über weitreichende Möglichkeiten, die derzeit von Entwicklern, Projektmanagern, KI-Forschern und allen anderen, die seinen Quellcode herunterladen können, erkundet werden.
„Es gibt zahlreiche Beispiele von Menschen, die Auto-GPT nutzen, um Marktforschung zu betreiben, Geschäftspläne zu erstellen, Apps zu erstellen, komplexe Aufgaben zu automatisieren, um ein Ziel zu erreichen, wie zum Beispiel eine Mahlzeit zu planen, Rezepte zu identifizieren und alle Zutaten zu bestellen, und sogar Transaktionen auszuführen.“ im Namen des Benutzers“, sagte Sheldon Monteiro, Chief Product Officer beim Unternehmen für digitale Geschäftstransformation Publicis Sapient, gegenüber SiliconANGLE.
Mit seiner Fähigkeit, das Internet zu durchsuchen, kann Auto-GPT mit einer schnellen Marktrecherche beauftragt werden, wie zum Beispiel „Suchen Sie mir fünf Gaming-Tastaturen unter 200 US-Dollar und listen Sie deren Vor- und Nachteile auf.“ Mit ihrer Fähigkeit, eine Aufgabe in mehrere Unteraufgaben aufzuteilen, könnte die autonome KI dann schnell mehrere Bewertungsseiten durchsuchen, einen Marktforschungsbericht erstellen und mit einer Liste von Gaming-Tastaturen zurückkommen, die unter diese Menge fallen, sowie deren Preise angeben Informationen über sie.
Ein Twitter-Nutzer namens MOE hat einen Auto-GPT-Bot namens „Isabella“ erstellt, der Marktdaten autonom analysieren und an andere KIs auslagern kann. Dies geschieht durch den Einsatz des KI-Frameworks Lang-Chain, um autonom Daten zu sammeln und Stimmungsanalysen auf verschiedenen Märkten durchzuführen.
autogpt hat versucht, eine App für mich zu erstellen, hat festgestellt, dass ich Node nicht habe, hat gegoogelt, wie man Node installiert, einen Stackoverflow-Artikel mit Link gefunden, ihn heruntergeladen, extrahiert und dann den Server für mich erstellt.
Mein Beitrag? Ich beobachtete. pic.twitter.com/2QthbTzTGP
– Varun Mayya (@VarunMayya) 6. April 2023
Da Auto-GPT Zugriff auf das Internet hat und im Namen des Benutzers Aktionen ausführen kann, kann es auch Anwendungen installieren. Im Fall des Twitter-Benutzers Varun Mayya, der den Bot aufforderte, Software zu erstellen, stellte dieser fest, dass er Node.js nicht installiert hatte – eine Umgebung, die es ermöglicht, JavaScript lokal statt in einem Webbrowser auszuführen. Daraufhin durchsuchte es das Internet, entdeckte ein StackOverflow-Tutorial und installierte es für ihn, damit er mit der Erstellung der App fortfahren konnte.
Auto-GPT ist nicht die einzige derzeit verfügbare autonome Agenten-KI. Ein weiterer Trend, der in Mode gekommen ist, ist BabyAGI, das von Yohei Nakajima, einem Risikokapitalgeber und Forscher für künstliche Intelligenz, entwickelt wurde. AGI bezieht sich auf „künstliche allgemeine Intelligenz“, eine hypothetische Art von KI, die in der Lage wäre, jede intellektuelle Aufgabe auszuführen – aber keine bestehende KI ist auch nur annähernd in der Lage. BabyAGI ist ein Python-basiertes Aufgabenverwaltungssystem, das die OpenAI-API wie Auto-GPT verwendet, das neue Aufgaben priorisiert und auf ein Ziel hin erstellt.
Es gibt auch AgentGPT und GodMode, die viel benutzerfreundlicher sind, da sie eine Weboberfläche verwenden und keine Installation auf einem Computer erfordern, sodass sie als Dienst aufgerufen werden können. Diese Dienste senken die Eintrittsbarriere, indem sie den Benutzern die Nutzung erleichtern, da sie keine technischen Kenntnisse erfordern und ähnliche Aufgaben wie Auto-GPT ausführen, wie z. B. das Generieren von Code, das Beantworten von Fragen und das Durchführen von Recherchen. Sie können jedoch keine Dokumente auf den Computer schreiben oder Software installieren.
Allerdings hätten diese Tools auch Nachteile, warnte Monteiro. Die Beispiele im Internet sind sorgfältig ausgewählt und rücken die Technologie in ein leuchtendes Licht. Trotz aller Erfolge können bei der Verwendung viele Probleme auftreten.
„Es kann in Aufgabenschleifen stecken bleiben und durcheinander geraten“, sagte Monteiro. „Und diese Task-Schleifen können angesichts der Kosten für GPT-4-API-Aufrufe ziemlich teuer werden, und zwar sehr schnell. Selbst wenn es wie beabsichtigt funktioniert, kann es eine ziemlich lange Folge von Argumentationsschritten erfordern, von denen jeder teure GPT-4 verschlingt.“ Token.“
Der Zugriff auf GPT-4 kann Geld kosten, das je nach der Anzahl der verwendeten Token variiert. Tokens basieren auf Wörtern oder Phrasenteilen, die über den Chatbot gesendet werden. Die Gebühren reichen von drei Cent pro 1.000 Token für Eingabeaufforderungen bis zu sechs Cent pro 1.000 Token für Ergebnisse. Das bedeutet, dass die Verwendung von Auto-GPT, wenn ein komplexes Projekt ausgeführt wird oder unbeaufsichtigt in einer Schleife stecken bleibt, am Ende ein paar Dollar kosten kann.
Gleichzeitig kann GPT-4 anfällig für Fehler sein, sogenannte „Halluzinationen“, die zu Problemen während des Prozesses führen können. Es könnte zu völlig falschen oder fehlerhaften Aktionen kommen oder, schlimmer noch, unsicheren oder katastrophal schlechten Code erzeugen, wenn er aufgefordert wird, eine Anwendung zu erstellen.
„[Auto-GPT] hat die Fähigkeit, frühere Ausgaben auszuführen, selbst wenn etwas schiefgeht, läuft es weiter“, sagte Bern Elliot, ein angesehener Vice President Analyst bei Gartner. „Es braucht strenge Kontrollen, um zu verhindern, dass es aus den Fugen gerät und weitermacht. Ich gehe davon aus, dass Missbrauch ohne angemessene Leitplanken zu schädlichen, unerwarteten und unbeabsichtigten Folgen führen wird.“
Die Softwareentwicklungsseite könnte ebenso problematisch sein. Selbst wenn Auto-GPT keinen Fehler begeht, der dazu führt, dass fehlerhafter Code erzeugt wird, der einfach zum Ausfall der Software führen würde, könnte es zu einer Anwendung voller Sicherheitsprobleme kommen.
„Auto-GPT ist weder Teil eines vollständigen Softwareentwicklungslebenszyklus – Tests, Sicherheit usw. – noch ist es in eine IDE integriert“, sagte Jung und warnte vor den potenziellen Problemen, die durch den Missbrauch des Tools entstehen könnten. „Komplexität zu abstrahieren ist in Ordnung, wenn man auf einer soliden Grundlage aufbaut. Diese Tools erstellen jedoch per Definition keinen starken Code und fördern die Einführung von schlechtem und unsicherem Code in die Produktion.“
Tools wie Auto-GPT, BabyAGI, AgentGPT und GodMode sind noch experimentell, aber es gibt weitreichendere Auswirkungen darauf, wie sie Routineaufgaben wie Urlaubsplanung oder Einkaufen ersetzen könnten, erklärte Monteiro.
Derzeit hat Microsoft sogar einfache Beispiele für ein Plugin für Bing Chat entwickelt. Es ermöglicht Benutzern, es zu bitten, ihnen Abendessenvorschläge zu unterbreiten, wobei die KI – die auf GPT-4 basiert – eine Zutatenliste zusammenstellt und dann Instacart startet, um sie für die Lieferung vorzubereiten. Obwohl dies ein Schritt in Richtung Automatisierung ist, sind Bots wie Auto-GPT auf dem Weg zu einer potenziellen Zukunft völlig autonomen Verhaltens.
Ein Benutzer könnte Auto-GPT anfordern, um lokale Geschäfte zu durchsuchen, Zutatenlisten zu erstellen, Preise und Qualität zu vergleichen, einen Warenkorb einzurichten und sogar Bestellungen autonom abzuschließen. Zu diesem experimentellen Zeitpunkt sind viele Benutzer möglicherweise nicht bereit, dem Bot zu erlauben, ihre Kreditkarte vollständig zu verwenden und Bestellungen ganz alleine auszuliefern, aus Angst, dass er durchdrehen und ihnen mehrere hundert Basilikumsträuße schicken könnte.
Eine ähnliche Zukunft, in der eine KI dies für Reisebüros mithilfe von Auto-GPT übernimmt, ist möglicherweise nicht mehr weit entfernt. „Geben Sie Ihre Parameter an – Strand, maximal vier Stunden Reise, Hotelklasse – und Ihr Budget, und es übernimmt gerne das gesamte Surfen im Internet für Sie und vergleicht Optionen auf der Suche nach Ihrem Ziel“, sagte Monteiro. „Wenn es fertig ist, präsentiert es Ihnen seine Ergebnisse, und Sie können auch sehen, wie es dorthin gelangt ist.“
Wenn diese Tools ausgereifter werden, besteht eine echte Chance, den Menschen eine Möglichkeit zu bieten, alltägliche Schritt-für-Schritt-Aufgaben, die im Internet erledigt werden, zu automatisieren. Das könnte einige interessante Auswirkungen haben, insbesondere im E-Commerce.
„Wie werden sich Unternehmen darauf einstellen, wenn diese Agenten Websites durchsuchen und Ihr Produkt aus der Aufmerksamkeitsliste streichen, bevor ein Mensch die Marke überhaupt sieht?“ sagte Monteiro. „Aus E-Commerce-Sicht müssen Einzelhändler ihr Kundenerlebnis anpassen, wenn Menschen beginnen, Auto-GPT-Tools zum Online-Kauf von Waren und Dienstleistungen zu verwenden.“
DANKE
Wie Auto-GPT KI-Chatbots, wie wir sie kennen, revolutionieren wird
Die „Starlink“-Cloud-Strategie von Oracle wird interessant
Die Couchbase-Aktie fällt aufgrund größerer Verluste und schwacher Prognosen
Die Kraft von Superclouds: TheCUBEs Analyse von Ciscos Vision für eine einfachere, sicherere Zukunft
CrowdStrike fügt weitere Cybersicherheitsfunktionen zum Schutz von Cloud-Umgebungen hinzu
Cisco vereinfacht sein Produktportfolio mit der neuen Cisco Networking Cloud-Plattform
Wie Auto-GPT KI-Chatbots, wie wir sie kennen, revolutionieren wird
KI – VON KYT DOTSON. VOR 1 MIN
Die „Starlink“-Cloud-Strategie von Oracle wird interessant
BIG DATA – VOM GASTAUTOR. VOR 3 MINUTEN
Die Couchbase-Aktie fällt aufgrund größerer Verluste und schwacher Prognosen
BIG DATA – VON MIKE WEATLEY. VOR 24 MINUTEN
Die Kraft von Superclouds: TheCUBEs Analyse von Ciscos Vision für eine einfachere, sicherere Zukunft
KI – VON CHAD WILSON. VOR 2 STUNDEN
CrowdStrike fügt weitere Cybersicherheitsfunktionen zum Schutz von Cloud-Umgebungen hinzu
SICHERHEIT – VON MARIA DEUTSCHER. VOR 3 STUNDEN
Cisco vereinfacht sein Produktportfolio mit der neuen Cisco Networking Cloud-Plattform
CLOUD – VON MARIA DEUTSCHER. VOR 4 STUNDEN
„TheCUBE ist ein wichtiger Partner der Branche. Ihr seid wirklich ein Teil unserer Veranstaltungen und wir wissen es wirklich zu schätzen, dass ihr kommt, und ich weiß, dass die Leute auch die Inhalte schätzen, die ihr erstellt.“ – Andy Jassy DANKE