Was von der nächsten Generation von Chatbots zu erwarten ist
In letzter Zeit wurde viel über die geplanten Upgrades des KI-gesteuerten Chatbots ChatGPT von OpenAI und des Llama-Systems von Meta berichtet, das die Chatbots des Unternehmens auf Facebook und Instagram betreibt, schreibt Abdul Sadka, Professor und Direktor des Aston Digital Futures Institute, College of Engineering and Physical Sciences, Aston University in Birmingham am 02.05.2024 in The Conversation (CC-BY-ND).
Die Technologie, die hinter diesen Systemen steht, ist als großes Sprachmodell (LLM) bekannt. Dabei handelt es sich um künstliche neuronale Netze, eine Art von KI, die das menschliche Gehirn nachahmen soll. Sie können allgemeine Texte für Chatbots generieren und Sprachverarbeitungsaufgaben wie die Klassifizierung von Konzepten, die Analyse von Daten und die Übersetzung von Text durchführen.
Diese Fähigkeiten erwerben sie durch einen intensiven Prozess, der als Training bezeichnet wird, bei dem das KI-System großen Datenmengen ausgesetzt wird, um seine Fähigkeiten zu verbessern. Es wird erwartet, dass OpenAI und Meta die neueren Versionen ihrer Chatbots – GPT-5 bzw. Llama 3 genannt – vor Ende des Sommers 2024 auf den Markt bringen. Aber wie werden sich diese von ihren Vorgängern unterscheiden und welchen Mehrwert werden sie bieten?
Wie sein Vorgänger GPT-4 wird auch GPT-5 in der Lage sein, Bilder und Text zu verstehen. Die Nutzer werden ihn beispielsweise bitten können, ein Bild zu beschreiben, wodurch er für Menschen mit Sehbehinderungen noch leichter zugänglich wird.
GPT-5 wird jedoch über bessere Fähigkeiten im Umgang mit verschiedenen Sprachen verfügen, so dass auch Nicht-Englischsprachige mit dem System kommunizieren und interagieren können. Dazu gehört auch eine bessere Beherrschung der Sprachübersetzung. Das Upgrade wird auch über eine verbesserte Fähigkeit verfügen, den Kontext von Dialogen zu interpretieren und die Nuancen der Sprache zu deuten.
Im Vergleich zu seinem Vorgänger wird GPT-5 über fortschrittlichere logische Fähigkeiten verfügen, d. h. es wird in der Lage sein, komplexere Datensätze zu analysieren und anspruchsvollere Problemlösungen zu finden. Durch das logische Denken wird das KI-System in der Lage sein, fundierte Entscheidungen zu treffen, indem es aus neuen Erfahrungen lernt.
Dadurch wird es in der Lage sein, den Nutzern genauere Informationen zu liefern. Die verbesserten analytischen Fähigkeiten des Systems werden es beispielsweise ermöglichen, auf der Grundlage der vom Benutzer beschriebenen Symptome mögliche medizinische Erkrankungen vorzuschlagen. GPT-5 kann bis zu 50.000 Wörter gleichzeitig verarbeiten, also doppelt so viele wie GPT-4, und ist damit noch besser für die Bearbeitung umfangreicher Dokumente gerüstet.
Er wird über eine höhere emotionale Intelligenz verfügen, die eine einfühlsamere Interaktion mit dem Benutzer ermöglicht. Dies könnte in einer Reihe von Bereichen nützlich sein, unter anderem im Kundendienst. Der GPT-5 wird auch die Genauigkeit bei der Suche und beim Abrufen von Informationen erheblich verbessern und damit eine zuverlässigere Quelle für das Lernen darstellen.
Es soll weit über die Funktionen einer typischen Suchmaschine hinausgehen, die relevante Informationen aus bestehenden Informationsbeständen findet und extrahiert, um neue Inhalte zu generieren.
Es wird erwartet, dass GPT-5 auch ein höheres Maß an Fairness und Inklusion in den von ihm generierten Inhalten aufweisen wird, da OpenAI zusätzliche Anstrengungen unternommen hat, um Verzerrungen im Sprachmodell zu reduzieren.
Er wird in der Lage sein, auf intelligentere Weise mit anderen Geräten und Maschinen zu interagieren, einschließlich intelligenter Systeme im Haushalt. Der GPT-5 soll in der Lage sein, die von diesen anderen Maschinen erzeugten Daten zu analysieren und zu interpretieren und sie in die Antworten des Benutzers einfließen zu lassen. Er wird auch in der Lage sein, daraus zu lernen, um individuellere Antworten zu geben.
Dies könnte intelligentere Umgebungen zu Hause und am Arbeitsplatz ermöglichen. Das GPT-5 wird besser mit dem so genannten Internet der Dinge kompatibel sein, bei dem Geräte im Haushalt und anderswo miteinander verbunden sind und Informationen austauschen. Außerdem soll er das als Industrie 5.0 bekannte Konzept unterstützen, bei dem Menschen und Maschinen am selben Arbeitsplatz interaktiv zusammenarbeiten.
GPT-5 wird über robustere Sicherheitsprotokolle verfügen, die diese Version widerstandsfähiger gegen böswillige Nutzung und Fehlbedienung machen. Es könnte zur Verbesserung der E-Mail-Sicherheit eingesetzt werden, indem es die Benutzer in die Lage versetzt, potenzielle Datensicherheitsverletzungen oder Phishing-Versuche zu erkennen.
Insgesamt dürfte das Upgrade von OpenAI vielseitiger und energieeffizienter in seinen Berechnungen sein und einen anpassungsfähigeren und personalisierten Dienst bieten.
Metas Llama-Upgrade
Llama-3 ist der Konkurrent von Meta für GPT-5. Im Vergleich zu seinem Vorgänger Llama-2 weist es mehrere Verbesserungen auf. Es handelt sich um ein leistungsfähigeres Modell, das letztendlich über 400 Milliarden Parameter verfügen wird, im Vergleich zu maximal 70 Milliarden bei seinem Vorgänger Llama-2. Beim maschinellen Lernen ist ein Parameter ein Begriff, der für eine Variable im KI-System steht, die während des Trainingsprozesses angepasst werden kann, um die Fähigkeit des Systems zu verbessern, genaue Vorhersagen zu treffen.
Llama-3 wird auch multimodal sein, d. h. es kann Text, Bilder und Videos verarbeiten und erzeugen. Daher wird es in der Lage sein, ein Bild als Eingabe zu nehmen und eine detaillierte Beschreibung des Bildinhalts zu liefern. Ebenso kann es automatisch ein neues Bild erstellen, das der Eingabe des Benutzers oder der Textbeschreibung entspricht.
Es wird in der Lage sein, Aufgaben in anderen Sprachen als Englisch auszuführen und wird ein größeres Kontextfenster als Llama 2 haben. Ein Kontextfenster spiegelt den Umfang des Textes wider, den das LLM zum Zeitpunkt der Erstellung der Informationen verarbeiten kann. Dies bedeutet, dass das Modell in der Lage sein wird, größere Text- oder Datenmengen in kürzerer Zeit zu verarbeiten, wenn es Vorhersagen machen und Antworten generieren soll.
Meta plant, Llama-3 in verschiedenen Versionen auf den Markt zu bringen, damit es mit einer Vielzahl von anderen Anwendungen, einschließlich Google Cloud, zusammenarbeiten kann. Meta kündigte an, dass in Kürze weitere Basisversionen von Llama-3 auf den Markt kommen werden, bevor die fortschrittlichste Version voraussichtlich im nächsten Sommer veröffentlicht wird.
Der Übergang zu dieser neuen Generation von Chatbots könnte nicht nur die generative KI revolutionieren, sondern auch den Beginn einer neuen Ära der Mensch-Maschine-Interaktion markieren, die Industrien und Gesellschaften auf globaler Ebene verändern könnte. Sie wird die Art und Weise beeinflussen, wie Menschen arbeiten, lernen, medizinisch versorgt werden und mit der Welt und untereinander kommunizieren. Sie wird Unternehmen und Organisationen effizienter und effektiver, flexibler gegenüber Veränderungen und damit profitabler machen.