diconium Blog

Das Zeitalter der Agenten – warum in naher Zukunft jedes Angebot eine API braucht

Geschrieben von Alexander Käppler | 20.02.2025 07:33:35

Wenn man so den News rund um KI folgt, dann wird schnell klar: sie ist gekommen, um zu bleiben. Schaut man sich das aber etwas näher an, stellt man schnell fest, dass es sich im Grunde um das Abschalten eigenen Denkens handelt. Egal, welchem Blog oder Podcast ich folge, das Ergebnis ist (fast) immer das Gleiche. Alles wird einfacher und geht schneller. Stimmt so aber nur zu Teilen. Sicherlich, das Erstellen von Grafiken und Texten geht wirklich schneller und ist über dies auch noch inhaltlich wahrscheinlich umfassender, als wenn es per Hand erstellt worden wäre. Was mr fehlt ist jedoch die persönliche Note des Autors. Ich abonniere genau deswegen einen Newsletter, weil ich gerne auch die persönliche Sicht des Autors habe, nicht, weil es eine schnell zusammengeklöppelte Text-/ Bullet Point Liste mit News ist. Die finde ich auch wo anders.

Und dann wird jetzt schon (fast) überall der neue hot shit, die Agenten, beworben – nur was genau soll das denn sein?

Im Grunde geht es darum, einem „Agenten“ (oder persönlicher Full-Time Assistent) eine Aufgabe zu geben, die dieser dann selbständig abarbeitet. Quasi egal, alles, was man online machen kann, kann der Agent auch für mich machen. Von Terminbuchungen bis zum Einkauf, einfach alles. Das finde ich vom Gedanken her auch ok, setzt jedoch einiges voraus. Und darum soll es hier im Wesentlichen gehen.

API First – Application Programming Interfaces sind der Key-to-Success Faktor

Jedes Unternehmen, welches in der Zukunft noch mitspielen möchte, muss zwingend eine API anbieten, über welche sowohl Inhalte abgerufen wie auch Interaktionen ermöglicht werden können. Das bedeutet, dass jedes Unternehmen, welches online etwas verkaufen oder buchbar machen will, zwingend über eine API verfügen muss, damit die Agenten diese auch nutzen können.

Ich denke, das reine Interagieren im Sinne von Konversation, wird nicht ausreichen für das Zeitalter der Agenten. Nur das Finden von Inhalten (Bilder, Produkte, Veranstaltungen etc.) wird nicht ausreichen. Produkte und Events, Urlaube oder Dienstleistungen müssen auch per Agent kaufbar sein. Und das wird nur funktionieren, wenn ein Interface für diese Agenten bereitsteht. Im heutigen Kontext bedeutet das, jedes online anbietende und verkaufende Unternehmen benötigt eine API, über welche sowohl das Angebot offeriert und gekauft werden kann.

Diese API wird in Zukunft ein neuer Unterpunkt in jeder Hauptnavigation werden, ob im Header oder Footer ist egal, aber er wird von der Bedeutung direkt unter „Rechtliches“ oder „Impressum“ zu finden sein, um jeden Nutzer und jeden Agenten direkt auf die API-Spezifikation zu leiten.

Diese API wird neben ihrer Wichtigkeit auch noch auf eine Art „default“ zu finden sein. So wird sich der Standard schaffen, dass Unternehmen ihre API unter api.domain.TLD anbieten werden und da dann sowohl die Spezifikation wie auch die Nutzung.

 

Sicherheit als Herausforderung

hat man jetzt so eine API erschaffen, über welche das Angebot abgerufen werden kann, ob als Liste oder im Konversations-Stil sei erst einmal egal, so kommt der Agent zu guter Letzt an den Punkt der Bestellung. Und hier stellt sich dann die Frage nach der Sicherheit. Reicht es aus, der API ein Zahlungsmittel zu kommunizieren - im Sinn einer Kreditkarte, inklusive CCV-Nummer? Oder braucht man einen Login und damit einen Kundenaccount? Wie sehr vertrauen wir dann bei kleineren Anbietern darauf, dass unsere Daten sicher sind?

Wenn man einen Account braucht, wird es sicherlich bald schwierig werden, alle seine Zugangsdaten zu verwalten. Oder sollte man ggf. gleich den Agenten mit seinem Passwort-Manager verbinden? Das würde voraussetzen, dass dieser ebenfalls über eine API verfügt, damit der Agent zur richtigen Zeit auf Passwörter und Kreditkarten-Informationen zugreifen kann.

Das sind aus meiner Sicht die beiden wichtigsten Voraussetzungen, über die man nachdenken muss, sowohl als Anbieter wie auch als User bzw. Nutzer von Agenten.

Um das Zeitalter der Agenten einzuleiten, kann ich mir die folgenden Schritte vorstellen

Phase 1 (heute bzw. nahe Zukunft): Anbieter suchen und API als Kontext für die KI bereitstellen

Derzeit sind die KIs relativ gut trainiert, die richtige Kettung von Begriffen im Sinne der menschlichen Sprache auszugeben. Ihr „Wissen“ reicht nur bis zum Knowledge-Cutoff. Aber, die Agenten brauchen so gesehen gar nicht mehr Wissen. Es reicht, wenn sie verstehen, was zu tun ist. Und dafür reichen die aktuellen Modelle vollkommen aus. Alles, was jetzt noch fehlt, ist Aktualität. Und die kann erlangt werden, indem man der KI eine API-Spec mit als Kontext gibt, wobei die API dann in der Lage sein wollte, auf minutenaktuelle Daten des Anbieters zuzugreifen. Google u.a. macht das bereits mit der Search-API, andere Anbieter auch.

Durch dieses „Mitgeben“ von API-Spec und Zugangsdaten (Credentials) im Kontext einer KI Kommunikation, ist es bereits heute möglich, verschiedene Anbieter nur über Schnittstellen zu nutzen. Ob es Dateiupload ist, Bildauswertung oder eben Online-Recherche – die KI versteht die API/Schnittstellenbeschreibung und kann entsprechend agieren.

 

Phase 2 (mittelfristige Zukunft, 1-3 Jahre): Wir schenken uns den Kontext mit der API-Spezifikation

So, wie vor ca. 2 Jahren das Buzzword „Prompt-Engineer“ in aller Munde als der neue heiße Job war, so ist er bereits schon wieder obsolet. Die KI (und -Modelle) haben sich so gut entwickelt, dass wir im Grunde keinen Prompt-Engineer mehr brauchen, sondern einen Kontext-Engineer. Für gute Ergebnisse ist mehr der Kontext der Anfrage wichtig als der richtige und perfekte formulierte Prompt. Und auch das wird in Kürze obsolet sein, weil wie oben beschrieben, jede halbwegs vernünftige Seite eine API anbieten wird, die unter api.domain.TLD erreichbar sein wird.

Wenn dann die Search etwas Relevantes gefunden hat, dann ist der nächste (build-in) Schritt des Agenten, sich die API zu laden und entsprechend der Spezifikation zu agieren. Wie gesagt, in Phase 1 sagen wir den Agenten noch, wie die Spec aussieht oder wo sie zu finden ist. In der zweiten Phase wird das nicht mehr nötig sein, die API wird als default vorausgesetzt werden.

 

Phase 3 (weitere Zukunft, ab in 5 Jahren): wir vertrauen darauf, dass alles gut geht und geben richtig Gas

In Phase 3 werden wir unsere Scheu abgelegt haben, Agenten zu nutzen. Ich sehe das bereits vor mir, dass wir einem Agenten sagen, er soll ein Geschenk für den besten Freund kaufen und auch gleich zu ihm schicken. Der Rest passiert in Minuten im Hintergrund: Geschenk gesucht, gefunden und bestellt. Abgebucht wird von der Kreditkarte, die hinterlegt ist. Ob es gut und richtig ist, werden wir dann sehen, wenn es geliefert wird.

Und beim Schreiben merke ich… once again eine Tätigkeit, bei der ich kein Hirn mehr brauche. Vor Jahren habe ich mir abgewöhnt, mir Rufnummern zu merken. Mein Telefon und sein Backup machen es obsolet. Warum mein Hirn mit derartiger Trivialität quälen? Auch die Nutzung von KI für die Erstellung von Inhalten (Bild, Ton, Text) ist schon nicht mehr so wirklich hirnlastig. Im Grunde reicht es schon heute aus, einen mehr oder weniger guten Prompt zu schreiben und der KI vorab ausreichend zusammenkopierten Text als Kontext mitzugeben und schon wird der Newsletter oder das Anschreiben wie von Zauberhand erstellt.

Ich frage mich dabei gerade… warum tippe ich das hier noch selbst? Hätte ich nicht meine Gedanken einfach als Stichpunkte in die KI kippen können? Naja, seis drum… nach Phase 3 der Agenteneinführung mach ich mir über so etwas keine Gedanken mehr, soll sich doch der Agent drum kümmern – hoffe, es geht gut.

 

Letztendlich soll eine Message hängen bleiben:

Das Agentenzeitalter wird kommen und wer keine API hat, wird auf der Strecke bleiben. Wir bei der diconium haben jahrelange Erfahrung mit dem Erstellen von Microservice-Architekturen und damit mit der Erstellung von APIs und Schnittstellen – wir können helfen, auch Ihren Shop oder Ihr Angebot für die Zeit nach „Tippen, Klicken und Wischen“ vorzubereiten.