KI-Strategie · 22. Juni 2026 · 24 Min. Lesezeit · Anthony Filipiak, CEO & Co-Founder, Amplifa
Agentic AI: Strategie für den Mittelstand
Agentic AI im Mittelstand: So starten Geschäftsführer mit echten Use Cases, Governance und ROI. Lesen Sie, wo Agenten 2026 echte Wirkung zeigen.
„Wenn der Agent nur ein Chatbot ist, zahle ich dafür keinen Euro.“ Den Satz hat mir Thomas, Geschäftsführer eines Automatisierungszulieferers aus Augsburg, im März 2025 gesagt. Er klingt ruppig. Ist aber präzise. Denn er beschreibt den Kern des Marktes besser als die meisten Hochglanz-Folien über Agentic AI: Mittelständler kaufen keine künstliche Intelligenz, sie kaufen weniger Stillstand, weniger manuelle Übergaben, mehr Serviceumsatz und eine Organisation, die auch dann noch funktioniert, wenn drei erfahrene Sachbearbeiter in Rente gehen.
Ich schreibe diesen Deep Dive aus meiner Perspektive als CEO und Co-Founder von Amplifa. Wir sprechen jede Woche mit Geschäftsführern, CTOs, Vertriebsleitern und Digitalverantwortlichen in DACH-Unternehmen mit 50 bis 500 Mitarbeitenden. Nicht mit Innovationstouristen. Mit Leuten, die SAP-Belege, Angebotsstaus, Service-Tickets, Betriebsräte und eine Marge auf dem Tisch haben. Agentic AI ist für diese Unternehmen kein Sci-Fi-Thema mehr. Naja, fast. Die produktiven Fälle sind da, aber sie sind selektiv, enger geschnitten und deutlich weniger magisch, als LinkedIn es gern hätte.
Warum Agentic AI jetzt im Mittelstand landet
Der deutsche Mittelstand hat lange mit KI gespielt wie mit einem neuen Akkuschrauber aus dem Baumarkt. Mal ausprobieren. Eine Demo bauen. Dem Beirat zeigen. Dann zurück in den Schrank. Seit Anfang 2025 kippt das. Nicht weil die Modelle plötzlich alles können, sondern weil drei Druckpunkte gleichzeitig wirken: Kosten in Service und Backoffice steigen, Fachkräfte fehlen in operativen Rollen, und Kunden erwarten Antworten in Stunden statt in Tagen. Bei einem Maschinenbauer wie DMG Mori kann ein ungeklärter Servicefall weltweit Folgekosten auslösen. Bei einem Zulieferer mit 180 Mitarbeitenden aus Ostwestfalen reicht schon ein festhängender Ersatzteilprozess, damit ein Großkunde nervös wird.
Agentic AI meint im Unternehmenskontext nicht den frei herumlaufenden KI-Mitarbeiter, der morgens sein Postfach öffnet und abends eigenständig die Firma umgebaut hat. Wer das verkauft, verkauft Theater. Gemeint sind mehrschrittige KI-Agenten, die Informationen aus ERP, CRM, DMS, E-Mail, Sensorik oder Data Warehouse ziehen, daraus eine Entscheidung vorbereiten oder eine Aktion ausführen und sich an definierte Eskalationsregeln halten. Ein Agent liest also nicht nur ein Ticket. Er prüft Maschinentyp, Seriennummer, Wartungshistorie, Ersatzteilverfügbarkeit, SLA, Techniker-Skills und schlägt dann den nächsten Schritt vor. Manchmal legt er ihn direkt an. Manchmal wartet er auf Freigabe. Genau dort beginnt der Unterschied zwischen Chatbot und Digital Worker.
Der Zeitpunkt ist auch regulatorisch scharf geworden. Seit dem 2. Februar 2025 gilt im Rahmen des EU AI Act die Pflicht zur KI-Kompetenz für Anbieter und Betreiber von KI-Systemen. Artikel 4 klingt trocken, trifft aber den Nerv: Unternehmen müssen nachweisen können, dass Menschen, die KI nutzen oder beaufsichtigen, dafür qualifiziert sind. Modular Ops weist in seinen KI-Workshops für den Mittelstand darauf hin, dass bei Verstößen gegen bestimmte Pflichten Bußgelder bis 7,5 Millionen Euro oder 1,5 Prozent des weltweiten Jahresumsatzes möglich sind. Das ist kein Randthema für Legal. Das ist Vorstandsthema. Und ja, auch für den 120-Mann-Betrieb mit Microsoft 365, abas ERP und einem Vertriebsleiter, der „Copilot“ sagt, aber eigentlich „Automatisierung“ meint.
Agentic AI ist kein Tool-Projekt, sondern Prozesspolitik
Die meisten Agentic-AI-Projekte scheitern nicht am Modell. Sie scheitern an Macht. Wer darf entscheiden, was ein Standardfall ist? Wer haftet, wenn der Agent eine falsche Ersatzteilnummer vorschlägt? Wer verliert Sichtbarkeit, wenn ein Prozess plötzlich nicht mehr über fünf E-Mail-Weiterleitungen läuft? Andrea, Head of Sales bei einem Hidden Champion in Bielefeld, sagte mir vor drei Wochen: „Unser CRM ist nicht schlecht, aber es bildet nicht ab, wie wir wirklich verkaufen.“ Genau dieser Satz gilt auch für Agenten. Wenn der reale Prozess schmutzig ist, wird der Agent nicht sauber. Er macht den Schmutz nur schneller sichtbar.
Ich halte deshalb wenig von der Frage: Welche Agentic-AI-Plattform sollen wir kaufen? Die bessere Frage lautet: Welcher Prozess verdient Autonomie? Bei Trumpf ist ein Serviceprozess anders gebaut als bei einem Kunststoffverarbeiter mit 85 Mitarbeitenden in Franken. Bei Phoenix Contact sind Datenarchitektur, Governance und Produktstruktur andere Welten als bei einem Komponentenhersteller, dessen Ersatzteilwissen in PDF-Ordnern, Köpfen und alten Tickets steckt. Trotzdem wollen beide denselben Effekt. Weniger Reibung. Mehr Geschwindigkeit. Kontrollierbare Risiken.
Aus unseren Implementierungen wissen wir: Der stärkste Prädiktor für Erfolg ist nicht die Modellwahl, sondern die Existenz eines echten Prozess-Owners mit Budgetrecht. In 18 Projekten und Vorprojekten, die wir in den letzten 12 Monaten bei B2B-Mittelständlern begleitet haben, kamen die schnellsten Fortschritte nicht aus den größten Datenbeständen, sondern aus den saubersten Verantwortlichkeiten. Wenn Serviceleitung, IT und Geschäftsführung in Woche eins gemeinsam festlegen, welche Entscheidungen ein Agent treffen darf und welche nicht, sinkt die Schleifenzeit dramatisch. In einem Vertriebs- und Service-Setup mit 220 Mitarbeitenden haben wir die Zeit bis zur qualifizierten Kontaktaufnahme bei Bestandskunden von im Schnitt 6,8 Tagen auf 1,9 Tage reduziert, ohne einen neuen Sales-Mitarbeiter einzustellen. Der Agent war nicht genial. Der Prozess war endlich eindeutig.
Was ein Agent wirklich tun muss
Ein produktiver Agent hat eine Stellenbeschreibung. Kein Prompt-Gedicht. Ich will Input, Output, Berechtigungen, Eskalationspfad, Audit-Log, KPI und Abschaltkriterium sehen. Wenn ein technischer Support-Agent etwa bei einem Verpackungsmaschinenbauer arbeitet, muss klar sein, welche Datenquellen er lesen darf: Servicetickets, Stücklisten, Handbücher, IoT-Fehlercodes, Kundenverträge. Dann braucht er eine Liste erlaubter Aktionen: Diagnosevorschlag erstellen, Ersatzteil identifizieren, Ticket priorisieren, Servicetermin vorschlagen. Nicht: eigenständig Preisnachlässe vergeben oder sicherheitskritische Reparaturanweisungen ohne Freigabe verschicken. Klingt banal. Stimmt nicht ganz. Diese Klarheit fehlt in vielen Unternehmen, weil Prozesse historisch gewachsen sind und niemand sie gern anfässt.
Datenlage zu Agentic AI: frühe Produktivität, wenig harte Benchmarks
Wer heute belastbare Benchmarks für Agentic AI im europäischen Mittelstand sucht, findet keine saubere OECD-Tabelle mit 2.000 Unternehmen und sieben Jahren Historie. Ehrlich? Ich weiß es nicht, ob wir so eine Tabelle in den nächsten zwei Jahren überhaupt bekommen. Was wir haben, sind Fallstudien, Anbieterberichte, Beratungsdaten und konsistente Muster aus Projekten in DACH. Das reicht nicht für akademische Sicherheit. Es reicht aber für unternehmerische Entscheidungen, wenn man Zahlen als Korridore liest und nicht als Naturgesetz.
Im Maschinenbau-Service ist das Bild am klarsten. Die Münchner Plattform lytra positioniert KI-Agenten explizit für Serviceprozesse im Maschinen- und Anlagenbau. Das typische Setup: 200 bis 5.000 Mitarbeitende, hohe Exportquote, komplexe Maschinen, After-Sales unter Druck. Laut öffentlich beschriebenen Case Patterns arbeiten dort Agenten für technischen Support, Ersatzteilgeschäft und Einsatzplanung zusammen. Ein Agent erkennt oder klassifiziert Störungen, ein zweiter identifiziert Ersatzteile und stößt ERP-Prozesse an, ein dritter plant Techniker nach Standort, Verfügbarkeit und Skill. Das ist nicht glamourös. Es ist wertvoll.
Die typischen Wirkungskorridore liegen laut Marktberichten und Projektangaben im DACH-Raum bei 20 bis 40 Prozent schnellerer Time-to-Resolution im technischen Service, sofern die First-Level-Diagnose teilautomatisiert wird. Bei Standard-Tickets werden häufig 30 bis 60 Prozent Automatisierungsgrad genannt. In Backoffice-Prozessen sprechen Beratungen wie Modular Ops von 25 bis 50 Prozent weniger Bearbeitungszeit pro Vorgang und 30 bis 60 Prozent weniger Fehlern bei Datenerfassung, wenn PDF-, E-Mail- und ERP-Strecken sauber angebunden sind. Ich mag solche Zahlen nur, wenn daneben die Bedingungen stehen. Schlechte Stammdaten, kein Rechtekonzept, kein Fachbereichs-Owner? Dann kann man die Prozente in die Tonne treten.
Bei Datenplattformen ist die Entwicklung pragmatischer. Datasolut beschreibt Microsoft Fabric mit Copilot als naheliegende Wahl für viele Microsoft-affine Mittelständler, weil Engineering-Aufwand und Einstiegshürde geringer sind. Databricks mit Mosaic AI und Agent Bricks passt eher zu Unternehmen, die KI als Kernkompetenz begreifen und eigene Agenten orchestrieren wollen. Das ist eine strategische Weiche. Wer 140 Mitarbeitende, zwei IT-Admins und eine überlastete Controlling-Leitung hat, sollte nicht so tun, als wäre er OpenAI mit Gabelstaplern. Wer aber 480 Mitarbeitende, ein Data-Team und ein digitales Produktversprechen hat, darf stärker bauen.
| Einsatzfeld | Typischer Mittelstandskontext | Agentenaufgabe | Wirkungskorridor | Kostenkorridor | Quelle oder Marktbezug |
|---|---|---|---|---|---|
| Maschinenbau-Service | 200-5000 Mitarbeitende, komplexe Anlagen, Exportgeschäft | Störung triagieren, Diagnose vorschlagen, Ersatzteilprozess starten | 20-40 Prozent schnellere Störungsbearbeitung, 30-60 Prozent Standard-Tickets automatisierbar | 80.000-250.000 EUR für Pilot mit einem Use Case | lytra, KI-Beratung Maschinenbau, DACH-Projektmuster 2025 |
| Kundenservice | 50-500 Mitarbeitende, hoher E-Mail- und Ticketanteil | Tickets klassifizieren, Antwortentwürfe erstellen, CRM-Felder füllen | 25-50 Prozent weniger Bearbeitungszeit pro Vorgang | 50.000-180.000 EUR je nach Integrationstiefe | Modular Ops Case Patterns, Beratungsprojekte DACH |
| Backoffice und Auftragserfassung | ERP-lastige Betriebe mit manueller PDF- und E-Mail-Verarbeitung | Bestellungen extrahieren, Datensätze anlegen, Ausnahmen markieren | 30-60 Prozent geringere Erfassungsfehler gegenüber Doppel-Erfassung | 60.000-220.000 EUR für MVP plus ERP-Anbindung | DACH-KI-Werkstätten, SAP- und ERP-Integrationsprojekte |
| Self-Service BI | Controlling, Vertrieb und Produktion mit Standardreports | Fragen in natürlicher Sprache in SQL oder DAX übersetzen | 20-40 Prozent weniger Zeit für Standardauswertungen | 50.000-150.000 EUR bei bestehender Fabric- oder Lakehouse-Basis | Datasolut Analyse Microsoft Fabric vs Databricks, 2025 |
| Vertriebssupport | B2B-Vertrieb mit langen Zyklen und schlechtem CRM-Pflegegrad | Accounts recherchieren, ICP Fit bewerten, Follow-ups vorbereiten | 2-4x mehr qualifizierte Kontaktpunkte bei gleichen Headcount-Kosten | 40.000-160.000 EUR für Pilot und Workflow-Integration | Amplifa Implementierungen, DACH B2B 2024-2025 |
| Disposition | Service- oder Außendienstteams mit Routen, Skills und SLA | Techniker vorschlagen, Termine koordinieren, Engpässe melden | 10-25 Prozent bessere Auslastung in klar standardisierten Feldern | 100.000-300.000 EUR bei komplexer Planung und ERP-Integration | Maschinenbau- und Field-Service-Projektmuster |
| Wissensmanagement | Unternehmen mit Handbüchern, Tickets, Normen und Produktwissen | Antworten mit Quellen geben, Expertenwissen auffindbar machen | Time-to-Insight von Tagen auf Stunden, stark abhängig von Datenpflege | 30.000-120.000 EUR für ersten kontrollierten Wissensagenten | Microsoft Copilot, Fabric, interne DMS-Projekte |
Dem deutschen Mittelstand bleiben nur noch fünf Jahre. KI im Maschinenbau ist kein Zukunftsthema mehr, sondern entscheidet, wer marktfähig bleibt.
— Etienne Fieg, Co-Founder von lytra
Ich würde diesen Satz noch härter formulieren. Wer im Maschinenbau bis 2027 keinen produktiven KI-Agenten im Service, Backoffice oder Vertriebssupport laufen hat, wird nicht sofort verschwinden. Aber er wird langsamer lernen als der Wettbewerb. Und langsamer lernen ist in Märkten mit Preisdruck, Fachkräftemangel und globalem Serviceversprechen fast dasselbe wie schrumpfen. Schaeffler, Festo, Kärcher, Webasto oder Brose haben andere Ressourcen als der typische Mittelständler. Trotzdem setzen sie Standards für Reaktionszeiten, digitale Schnittstellen und Datenqualität, an denen Kunden irgendwann auch kleinere Anbieter messen.
Der zweite Blick: Warum viele Agentic-AI-Projekte versanden
Die Gegenposition höre ich oft von CTOs. „Wir haben erst einmal unsere Daten nicht im Griff“, sagte mir Jens, CTO eines Elektronikzulieferers aus Nürnberg. Recht hat er. Aber dieser Satz wird manchmal zur Ausrede, jahrelang keine Entscheidung zu treffen. Datenqualität wird nicht im luftleeren Raum besser. Sie wird besser, wenn ein konkreter Prozess Geld kostet und ein Agent beim ersten Test brutal zeigt, welche Felder fehlen, welche Artikelstämme doppelt sind und welche CRM-Notizen nur aus „siehe Mail“ bestehen.
Es gibt trotzdem echte Fallstricke. Der erste heißt Tech-first. Unternehmen starten mit LangChain, AutoGen, Copilot Studio oder irgendeinem Agent Builder, ohne vorher eine Prozesslandkarte zu bauen. Dann entsteht eine Demo, die beim Vorstand Applaus bekommt und im Alltag niemandem hilft. Der zweite heißt Over-Automation. Ein Geschäftsführer will direkt End-to-End-Autonomie, weil die Folie dann besser aussieht. Falsch. In kritischen Prozessen gehört der Mensch zuerst in die Freigabeschleife. Danach kann man Standardfälle freigeben. Schrittweise. Nicht aus Angst, sondern weil Vertrauen ein Produktionsfaktor ist.
Der dritte Fallstrick ist Governance als Nachtrag. Besonders im DACH-Mittelstand ist das tödlich langsam. Betriebsrat, Datenschutz und IT-Security werden erst eingeladen, wenn der MVP fast fertig ist. Dann kommt die Frage: Welche personenbezogenen Daten verarbeitet der Agent eigentlich? Welche Logs werden gespeichert? Wird Leistung überwacht? Liegen Daten in der EU? Wer kann den Agenten stoppen? Plötzlich riecht der Besprechungsraum nach kalter Pizza und Panik. Habe ich mehrfach gesehen. Nicht bei Amplifa allein, sondern quer durch die Gespräche mit Digitalleitern in München, Stuttgart, Hannover und Linz.
| Phase | Dauer | Typische Kosten | Hauptentscheidung | KPI für Go oder No-Go |
|---|---|---|---|---|
| Exploration und Strategie | 4-8 Wochen | 20.000-50.000 EUR | Welche 1-2 Prozesse verdienen Agentenautonomie? | Business Case mit mindestens 20 Prozent Zielwirkung im Pilotbereich |
| MVP mit einem Agenten | 8-16 Wochen | 80.000-250.000 EUR | Welche Datenquellen und Aktionen werden produktiv angebunden? | Nachweisbare Zeitersparnis, Fehlerreduktion oder Umsatzwirkung |
| Kontrollierter Pilotbetrieb | 6-12 Wochen | 30.000-100.000 EUR zusätzlich | Welche Standardfälle darf der Agent ohne Freigabe bearbeiten? | Akzeptanzquote im Fachbereich über 70 Prozent und Audit-Log stabil |
| Skalierung auf weitere Prozesse | 6-18 Monate | 300.000-1.500.000 EUR | Plattformstrategie, Rollenmodell, Training, Governance | 10-30 Prozent Kostenreduktion oder 5-15 Prozent Mehrumsatz im betroffenen Bereich |
| Betrieb und Optimierung | laufend | 5-20 Prozent der Projektkosten pro Jahr | Wer besitzt Monitoring, Modellwechsel, Prompt- und Workflow-Versionen? | Fehlerquote sinkt, Nutzung steigt, keine Schatten-Agenten im Unternehmen |
Agentic AI Governance: Der Mittelstand braucht Leitplanken, keine Bürokratie
Viele Geschäftsführer hören Governance und sehen sofort Ordner, Ausschüsse und Beraterstundensätze. Verständlich. Aber schlechte Governance ist teuer, gute Governance ist eine Bremse mit ABS. Sie erlaubt Geschwindigkeit, weil klar ist, wann gestoppt wird. Ich würde jedes Agentic-AI-Programm im Mittelstand mit vier Governance-Artefakten starten: Use-Case-Register, Risikoklassifizierung nach EU AI Act, Agenten-Stellenbeschreibung und Freigabematrix. Das klingt nach Papier. In Wahrheit ist es Betriebssystem.
Beim EU AI Act geht es nicht nur um High-Risk-Systeme in HR, Kredit oder sicherheitskritischer Qualität. Auch Low-Risk-Agenten brauchen Kompetenz, Dokumentation und Kontrolle, wenn sie in Unternehmensprozesse eingreifen. Ein Kundenservice-Agent bei Kärcher, der Antwortvorschläge macht, ist etwas anderes als ein HR-Agent, der Bewerbungen vorsortiert. Ein Qualitätsagent bei einem Automotive-Zulieferer in der Nähe von Wolfsburg hat andere Risiken als ein Vertriebsagent, der Firmenwebsites analysiert. Wer diese Unterschiede nicht sauber trennt, überreguliert harmlose Fälle und unterschätzt gefährliche.
Mein Rat ist kantig: Keine Agenten in HR-Auswahl, Gehaltsentscheidungen oder sicherheitskritischer Qualität als erstes Projekt. Punkt. Der erste Agent gehört dahin, wo hoher manueller Aufwand, klare Daten und begrenzter Schaden zusammenkommen. Service-Triage. Backoffice-Erfassung. Vertriebsrecherche. Wissenssuche mit Quellen. Dort lernt die Organisation, ohne sich gleich in die härteste Regulatorik zu werfen. Wer mit dem schwierigsten Prozess beginnt, verwechselt Mut mit Eitelkeit.
Plattform oder Eigenbau: Die falsche Stolzfrage
Ich habe eine Allergie gegen technische Stolzfragen. „Bauen wir das selbst?“ wird im Mittelstand oft gestellt, bevor klar ist, was überhaupt gebaut werden soll. Plattformen wie Microsoft Fabric, Databricks, SAP BTP oder spezialisierte Anbieter wie lytra lösen nicht dasselbe Problem. Fabric mit Copilot ist für Microsoft-nahe Organisationen oft der schnellere Einstieg, besonders wenn Daten schon in Power BI, SharePoint und Azure liegen. Databricks mit Mosaic AI und Agent Bricks ist stärker, wenn Data Engineering, ML-Ops und eigene Agentenlogik strategisch relevant sind. SAP BTP ist naheliegend, wenn Kernprozesse tief im SAP-Ökosystem sitzen. lytra ist spannend, wenn Maschinenbau-Service nicht nur Prozess, sondern Geschäftsmodell ist.
Eigenbau lohnt sich, wenn der Prozess Differenzierung schafft. Nicht wenn man damit nur eine Rechnung aus einer PDF zieht. Dafür gibt es genug Werkzeuge. Wenn aber ein Agent Produktwissen, Pricing-Logik, Servicehistorie und Kundenwert zu einem Vertriebs- oder Servicevorschlag verbindet, kann Eigenbau oder zumindest starke Individualisierung Sinn machen. Der Unterschied ist IP. Bei Wittenstein oder einem ähnlich wissensintensiven Anbieter steckt Wert nicht nur im Produkt, sondern in der Entscheidung, welche Lösung zu welchem Kundenproblem passt. Dort will man nicht alles in eine generische Box kippen.
Für Unternehmen mit 50 bis 500 Mitarbeitenden sehe ich meistens einen Hybrid. Standardplattform für Datenzugriff, Sicherheit und Authentifizierung. Individuelle Agentenlogik für die Prozesse, die Umsatz oder Kundenbindung beeinflussen. Kein CTO sollte seine knappe Mannschaft damit beschäftigen, generische Chat-Oberflächen nachzubauen. Aber kein Geschäftsführer sollte die Kernlogik seines Service- oder Vertriebsmodells komplett an einen Vendor delegieren. Das ist kein Widerspruch. Das ist erwachsen.
Wie Branchen Agentic AI unterschiedlich nutzen
Im Maschinenbau ist Service der natürliche Einstieg. Der Grund ist einfach: Wissen ist verteilt, Fehlerbilder wiederholen sich, Ersatzteile haben Margen, Stillstand kostet Geld. Ein Service-Agent kann hier direkt auf Time-to-Resolution, First-Time-Fix-Rate und After-Sales-Umsatz wirken. Bei einem Anlagenbauer aus Baden-Württemberg, dessen Name nicht genannt werden soll, roch der Testraum während eines Workshops nach Hydrauliköl und warmem Schaltschrank. Der spannendste Moment war nicht die Demo. Es war der Satz eines Servicetechnikers: „Wenn der Agent mir die letzten drei ähnlichen Fälle zeigt, spare ich mir zwei Anrufe.“ Genau das ist Produktivität.
Im Handel und in technischen Großhandelsstrukturen ist Backoffice stärker. Bestellungen kommen per E-Mail, PDF, EDI, Fax-Restbeständen (ja, immer noch) und Portalen. Agenten extrahieren Positionen, prüfen Kundennummern, erkennen Abweichungen, legen Vorgänge an. Das ist weniger sexy als ein autonomer Vertriebsagent. Aber wenn 14 Menschen täglich Aufträge abtippen, liegt der ROI auf der Hand. Ein Unternehmen wie Würth hat natürlich ganz andere Skaleneffekte, doch die Muster gelten auch für den 90-Mann-Spezialhändler in Kassel.
Im B2B-Vertrieb ist Agentic AI heikler, weil schlechte Automatisierung sofort nach Spam riecht. Wer 2026 noch glaubt, ein Agent könne einfach 10.000 Cold Emails rausschießen und das sei Strategie, hat sein Marktverständnis im Jahr 2018 vergessen. Die sinnvolle Rolle liegt davor und dazwischen: ICP-Fit prüfen, Trigger erkennen, Ansprechpartner recherchieren, CRM aktualisieren, Follow-ups vorbereiten, Gesprächsnotizen in nächste Schritte übersetzen. Markus, Vertriebsleiter bei einem Komponentenhersteller aus Heilbronn, sagte mir im April 2025: „Unser Problem ist nicht, dass wir zu wenig Firmen kennen. Unser Problem ist, dass wir nicht wissen, welche gerade kaufbereit sind.“ Exakt dort können Agenten helfen.
Praxisbeispiel: Service-Agent mit echten Zahlen
Nehmen wir einen typischen Maschinenbau-Mittelständler mit 260 Mitarbeitenden, 42 Millionen Euro Umsatz, 18 Servicetechnikern, 7 Personen im technischen Innendienst und Kunden in DACH, Benelux und Italien. Kein erfundener Werksbesuch, sondern ein verdichtetes Muster aus mehreren Gesprächen und Projektrechnungen, wie wir sie 2024 und 2025 gesehen haben. Pro Jahr laufen 18.000 Serviceanfragen ein. Davon sind 55 Prozent wiederkehrende Fehlerbilder, Ersatzteilfragen oder Bedienungsthemen. Die durchschnittliche Bearbeitungszeit im Innendienst liegt bei 18 Minuten pro Ticket, bei komplexen Fällen deutlich höher. Der Raum für Verbesserung ist nicht theoretisch. Er sitzt jeden Morgen im Postfach.
Der erste Agent bekommt eine enge Rolle: Ticket lesen, Kunde und Maschine identifizieren, Historie abrufen, ähnliche Fälle anzeigen, Ersatzteilvorschlag machen, Antwortentwurf mit Quellen erzeugen, bei Unsicherheit eskalieren. Keine autonome Preisfreigabe. Keine sicherheitskritischen Reparaturanweisungen ohne Mensch. Nach 12 Wochen MVP werden 6.000 Tickets historisch ausgewertet, 1.200 Tickets im Testbetrieb verarbeitet und 300 live mit Human-in-the-Loop begleitet. Der Agent erreicht bei Standardfällen eine korrekte Klassifizierung von 82 Prozent, Vorschläge werden in 68 Prozent der Fälle vom Innendienst übernommen oder leicht angepasst. Nicht perfekt. Aber brauchbar.
Die Rechnung sieht dann so aus: Wenn 9.900 Standardtickets pro Jahr betroffen sind und die Bearbeitungszeit im Schnitt von 18 auf 10 Minuten sinkt, spart das 79.200 Minuten. Das sind 1.320 Stunden. Bei internen Vollkosten von 62 Euro pro Stunde ergibt sich ein Effizienzpotenzial von rund 81.840 Euro pro Jahr. Dazu kommt Serviceumsatz. Wenn der Agent bei Ersatzteilfällen in nur 8 Prozent der relevanten Tickets einen passenden Zusatzartikel oder schnelleren Angebotsprozess ermöglicht und daraus 120.000 Euro zusätzlicher Deckungsbeitrag pro Jahr entstehen, ist der Case plötzlich nicht mehr nur Kostenreduktion. Dann wird After-Sales messbar zum Umsatzhebel. Genau deshalb finde ich reine Produktivitätsrechnungen zu klein.
Der Pilot kostet in diesem Beispiel 160.000 Euro inklusive Datenanbindung, Workflow-Design, Modellkosten, Tests, Schulung und Governance. Laufende Kosten liegen bei 36.000 Euro pro Jahr. Im konservativen Fall amortisiert sich das Projekt nach 13 bis 18 Monaten. Im besseren Fall nach unter 12 Monaten. Der Unterschied liegt selten im Modellpreis. Er liegt in Datenzugang, Fachbereichsnutzung und der Frage, ob Service wirklich verkaufen darf oder nur Brände löscht.
Amplifa ICP Playbook — Nutzen Sie das ICP Playbook, um Agentic-AI-Use-Cases im Vertrieb und Service zuerst auf die richtigen Kundensegmente auszurichten.
FAQ: Was Geschäftsführer zu Agentic AI wissen müssen
Ist Agentic AI für 50 bis 500 Mitarbeitende überhaupt realistisch?
Ja, aber nicht als Konzernprogramm im Miniaturformat. Ein Unternehmen mit 80 Mitarbeitenden braucht keinen AI Transformation Tower. Es braucht einen Prozess mit hohem Schmerz, einen fachlichen Owner, eine Plattformentscheidung und ein MVP, das in 8 bis 12 Wochen etwas misst. Bei 50 bis 500 Mitarbeitenden ist der Vorteil sogar oft größer, weil Entscheidungen schneller fallen. Der Nachteil: Jede falsche Baustelle frisst sofort Kapazität.
Welche Agentic-AI-Use-Cases liefern zuerst ROI?
Meiner Erfahrung nach zuerst Service-Triage, Auftragserfassung, Vertriebsrecherche, Wissenssuche und Standardreporting. Nicht, weil diese Fälle am coolsten sind. Weil sie messbar sind. Zeit pro Vorgang, Fehlerquote, Antwortzeit, Angebotsgeschwindigkeit, Ticketdurchlauf. Wenn ein CFO aus Stuttgart nach vier Wochen fragt, ob der Agent wirkt, braucht man keine Vision, sondern eine Baseline.
Wie viel Autonomie darf ein Agent am Anfang haben?
Wenig. Zuerst assistiv, dann teilautonom, dann in klar abgegrenzten Standardfällen autonom. Ich weiß, das klingt vorsichtig. Ist es nicht. Es ist schneller, weil Vertrauen nicht nachträglich repariert werden muss. Ein Agent, der drei falsche Kundenmails verschickt, kann ein ganzes Programm beschädigen. Ein Agent, dessen Vorschläge Menschen prüfen und bewerten, lernt mit der Organisation.
Was kostet ein seriöser Einstieg in Agentic AI?
Für Strategie und Use-Case-Priorisierung sollten Geschäftsführer 20.000 bis 50.000 Euro einplanen. Ein MVP mit einem oder zwei Agenten liegt meist zwischen 80.000 und 250.000 Euro, wenn echte Systemintegration dabei ist. Wer glaubt, mit einem 9.000-Euro-Prototypen aus einem Workshop produktive ERP-Autonomie zu bekommen, wird enttäuscht. Vielleicht bekommt er eine Demo. Aber keine belastbare Betriebsfähigkeit.
Brauchen wir zuerst eine komplette Datenstrategie?
Nein. Aber Sie brauchen genug Datenstrategie für den gewählten Prozess. Das ist ein großer Unterschied. Für einen Service-Agenten müssen Tickets, Maschinenstammdaten, Handbücher und Ersatzteile zugänglich, versioniert und berechtigt sein. Für einen Vertriebsagenten brauchen Sie saubere ICP-Kriterien, Account-Daten, Triggerquellen und CRM-Regeln. Wer auf die perfekte Datenlandschaft wartet, wartet lange. Wer ohne Datenregeln startet, baut Chaos mit schöner Oberfläche.
Sieben Schritte zur Agentic-AI-Strategie im Mittelstand
- Starten Sie mit einer Use-Case-Inventur über Service, Backoffice, Vertrieb, Produktion und Controlling. Sammeln Sie 20 bis 40 Kandidaten, aber wählen Sie nur einen ersten Prozess aus. Ein Workshop im Mai 2025 mit einem B2B-Hersteller aus Ulm zeigte wieder das gleiche Muster: Die ersten zehn Ideen waren zu breit, die beste Idee lag in einem langweiligen Angebotsübergang.
- Bewerten Sie jeden Use Case nach Impact, Aufwand, Datenzugang, Risiko und Prozess-Ownership. Ich würde keinen Use Case starten, bei dem nicht ein Bereichsleiter namentlich Verantwortung übernimmt. Wenn niemand seinen Namen darunter setzt, ist der Case politisch nicht reif.
- Schreiben Sie für den Agenten eine Stellenbeschreibung. Inputs, Outputs, erlaubte Aktionen, verbotene Aktionen, Eskalationspfad, KPI, Audit-Log. Behandeln Sie den Agenten wie eine neue operative Rolle, nicht wie ein Plugin.
- Klären Sie Plattform und Datenhaltung früh. Microsoft Fabric, Databricks, SAP BTP, Copilot Studio, lytra oder Eigenbau sind keine Glaubensrichtungen. Die Wahl hängt an bestehender IT, Engineering-Fähigkeit, EU-Datenanforderungen und Differenzierungsgrad des Prozesses.
- Binden Sie Datenschutz, Betriebsrat und IT-Security in Woche eins ein. Nicht als Bremser. Als Risikodesigner. Besonders bei personenbezogenen Daten, Leistungsbezug oder sicherheitskritischen Entscheidungen darf es keine Überraschungen geben.
- Messen Sie vor dem MVP eine Baseline. Bearbeitungszeit, Fehlerquote, Durchlaufzeit, Antwortzeit, Angebotsquote, Serviceumsatz. Ohne Baseline gewinnt am Ende die lauteste Meinung im Raum.
- Planen Sie Skalierung erst nach Nutzungsbeweis. Ein Agent, den 80 Prozent des Teams ignorieren, ist kein Skalierungskandidat. Ein Agent, dessen Vorschläge in 65 bis 75 Prozent der Fälle übernommen werden, verdient Budget.
Amplifa Produkt — Amplifa hilft B2B-Teams, KI-gestützte Vertriebs- und Account-Workflows produktiv aufzusetzen statt nur Demos zu bauen.
Was wir bei Amplifa konkret sehen
Was wir bei Amplifa konkret sehen: Die besten Agentic-AI-Projekte im Vertrieb starten nicht mit Outreach, sondern mit Marktlogik. In den letzten 12 Monaten haben wir bei Kunden aus Maschinenbau, technischen Dienstleistungen und B2B-Software ein wiederkehrendes Pattern gesehen: Wenn der ICP unscharf ist, erzeugt KI mehr Aktivität und weniger Wahrheit. Sobald ICP-Kriterien operationalisiert sind – Branche, Trigger, installierte Technologien, Wachstumssignale, regionale Priorität, Ausschlusskriterien –, sinkt die Zahl der kontaktierten Accounts teilweise um 35 bis 55 Prozent, während die Terminquote steigt. Ein Kunde aus dem Raum Stuttgart hat nach neun Monaten dreimal so viele qualifizierte Ersttermine gebucht, ohne einen zusätzlichen SDR einzustellen. Nicht, weil die E-Mails plötzlich poetisch waren. Weil der Agent aufgehört hat, die falschen Firmen zu verfolgen.
Das ist die Lektion für Agentic AI insgesamt. Autonomie ohne Auswahlkriterium ist Lärm. Ein Service-Agent braucht Kriterien für Standardfall und Ausnahme. Ein Backoffice-Agent braucht Kriterien für sichere Extraktion und manuelle Prüfung. Ein Vertriebsagent braucht Kriterien für Fit und Timing. Sonst automatisiert man nicht Arbeit, sondern Unschärfe. Und Unschärfe skaliert brutal schlecht.
Der ROI hängt an Adoption, nicht an Modellkosten
Viele ROI-Rechnungen für Agentic AI starren auf LLM-Kosten. Das ist die falsche Stelle. Modellkosten sind relevant, aber selten der Haupthebel. Teuer sind Integrationen, Prozessklärung, Change, Qualitätssicherung und Betrieb. Noch teurer ist Nichtnutzung. Ein Agent, der technisch funktioniert, aber von Sachbearbeitern umgangen wird, hat negativen ROI. Dann zahlen Sie Plattform, Beratung, interne Kapazität und verlieren Vertrauen. Ich habe lieber einen schmalen Agenten, der täglich genutzt wird, als eine große Architektur, die in Confluence glänzt.
Adoption entsteht nicht durch Schulung allein. Sie entsteht, wenn der Agent spürbar Arbeit wegnimmt, ohne den Menschen bloßzustellen. In einem Projekt sagte eine Mitarbeiterin aus dem Customer Service in Köln: „Ich will nicht, dass die KI meine Antwort schreibt. Ich will, dass sie mir die drei Infos holt, die ich sonst suchen muss.“ Dieser Satz ist Gold. Viele Menschen wollen keine automatische Stimme nach außen. Sie wollen weniger Sucharbeit, weniger Kopieren, weniger Systemwechsel. Das sollte das Design prägen.
Daher gehören Mitarbeitende in die Agentenentwicklung. Nicht in einem Change-Theater mit Post-its, sondern konkret: Welche Fälle nerven? Welche Ausnahmen sind gefährlich? Welche Formulierungen würden Sie nie an Kunden schicken? Welche ERP-Felder sind zuverlässig und welche lügen? Wer diese Fragen nicht stellt, baut für Organigramme statt für Arbeit.
Meine Prognose für 2026 und 2027
Ich glaube nicht, dass 2026 jedes mittelständische Unternehmen eine Agentic AI Organization haben wird. Der Begriff klingt ohnehin größer, als die meisten Betriebe brauchen. Aber ich glaube, dass gute Mittelständler bis Ende 2026 zwei bis fünf produktive Agenten in klaren Prozessen betreiben werden. Service, Backoffice, Vertriebssupport, Reporting, Wissenssuche. Nicht als Labor. Im Betrieb. Mit Logs, Rollen, KPIs und einem Menschen, der dafür geradesteht.
Die Verlierer werden nicht die Unternehmen sein, die zu spät das neueste Modell kaufen. Die Verlierer werden die Unternehmen sein, die ihre Prozesse nicht entscheidbar machen. Denn Agentic AI zwingt Organisationen zu etwas, das sie lange vermeiden konnten: explizit sagen, wer was wann entscheiden darf. Das ist unbequem. Es kratzt an Bereichsgrenzen, an alten Gewohnheiten, an kleinen Schattenprozessen in Excel. Aber genau dort liegt der Gewinn.
Mein persönlicher Standpunkt ist simpel: Wer Agentic AI als IT-Projekt behandelt, wird eine teure Demo bekommen. Wer es als Prozess- und Marktprojekt behandelt, kann in 12 Monaten messbare Vorteile sehen. Nicht überall. Nicht ohne Reibung. Aber genug, um Wettbewerber nervös zu machen. Und vielleicht ist das der beste Frühindikator: Wenn der erste Servicetechniker sagt, er wolle den Agenten nicht mehr hergeben, ist die Strategie zum ersten Mal im Alltag angekommen.