Die Projektdokumente eines fiktiven Vorhabens: KI-getriebenes Projektmanagement auf KI-getriebene Art einführen und das Gesamtsystem im Tun laufend verbessern. Generische große Organisation, 5.000–15.000 Mitarbeitende. Ein mitwachsender, nachvollziehbarer Plan — jedes Element wächst über Iterationen.
Jedes Element ist als ausformuliertes Dokument hinterlegt und trägt einen Reife-/Präzisionsgrad. Klick öffnet die Element-Seite. Inhalte aus content/pm-zyklus.md (SSoT).
Detaillierte Arbeitspakete sind klickbar (drei Absätze + Top-3 Fragen). Platzhalter tragen nur Titel und Metazeile, sind gedimmt und nicht klickbar. Je Paket ein Präzisionsgrad-Badge (grob / mittel / präzise). SSoT: content/pm-ap-*.md.
Auftragsklärung stellt sicher, dass alle Beteiligten dasselbe Vorhaben im Kopf haben, bevor Ressourcen fließen. Ergebnis ist ein knapper, von allen autorisierten Stellen unterzeichneter Projektauftrag.
Ausgangslage: Die Organisation betreibt im Verborgenen bereits KI-Werkzeuge — punktuell, unkontrolliert, ohne Governance. Die Konsequenz ist Wissens-Asymmetrie, Compliance-Risiko und verpuffter Nutzen. Ziel ist ein koordinierter, nachvollziehbarer Einstieg in KI-getriebenes Projektmanagement.
Auftrag: Den ersten reproduzierbaren KI-Unterbau in I1–I3 errichten, den ersten Use Case in I3–I4 live bringen und die Organisation bis I7 befähigen, Use Cases eigenständig aufzuziehen. Voraussetzung: Rechtskontext bis Ende I2 geklärt.
Abgrenzung: Keine Personalentscheidungen, keine neue IT-Abteilung, kein proprietärer Plattform-Lock-in. Das Vorhaben endet, sobald der Betrieb verstetigt und die Organisation handlungsfähig ist.
Projekt-Design definiert das Grundprinzip: Wie wird gearbeitet, woran misst man Fortschritt, und welche Annahmen stecken im Vorgehen?
Methodik: Hybrides Vorgehen — klassische Planungstiefe für Governance, Recht und Infrastruktur; agile Iterationen für Use Cases und Kontextarbeit. Stacey-Klassifikation: überwiegend komplex. Das bedeutet, Anforderungen schärfen sich iterativ; der Plan ist ein lebendes Artefakt, kein Gesamtwerk von Iteration I1.
Qualitätssicherung: Jede Iteration endet mit einem Quality Gate (Artefakt-Checkliste, definierte Abnahmekriterien, HITL-Protokoll). Kein Start der Folge-Iteration ohne Gate-Freigabe. Fortschrittsmessung: Earned Value für klar messbare Pakete; 0:100-Methode für agentische oder nicht-inkrementelle Pakete.
Grundprinzipien: Befähigung vor Zukauf — wo intern realisierbar, kein Einkauf externer Dienste ohne Exit-Plan. Vertraulichkeit vor Komfort — lokale Modelle vor Cloud, wo Datenklasse es erfordert. Beweis vor Übergabe — kein Artefakt gilt als fertig ohne automatisierten Nachweis.
Ziele beschreiben, was nach Projektende anders ist als vorher — messbar, priorisiert, mit klarer Grenze zwischen Pflicht und Option.
Muss-Ziele (verpflichtend): Reproduzierbarer KI-Unterbau mit klarer Datenklassen-Governance; mindestens ein Use Case live und belegbar nützlich; Rechtskontext formal geklärt (DSGVO, EU AI Act); Organisation eigenständig handlungsfähig nach Projektende.
Soll-Ziele (angestrebt): Geringere manuelle HITL-Last durch agentische Routinen; mindestens drei Use Cases live bis I6; Observability-System mit automatischer Kostenübersicht; RAG-Basis und Graphstrukturen für Kontextabfragen.
Kann-Ziele (opportunistisch): Automatisierte Änderungsvorschläge für Richtlinien, die den KI-Einsatz hemmen; tiefere Anbindung von Fachsystemen (ERP, DMS) in I6–I7; vollständig lokale Erzeugung vertraulicher Artefakte ohne Cloud-Egress.
Umfeld beschreibt den Kontext, in dem das Vorhaben operiert — rechtlich, organisatorisch, technisch. Nicht steuerbar, aber relevant für Entscheidungen.
Rechtlicher Rahmen: EU AI Act (Risikoklassen und Literacy-Pflicht Art. 4 ab 2025), DSGVO (AVV/DSFA), Betriebsverfassungsgesetz (§87 Mitbestimmung bei technischen Einrichtungen). Compliance-Strom CMP bearbeitet alle drei parallel.
Organisatorischer Kontext: Konzern mit 5.000–15.000 Mitarbeitenden. IT-Beschaffungsprozess formal geregelt. Betriebsrat hat Mitbestimmungsrechte bei technischen Systemen. Noch kein zentrales KI-Gremium. Provider-Governance-Lücken in bestehenden Cloud-Verträgen.
Technischer Kontext: Heterogene Systeme (ERP, DMS, Mail, Kollaborationsplattform). Eigene Rechen-Hardware der Klasse M5 Max für lokale Modelle. Bestehende Cloud-Verträge ohne explizite KI-Zusätze. Fehlende einheitliche Authentifizierungsschicht für neue Dienste.
Stakeholder-Analyse identifiziert, wer Einfluss auf das Vorhaben hat, was die Person erwartet, und wie der Informationsfluss gestaltet wird.
Promotoren: Bereichsvorstand (Auftraggeber, Entscheidungsträger), IT-Leitung (Betriebshoheit, Ressourcen), Innovationsverantwortliche in Fachbereichen (erster Use Case), einzelne operativ-affine Mitarbeiter (Early Adopter).
Kritische Stakeholder: Betriebsrat (§87 BetrVG — Mitbestimmung technische Einrichtungen; Befürchtung Leistungskontrolle), Datenschutzbeauftragter (DSFA-Pflicht offen, Verarbeitungsverzeichnis), Legal/Recht (EU AI Act Risikoklasse, vertragliche Absicherung).
Kommunikation: Iterations-Statusbericht (je Iteration, alle Beteiligten), Lenkungsausschuss (je Quality Gate), Betriebsrats-Informationssitzung (je I2 und I3 minimal), Mitarbeiter-Information (bei Use-Case-Start je Bereich, schriftlich).
Risiken sind identifiziert, bewertet und mit Maßnahmen hinterlegt. Das Register wird je Iteration aktualisiert.
Technische Risiken: Modell-Drift (Qualität sinkt ohne Beobachtbarkeit) — Gegenmaßnahme: Observability von Tag 1 (INT-4); Provider-Governance-Änderung — Gegenmaßnahme: Exit-Plan je Integration (INF-2); Latenz lokal vs. Cloud — Gegenmaßnahme: Latenz-Monitoring als KPI.
Organisatorische Risiken: Betriebsrats-Eskalation blockiert Use-Case-Start — Maßnahme: GOV-2 in I2 abschließen; Politischer Wechsel (Auftraggeber) — Maßnahme: Auftrag gremiumsbeschlossen (AK-Element 01); Ressourcenabzug aus der Linie — Maßnahme: formale Freistellung in Projektauftrag.
Compliance-Risiken: EU AI Act Risikoklasse noch nicht bewertet — Maßnahme: CMP-1 bis Ende I2; DSFA-Pflicht ungeklärt — Maßnahme: CMP-2 in I2; Lizenzen KI-generierter Output noch nicht geprüft — Maßnahme: CMP-7 in I7 (Platzhalter).
Projektorganisation regelt, wer was entscheidet, wer informiert wird und wer haftet. Grundprinzip: Verantwortung an Wirkung knüpfen, nicht an Hierarchie.
Lenkungsausschuss: Auftraggeber, IT-Leitung, Legal, Datenschutzbeauftragter (beratend). Entscheidet über Budget-Abweichungen, Scope-Änderungen, Gate-Freigaben. Trifft sich je Quality Gate (mind. je Iteration).
Projektleitung: Autonom bei Tages-/Wochenentscheidungen innerhalb Budget und Scope. Eskalationspflicht bei: Budget-Abweichung >10 %, Scope-Erweiterung, Compliance-Risiko-Eskalation, Ressourcenabzug.
Teilprojektleitungen: Je Strom (CTX, INF, INT, CMP, UC, GOV) eine TP-Leitung. Fachlich zuständig für Artefakte, Quality Gates und HITL-Protokolle des Stroms. Freistellung anteilig 40–60 % — abhängig von Strom-Aktivität je Iteration.
Phasenplan zeigt die logische Abfolge der sechs Ströme über sieben Iterationen. Abhängigkeiten sind eingetragen; kritischer Pfad berechnet sich automatisch im Gantt.
I1 (Initialisierung): Kontextmodell (CTX-1), Datenklassen-Routing (INF-1), Provider-Governance-Stub (INF-2), Leitplanken (GOV-1), BR-Information (GOV-2 Start), Use-Case-Auswahl (UC-1), Umgebungs-Klärung (INT-0), Workshop-Vorbereitung (INT-5). Quality Gate: Rechtskontext-Scope klar + Datenklassen-Matrix v1.
I2 (Fundament): Rechtskontext abschließen (INF-1 Ende, CMP-1, CMP-2 Start), Kontextquellen anbinden (INT-2), PM-Tool anbinden (INT-1), Use Case Auftragsklärung start (UC-2). Quality Gate: Rechtskontext formal geklärt + Plattform-Basis bereit.
I3–I7 (Betrieb & Ausweitung): Schrittweise Systemintegrationen (INT-3), Observability (INT-4), agentische Compliance-Prüfung (CMP-3), Use Cases live (UC-3, UC-4, UC-5), Change-Begleitung (GOV-3), Governance-Betrieb (GOV-4, GOV-5), Kontextoptimierung (CTX-3, CTX-4), Plattformreife (INF-3, INF-4, INF-5).
Vier PSP-Varianten derselben Projektarbeit, unterschiedlich gegliedert. Blätter referenzieren AP-IDs aus den sechs Strömen. Collapsible — auf/zu per Klick oder Taste.
Ablaufplan macht die logischen Abhängigkeiten zwischen Arbeitspaketen rechenbar. Der kritische Pfad bestimmt die frühestmögliche Fertigstellung.
Kritischer Pfad (CPM): INF-1 (I1–I2) → INF-2 (I2–I3) → CMP-2 (I2–I3) → CMP-3 (I3–I4) → INF-3 (I3). Pufferlose Vorgänge auf dem Pfad — Verzug hier verschiebt den gesamten Plan. Parallele Ströme (CTX, UC, GOV) haben Puffer, solange sie nicht auf INF-2/CMP-3 warten.
Kritische Abhängigkeiten: CTX-3 (Kontextpflege) startet erst, wenn INF-2 (Datenklassen-Routing) abgenommen ist. CMP-2 (AVV/DSFA) folgt auf CMP-1 (Korpus erschlossen). GOV-2 (Betriebsrat) blockiert keinen technischen Strang, aber UC-2 darf ohne BR-Zustimmung nicht in Produktion gehen.
Puffer-Monitoring: Kritische Vorgänge wöchentlich; nicht-kritische je Iteration. Protokoll: Ist-Dauer vs. Geplant → Puffer-Update → LA-Information wenn Puffer <0.
Termin-/Ressourcenplan weist nach, dass die geplante Arbeit mit den vorhandenen Kapazitäten in den Iterations-Fenstern leistbar ist.
Rollen und Kapazitäten (Schätzwerte): Projektleitung 1,0 VZÄ I1–I7; Recht/Datenschutz 0,5 VZÄ I1–I3 (extern); Plattform-Engineering 2,0 VZÄ I2–I4; KI-/Kontext-Engineering 1,5 VZÄ I2–I5; Compliance/Change 1,0 VZÄ I2–I5; Use-Case-Verantwortliche 0,5 VZÄ I3–I6.
Iterationskalender (Schätzung, ohne Kalendertermine): I1 = 4 Wochen (Initialisierung); I2 = 6 Wochen (Fundament, Rechtskontext); I3 = 6 Wochen (erste Systeme live); I4 = 5 Wochen (Use Cases produktiv); I5–I7 = je 4–5 Wochen (Stabilisierung/Ausweitung).
Kapazitätskonflikte: Recht/Datenschutz ist Engpass in I1–I2 — externe Ressource muss früh reserviert werden. Plattform-Engineering wird gleichzeitig für INF-2, INT-3, CTX-3 benötigt — Priorisierung im Strang CTX/INF klar halten.
Kostenplan schätzt den finanziellen Rahmen auf Arbeitspaket-Ebene, aggregiert je Iteration und benennt das Risikobudget explizit.
Personalkosten (Schätzung): Projektleitung und sechs TP-Leitungen über I1–I7: ~350–400 Personentage intern. Externe Recht/Datenschutz I1–I3: ~30–50 PT extern. Gesamtpersonalkosten: abhängig von internen Verrechnungssätzen und externem Tagessatz — Aufstellung erfolgt nach Bestätigung der Sätze.
Sachkosten: Token-/Cloud-Kosten je Modell und Use Case (ab I3 wachsend); Lizenzkosten Open-Source minimal (0 €); Werkzeug-Abo-Kosten (PM-Tool, Monitoring): pauschal ~200–500 €/Monat. Hardware (eigener Modell-Server): bereits vorhanden — kein Neuinvestment.
Risikobudget und Contingency: F&E-Anteil (agentische Experimente) mit eigenem Puffer 10–15 % des Gesamtbudgets. Risikobudget 10 % der Baseline. Gesamtrahmen: zur Freigabe durch den Lenkungsausschuss nach Abschluss der RASCI-Matrix und Verrechnungssatz-Klärung.
Steuerung & Berichtswesen sorgt dafür, dass Abweichungen früh erkannt und entschieden werden, statt sich stillschweigend aufzuschichten.
Kennzahlen (KPIs): Earned Value Index (SPI/CPI) je Strom; kritischer-Pfad-Puffer in Iterationsprozent; offene Gate-Blocker; HITL-Last (manuelle Stunden je Woche); Token-Kosten je Iteration; Anzahl Use Cases live und in Test; Compliance-Risiken offen/geschlossen.
Berichtsformat: Iterations-Statusbericht (kompakt, 1 Seite, je Iteration, alle Beteiligten); Gate-Protokoll (detailliert, je Quality Gate, LA); Eskalations-Memo (bei Puffer <0 auf kritischem Pfad, sofort). Kein ausgedünnter Folien-Bericht — Fakten statt Signalfarben ohne Datenbasis.
Korrekturmaßnahmen: Bei SPI <0,85: Scope-Prüfung + LA-Eskalation. Bei Compliance-Blocker: CMP-Strom erhält sofort Vorrang, andere Ströme werden eingefroren bis Entscheid. Bei Betriebsrats-Eskalation: GOV-2-Protokoll greift (Sondersitzung innerhalb 72h).
Abschluss schließt das Vorhaben geordnet ab, sichert das erarbeitete Wissen und stellt die Organisation auf eigenständigen Betrieb um.
Abnahmeprotokoll: Je Artefakt ein Abnahmekriterium (definiert in Elemente 01–03). Gesamt-Abnahme durch Lenkungsausschuss nach Vorlage aller Einzelabnahmen. Abnahme-Voraussetzung: mindestens ein Use Case produktiv, Rechtskontext formal geschlossen, Betriebsdoku übergeben, HITL-Rollen besetzt.
Übergabe und Verstetigung: Betriebsdokumentation je Strom; Schulungsnachweis für alle HITL-Rollen; Übergabeprotokoll an Betriebsverantwortliche; Leitplanken-Dokument (GOV-4) und Governance-Betriebsmodell (GOV-5) als laufende Artefakte übergeben.
Lessons Learned: Retrospektive je Iteration, aggregiert im Abschluss. Erkenntnisse werden als Modul-Verbesserungen in den Harness rückgeführt. Offene Punkte aus dem Vorhaben fließen in einen priorisierten Backlog für den Folgebetrieb.
Bestandsaufnahme: welche Werkzeuge, Auth-Pfade und Infrastruktur sind tatsächlich vorhanden — bevor Integrationsplanung gegen Annahmen entsteht.
Bevor Integration geplant wird, muss feststehen, was tatsächlich vorhanden ist. Dieses Paket erfasst in I1 den Ist-Stand in drei Zügen: welche Werkzeuge (PM-Tools, Dokumentenablagen, Mail-Systeme, Fachsysteme) produktiv genutzt werden, welche Auth-Pfade bereits existieren (SSO, OAuth, Service Accounts) und welche Infrastruktur lokal und serverseitig bereitsteht. Ohne diese Bestandsaufnahme entsteht Integrationsplanung gegen Annahmen statt gegen Tatsachen.
Der zweite Zug ist die Klärung der Verbindlichkeit: Welche Werkzeuge sind strategisch gesetzt — durch IT-Governance, Lizenzverträge oder Betriebsvereinbarungen — und welche sind faktisch im Einsatz, ohne dass eine strategische Entscheidung dahintersteht? Das trennt die Integrationslast, die es gibt, von der, die zuerst organisatorisch zu klären ist. Datenklassen-Relevanz je Werkzeug (INF-1) wird hier erstmals zugeordnet.
Das Ergebnis ist eine kompakte Übersicht: Werkzeug, Nutzungsgrad, strategischer Status, Datenklasse, existierender Auth-Pfad, vorläufige Integrationsrichtung (direkt / Proxy / bewusst außen vor). Sie steuert alle weiteren Pakete in diesem Stream und verhindert, dass mehrere APs dieselbe Umgebungslücke unabhängig voneinander entdecken.
Das bestehende PM-Werkzeug bleibt Darstellungs- und Übergabeschicht, nicht Quelle der Wahrheit. Sync-Perimeter eng halten; Auth nach INT-0; Routing nach INF-1.
Das bestehende PM-Werkzeug — ob Jira, MS Project oder ein anderes — bleibt Darstellungs- und Übergabeschicht, nicht Quelle der Wahrheit. Die agentische Landschaft hält den Plan in offenen Formaten (CTX-1); das Werkzeug empfängt den jeweils aktuellen Stand zur Anzeige und zur Rückmeldung durch die Beteiligten. Welche Richtung Daten fließen, ist die erste Designentscheidung: ein Einwegexport genügt oft, solange Rückmeldungen über einen definierten Freigabepfad in die SSoT einfließen, statt direkt im Werkzeug zu landen.
Für einen bidirektionalen Sync sind Prozess- und Datenflussfragen vorab zu klären: Welches Element ist in welchem System bearbeitbar, wer setzt die Wahrheit bei einem Konflikt, und wie verhindern wir Rück-Drift — also, dass Änderungen im Werkzeug die SSoT stilllegen? Der Sync-Perimeter ist bewusst eng zu halten: je mehr Felder synchronisiert werden, desto größer die Drift-Oberfläche. Kandidaten für den Perimeter sind Status, Zieldaten und zugewiesene Personen; Detailkontext bleibt in der agentischen Landschaft.
Die Auth läuft über den in INT-0 geklärten Pfad; Datenklassen-Routing nach INF-1 bestimmt, welche Felder in den Sync dürfen und welche lokal bleiben. Das PM-Werkzeug ist typischerweise intern, also ohne Cloud-Egress für vertraulichen Inhalt — aber das ist zu belegen, nicht anzunehmen. Eine dünne eigene Schicht kapselt die Werkzeug-API, damit ein Werkzeugwechsel die Kernlogik nicht bricht.
Für jede Quelle: Darf der Inhalt angebunden werden? Wie? Wie oft? Anbindung ist read-only; Mail und Fachsysteme erst nach AVV und Routing.
Projektkontext entsteht nicht nur in der agentischen Landschaft — er liegt in Dokumentenablagen (SharePoint, Confluence, Laufwerke), in Mailthreads, in Meeting-Transkripten (UC-3) und in Fachsystemen (ERP, CRM, HR). Dieses Paket klärt, welche dieser Quellen anbindungswürdig sind, wie die Beschaffung zur Laufzeit erfolgt (CTX-3) und unter welchen Bedingungen Inhalte aus diesen Quellen als Kontext in die agentische Landschaft fließen dürfen. Nicht jede Quelle, die existiert, muss angebunden werden; der Aufwand der Anbindung und die Datenklasse der Inhalte sind die Filterkriterien.
Für jede Quelle gelten drei Leitfragen: Darf der Inhalt nach INF-1 angebunden werden (Datenklasse, Routing)? Wie wird die Anbindung technisch realisiert (API, Connector, Read-only-Zugriff)? Und wie oft muss der Kontext frisch beschafft werden (einmalig, periodisch, auf Anfrage)? Mail und Fachsysteme enthalten typischerweise personenbezogene oder vertrauliche Daten — ihre Anbindung ist erst zulässig, wenn Datenklasse, AVV (CMP-2) und Routing geklärt sind. Die Anbindung ist read-only; in die Quellsysteme wird nicht zurückgeschrieben.
Das Ergebnis ist ein Anbindungsplan: je Quelle Entscheidung (anbinden / bewusst außen vor), Kanal, Datenklasse, Routing-Gate und Refresh-Zyklus. Quellen, die noch keine geklärte Datenklasse haben, bleiben außen vor, bis INF-1 die Zuordnung liefert. So entsteht kein unkontrollierter Sog von Kontext in die Landschaft, sondern ein auditierter Zufluss.
Einheitliche Integrationsschicht für alle Anbindungen: Auth-Muster, Kapselung je Drittsystem, Datenklassen-Gate an jeder Systemgrenze, Exit-Plan je Integration.
Über die einzelnen Anbindungen hinaus braucht die Plattform eine einheitliche Integrationsschicht: ein Muster für Auth (SSO / OAuth / API-Key-Rotation), eine dünne Kapselungsschicht je Drittsystem und ein Routing, das für jede ausgehende Anfrage die Datenklasse prüft, bevor sie ein Drittsystem erreicht. Diese Schicht ist generisch — sie dient nicht einem einzelnen Werkzeug, sondern dem Gesamtmuster der Anbindungen aus INT-1 und INT-2.
Auth ist die Schwachstelle jeder Integrationslandschaft. Credentials werden nicht hartkodiert, sondern über einen Secrets-Manager verwaltet; Rotation ist von Anfang an eingeplant. Service Accounts erhalten nur die Rechte, die sie für ihren spezifischen Auftrag brauchen — least-privilege durchgängig. Für jede Schnittstelle wird ein Exit-Plan dokumentiert: wie kommt man aus der Anbindung heraus, was bleibt portabel, was hängt am Werkzeug. Drittsysteme werden hinter dünnen eigenen Schnittstellen gekapselt; der Austausch eines Systems betrifft dann nur die Kapsel, nicht die Kernlogik.
Das Datenklassen-Routing aus INF-1 und INF-4 wird hier auf Systemgrenzen ausgedehnt: jeder ausgehende Datenstrom trägt die Klasse, die das Gate prüft. Vertraulicher Inhalt verlässt die lokale oder server-seitige Umgebung nicht, unabhängig davon, welches Drittsystem am anderen Ende steht. Die Schicht ist auditierbar (INF-5): jede Integration wird im Log-Trail sichtbar.
Drei Ebenen: laufender Betrieb der Agenten, Ressourcen (Token, Kosten in Euro, Latenz), Integrationsstatus. Konservative Alerts — wenige, hochpräzise Signale.
Die Plattform ist nur so belastbar wie die Sicht, die auf sie möglich ist. Observability deckt drei Ebenen ab: den laufenden Betrieb der Agenten (welcher Agent läuft in welchem Kontext, mit welcher Instruktion, seit wann), die Ressourcen (Token-Verbrauch, Kosten in Euro je Lauf, Latenz je Schritt) und den Integrationsstatus (welche Schnittstelle zuletzt erfolgreich, welche gedriftet oder ausgefallen). Ohne diese drei Ebenen erzeugt die Plattform einen Blindflug — Fehler und Kosten fallen erst auf, wenn der Schaden sichtbar ist.
Kosten sind eine Kernkennzahl, keine Nachbetrachtung. Je Agentenlauf werden Token und Kosten in Euro erfasst und auf Anwendungsfall und Aufrufenden zurückführbar gehalten. Zombie-Prozesse — Agenten, die laufen, obwohl ihr Auftrag beendet ist oder fehlgeschlagen hat — sind erkennbar und beendbar; ein Alert greift, sobald ein Prozess über einer definierten Schwelle weiterläuft. Laufende Agenten, ihre Instruktionen und ihre Startpunkte sind jederzeit als Liste abfragbar — keine anonyme Verarbeitungswolke.
Alerts sind zunächst konservativ: zu viele Alerts erodieren das Vertrauen schneller als zu wenige. Das Monitoring startet mit wenigen, hochpräzisen Signalen — Routing-Gate-Verletzung, Laufzeitüberschreitung, Kostenschwelle — und wird schrittweise ausgebaut. Die Betriebsdaten liegen in offenen Formaten und sind nicht exklusiv in einem externen Monitoring-Werkzeug eingesperrt; die Darstellung ist eine Schicht über der Datengrundlage.
Reproduzierbarer Workshop-Prozess: Vorbereitung, Dialog, Transkription (lokal, Parakeet TDT 0.6B v3), Nachbereitung — vom Gespräch in die Quelle der Wahrheit.
Workshops sind der primäre Kanal, über den Kontext entsteht, den kein System vorher hat: das implizite Wissen der Beteiligten, die tatsächlichen Grenzen und Vorbehalte, die Priorisierungen der Stakeholder. Das Paket beschreibt den Prozess für einen Workshop-Typ — exemplarisch den „Startpunkt schärfen" — und macht ihn reproduzierbar: Vorbereitung (Agenda aus Kontextmodell, Teilnehmende nach Stakeholder-Profil), Durchführung (Dialog, keine Vorab-Festlegung), Transkription (lokal per STT, Parakeet TDT 0.6B v3 via parakeet-mlx für vertrauliche Inhalte) und Nachbereitung (Transkript → strukturierter Kontext → SSoT).
Das Transkript ist kein Protokoll, das jemand freigibt und abheftet — es fließt als Kontext zurück. Agenten schärfen daraus Agenda-Folgedokumente, offene Punkte werden als verfolgbare Einträge geführt (CTX-2), und die Auftragsklärung (UC-2) wird mit dem erarbeiteten Material direkt weitergeführt. Der Weg vom Gespräch in die Quelle der Wahrheit ist kurz und auditierbar: Audiorohdatei aufbewahren, Transkriptionsquelle im Frontmatter, Ablage nach Datenklasse (INF-1).
Dieser Workshop-Typ ist das erste Mal, dass alle treibenden Rollen (Sponsor, IT-Sicherheit, Datenschutz, Legal, Betriebsrat, Fachbereich, Projektleitung) gemeinsam am Tisch sind. Was hier nicht geklärt wird, wird in späteren Iterationen als Annahme weitergetragen und kostet dort mehr. Das Paket liefert deshalb auch eine knappe Checkliste für den Moderator: Welche Punkte müssen in dieser Runde zwingend entschieden werden, welche dürfen offen bleiben und wer trägt sie?
Die Quelle der Wahrheit für den gesamten Projektkontext definieren: welche Dokumente, Register und Artefakte gelten als maßgeblich, und wie werden Änderungen nachvollziehbar?
Das Kontextmodell legt fest, was für die agentische Landschaft als Wahrheit gilt. Die SSoT ist kein zentraler Dokumentenserver, sondern ein Verzeichnis klar definierter Quellen mit Eigentumsregeln: wer darf ändern, wer liest, wer wird benachrichtigt. Artefakte werden referenziert, nicht kopiert; eine Kopie ist immer ein potenzieller Widerspruch zur Quelle.
Offene Formate sind Grundbedingung: Markdown, YAML, JSONL — maschinenlesbar, versionierbar, nicht exklusiv im Werkzeug. Jede Entscheidung über die Struktur des Kontextmodells ist selbst dokumentiert (Provenance), damit eine neue Session ohne Chathistorie den Stand rekonstruieren kann.
In I1 wird die Grundstruktur angelegt und die ersten Kernelemente befüllt. Das Modell wächst mit dem Plan; es wird nie als vollständig betrachtet, bevor alle Elemente mindestens einmal befüllt und durch ein Quality Gate gelaufen sind.
Je Planelement nachvollziehbar machen: wer hat wann welche Annahme eingebracht, aus welchem Kontext stammt sie, und was wurde daraus abgeleitet.
Provenance ist kein Selbstzweck — sie macht Entscheidungen revidierbar. Wenn ein Stakeholder-Profil auf einer Annahme beruht, die sich als falsch herausstellt, muss sichtbar sein, welche Folge-Artefakte auf dieser Annahme aufbauen. Ohne diesen Trail entsteht stille Fehlerfortpflanzung.
Der Audit-Trail ist leichtgewichtig: kein vollständiges Protokoll jedes Token, aber ein belastbarer Nachweis für jede strategische Annahme. Format: JSONL oder Frontmatter-Felder in Markdown-Dokumenten, maschinenlesbar, nicht im Werkzeug eingesperrt.
Das Ziel in I2 ist ein laufender Provenance-Layer für die bis dahin erzeugten Kontextelemente — nicht Vollständigkeit, sondern Konsistenz für alle Elemente, die im Quality Gate I2 bewertet werden.
Kontextfenster je Schritt gezielt befüllen: zur Laufzeit nachladen statt alles vorab zu laden. Größe des Fensters ist eine Ressourcenentscheidung, keine Designfrage.
Nicht jeder Schritt braucht den vollständigen Kontext. Der Retrieval-Layer beschafft je Anfrage das relevante Minimum: Auftragsklärung für die aktuelle Frage, Risikoeintrag für das aktuelle Element, Stakeholder-Profil für den aktuellen Adressaten. Vorab-Befüllung des Fensters erzeugt Token-Kosten ohne Nutzenzuwachs.
Die Optimierung hat zwei Richtungen: Relevanz (welche Kontextelemente sind für diesen Schritt nötig) und Länge (wie kurz kann ein Kontextelement sein, ohne Präzision zu verlieren). Komprimierte Kontextelemente — Zusammenfassungen, extrahierte Metazeilen — sparen Fenster, ohne Information zu verlieren, wenn die Rohdatei nachgeladen werden kann.
In I3 wird die Grundmechanik für den retrieval-gesteuerten Zugriff auf CTX-1 implementiert, zunächst für die Use Cases UC-2 und UC-4. Erweiterung auf weitere Ströme in I4.
Vertraulichen Kontext lokal halten; lokal abstrahieren, bevor ein Cloud-Schritt nötig ist. Keine Klartext-Geheimnisse in Cloud-Anfragen.
Manche Kontextelemente dürfen die lokale oder server-seitige Umgebung nicht verlassen — personenbezogene Daten, vertrauliche Geschäftszahlen, Inhalte mit hoher Datenklasse nach INF-1. Für Cloud-Schritte, die Teile dieses Kontexts brauchen, wird ein Abstraktions-LLM lokal eingesetzt: es erzeugt eine entpersonalisierte oder abstrahierte Fassung, die Cloud-sicher ist. Die Rohdatei bleibt lokal.
Das Abstraktions-Muster muss selbst auditierbar sein: welche Fassung wurde für welche Cloud-Anfrage verwendet, und wann wurde die Abstraktion erzeugt? Damit ist nachweisbar, dass keine vertraulichen Rohdaten die Grenze überschritten haben. Das Muster wird in GOV-1 als Leitplanke formalisiert und in INF-1 als Routing-Regel verankert.
In I3 wird das Muster für mindestens einen Use Case prototypisch umgesetzt: ein Schritt, der vertraulichen Kontext braucht und trotzdem eine Cloud-Anfrage stellt, muss den Abstraktions-Layer durchlaufen.
Zugriff an Datenklasse, Provenance und Aufgabe knüpfen statt an starre Hierarchie. Wer welchen Kontext sehen darf, folgt aus dem Need-to-Know, nicht aus der Orgchart-Position.
Klassische Rollensysteme bilden Hierarchien ab, nicht Wissensbedarfe. Ein Datenschutzbeauftragter braucht Zugriff auf Verarbeitungsverzeichnisse, nicht auf das gesamte Projektplan-Repository. Ein externer Berater braucht Use-Case-Specs, keine Kostendaten. Das Rechtekonzept orientiert sich an der Datenklasse des Kontextelements und dem Aufgabenkontext des Zugreifenden — dynamisch, nicht statisch.
Die Umsetzung ist modular: Datenklassen-Matrix (INF-1) definiert, welche Klasse welche Zugriffsanforderung hat. Provenance (CTX-2) dokumentiert, wer welchen Kontext eingebracht hat und wer informiert werden muss bei Änderungen. Das Rechtekonzept bindet beide Schichten zusammen, ohne eine eigene Rechteverwaltungsinfrastruktur aufzubauen.
In I4 wird das Konzept für die ersten produktiven Use Cases angewendet: wer hat Lesezugriff auf welche Kontextelemente in UC-2 und UC-4, und wie wird das zur Laufzeit geprüft?
Platzhalter — Volltextsuche und semantisches Retrieval über den gesamten Kontext-Pool für I6.
Dieses Paket ist ein Platzhalter. Der Umfang wird in I4 geschärft, wenn CTX-3 (Laufzeit-Kontextbeschaffung) abgenommen ist und der Kontext-Pool groß genug ist, um Retrieval-Methoden sinnvoll zu benchmarken.
Geplanter Scope: BM25-Index über Markdown-Artefakte (schnell, deterministisch, kein Embedding nötig); semantisches Retrieval (Vektor-Ähnlichkeit) als Ergänzung für unscharfe Anfragen; Evaluations-Framework (Recall@K, MRR) als Gate vor produktivem Einsatz.
Platzhalter bis I4 — Scope wird dann aus CTX-3-Erfahrungen abgeleitet.
Platzhalter — Strukturierter Wissensgraph und Vektor-Datenbank für relationale Kontextabfragen in I7.
Dieses Paket ist ein Platzhalter. Es baut auf CTX-6 auf und setzt voraus, dass der Kontext-Pool groß genug ist, um Graphstruktur sinnvoll zu nutzen.
Geplanter Scope: Wissensgraph (Entitäten: AP, Stakeholder, Risiko, Entscheidung; Relationen: hängt-ab-von, betrifft, widerspricht); Vektor-Index für semantische Ähnlichkeitssuche; Abfrage-Interface für Agenten (kein direktes SQL, sondern Abfragemuster nach Kontext).
Platzhalter bis I6 — Scope wird dann aus CTX-6-Erfahrungen abgeleitet.
Welche Daten wohin dürfen: Datenklassen-Matrix als verbindliche Grundlage für jede Routing-Entscheidung in der agentischen Landschaft.
Ohne Datenklassen-Matrix ist jede Routing-Entscheidung eine Ermessensentscheidung — damit nicht reproduzierbar und nicht auditierbar. Die Matrix kategorisiert alle Projektdaten in mindestens drei Klassen: öffentlich (Cloud zulässig), intern (Server zulässig, kein Cloud-Egress), vertraulich (nur lokal). Je Klasse gibt es eine Default-Route, die ohne weitere Prüfung gilt, und eine Ausnahme-Route, die HITL-Freigabe erfordert.
Die Matrix ist kein einmaliges Artefakt — sie wächst mit dem Plan. In I1 werden die Kernklassen definiert und auf die ersten Kontextelemente angewendet (CTX-1). In I2 werden alle Arbeitspakete nach Klasse eingestuft und die Routing-Regel in die Plattform eingebaut (INF-2 folgt). Die Matrix ist das Gate vor jeder Cloud-Anfrage.
In I1 liefert dieses Paket Version 1 der Datenklassen-Matrix: Klassendefinitionen, Default-Routing, erste Einstufungen für CTX-1-Elemente. Änderungen an der Matrix sind versioniert und erfordern ab I2 LA-Freigabe.
Je Anbieter: realer Retention-Tier, Zero-Data-Retention-Nachweis, AVV — als belegte Governance-Tabelle, nicht als Vertrauen in Marketing-Versprechen.
Cloud-Anbieter haben unterschiedliche Retention-Regime: was länger als behauptet gespeichert wird, ist nicht kontrollierbar. Die Governance-Tabelle belegt je Anbieter den realen Retention-Tier (aus Vertrag oder technischer Dokumentation), ob Zero-Data-Retention buchbar ist und ob ein gültiger AVV vorliegt. Ist einer dieser drei Punkte nicht belegt, gilt der Anbieter als nicht freigegeben für vertrauliche Klassen.
Die Tabelle ist lebendes Artefakt: Anbieter ändern ihre Bedingungen, neue Anbieter kommen hinzu. Sie wird je Iteration geprüft und bei Änderungen versioniert. Ein Änderungs-Alert greift, wenn ein Anbieter seinen Tier senkt oder einen bestehenden AVV nicht verlängert.
In I1 wird die Tabelle für die in INT-0 geklärten Anbieter erstellt. In I2 folgt die Verknüpfung mit INF-1: welche Klasse darf auf welchem Anbieter verarbeitet werden, und welche Anbieter sind für bestimmte Klassen strukturell gesperrt. EU-souveräne Hoster (etwa IONOS) werden als eigener Datenpfad neben Hyperscaler-Cloud und rein lokal in INF-8 bewertet.
Wo der Agent läuft und wo das Modell rechnet, sind zwei getrennte Entscheidungen. Aus ihrer Kombination ergeben sich die Datenpfade, die je Datenklasse zulässig sind.
Wo der Agent-Prozess läuft und wo das Modell rechnet, sind zwei getrennte Entscheidungen. Aus ihrer Kombination ergeben sich die tatsächlichen Datenpfade — und damit, was eine Datenklasse überhaupt verlassen darf. Drei Grundformen: (a) lokaler Agent mit lokalem Modell — der vertrauliche Kontext bleibt vollständig auf der eigenen Hardware; (b) lokaler Agent mit Cloud-Modell — die Orchestrierung läuft lokal, in die Cloud geht nur der einzelne Prompt, also genau das, was der Arbeitsschritt braucht; (c) Agent in der Cloud — der gesamte Arbeitskontext der Aufgabe liegt beim Anbieter. Die drei Formen unterscheiden sich vor allem darin, welcher Anteil des Kontexts wohin fließt — bei identischem Modell.
Quer zu dieser Topologie liegt das Retention-Spektrum des Anbieters: von Zero-Data-Retention (null Tage Vorhaltung) über kurze Abuse-Monitoring-Fenster bis zu 30 Tagen oder mehr. Für die Datenklasse zählt der real konfigurierte Tier, nicht der Default (Belege in INF-2). Topologie und Retention zusammen ergeben den zulässigen Datenpfad: ein lokaler Agent mit Cloud-Modell unter Zero-Retention ist ein anderer Pfad als ein Cloud-Agent ohne ZDR, auch wenn beide dasselbe Modell nutzen.
Als dritter Pfad neben rein lokal und Hyperscaler-Cloud werden EU-souveräne Hoster evaluiert: deutsche und europäische Anbieter (etwa IONOS mit seinem AI Model Hub sowie weitere DSGVO-konforme, behörden-taugliche Provider), die Inferenz innerhalb der EU mit klarer Auftragsverarbeitung anbieten. Sie tragen für Klassen, die nicht lokal bleiben müssen, aber den Hyperscaler-Pfad meiden sollen. Das Paket bewertet je Pfad Datenfluss, Retention, Vertragslage und Eignung je Datenklasse und liefert eine Pfad-Matrix, die in das Routing (INF-4) eingeht. In I2 werden Topologien und Kandidaten erfasst, in I3 gegen die Datenklassen-Matrix (INF-1) und die Provider-Governance (INF-2) bewertet. Die rechtliche Letztbeurteilung bleibt bei qualifizierten Anwälten.
Je Use Case lokal oder Cloud, gemessen an Vertraulichkeit, Qualität und Kosten. Kein Modell hartkodiert — Wechsel über Konfiguration.
Die Modell-Wahl ist eine Routing-Entscheidung, keine Designentscheidung. Je Use Case gelten drei Kriterien: Datenklasse des Kontexts (INF-1 bestimmt, ob Cloud zulässig ist), Qualitätsbedarf (reicht ein kleineres lokales Modell, oder ist Cloud-Modell für diese Aufgabe nötig) und Kosten (Token-Kosten je Cloud-Lauf vs. Latenz-Kosten lokal). Diese drei Kriterien werden je Use Case dokumentiert und ins Modell-Routing eingebaut.
Lokal bedeutet: Modelle der M5-Klasse (128 GB RAM, quantisierte Modelle bis ~70B Parameter). Cloud bedeutet: Anthropic, OpenAI oder vergleichbare Anbieter, nach INF-2 freigegeben. Das Routing ist konfigurierbar — ein Use Case kann in der Entwicklung lokal laufen und in I4 auf Cloud wechseln, ohne Code-Änderung.
In I2–I3 wird das Routing für UC-2 (Auftragsklärung) und UC-3 (Voice → Transkript) implementiert. Beide haben unterschiedliche Datenklassen und Qualitätsanforderungen — sie sind geeignete Benchmark-Kandidaten für das Routing-Muster.
Routing je Datenklasse + Orchestrierungsschicht mit belastbarer Observability. Kein Blindflug: jeder Agent mit Session, Kontext, Instruktion nachvollziehbar.
Die Plattform ist mehr als die Summe ihrer Werkzeuge — sie braucht eine Orchestrierungsschicht, die Agenten koordiniert, Kontexte zuteilt und Routing-Entscheidungen automatisiert. Diese Schicht ist von Anfang an observabel: welcher Agent läuft in welchem Kontext, mit welcher Instruktion, seit wann, mit welchen Kosten. Zombie-Agenten — laufend ohne Auftrag — sind erkennbar und beendbar.
Das Datenklassen-Routing aus INF-1 wird in der Orchestrierungsschicht als Hard Gate umgesetzt: jede Kontextanfrage prüft die Klasse, bevor sie an ein Modell weitergegeben wird. Das ist nicht die Plattform, die hofft, dass Agenten die Regeln einhalten — es ist eine technische Erzwingung. Die Schicht ist selbst auditierbar (INF-5).
In I3–I4 wird die Grundstruktur der Orchestrierungsschicht für die ersten produktiven Use Cases implementiert. Vollständige Robustheit (Failover, Multi-Agent, parallele Läufe) folgt in I5–I6.
Jeder Modell- und Datenfluss auditierbar protokolliert — Nachweis statt Behauptung. Offene Formate, kein Lock-in im Logging-Werkzeug.
Audit-Logging ist kein optionales Feature — es ist die technische Grundlage dafür, dass Compliance-Anforderungen (DSGVO, EU AI Act) belegt werden können, ohne auf Vertrauen in Prozesse angewiesen zu sein. Je Modell-Aufruf werden mindestens erfasst: Zeitstempel, Modell-ID, Eingabekontext (pseudonymisiert nach Datenklasse), Ausgabe-Hash, Kosten in Token und Euro, aufrufender Use Case.
Der Log ist unveränderbar — einmal geschrieben, nicht editierbar. Kompromittierung eines Eintrags ist erkennbar (Hash-Prüfung). Ablageformat: JSONL in offenen Formaten, lokal oder server-seitig nach Datenklasse der protokollierten Daten. Kein exklusiver Lock-in in einem Monitoring-Werkzeug.
In I3 wird das Logging für alle produktiven Use Cases implementiert, zusammen mit INF-4 (Orchestrierung). Ein erster Report-Lauf zeigt, ob Kosten- und Routing-Kennzahlen korrekt erfasst werden.
Platzhalter — Entscheidung über langfristiges Betriebsmodell nach Erfahrungen aus I1–I4.
Dieses Paket ist ein Platzhalter. Die Scope-Definition erfolgt in I4, wenn erste Betriebserfahrungen aus INF-4 und INF-5 vorliegen.
Geplanter Scope: Vergleich on-prem (eigene Hardware) vs. Cloud-native vs. Hybrid nach Kosten, Kontrolle, Wartungsaufwand und Skalierbarkeit; Entscheidung dokumentiert als ADR; Migrations-/Stabilitätspfad für den gewählten Weg.
Platzhalter bis I4.
Platzhalter — Robustheitsstufe: Off-Laptop-Backup, deterministische Werkzeuge für skalierenden Betrieb in I6–I7.
Dieses Paket ist ein Platzhalter. Scope wird in I5 nach Betriebsmodell-Entscheidung (INF-6) definiert.
Geplanter Scope: Off-Laptop-Git-Server für alle vertraulichen Artefakte; deterministische Build- und Deployment-Werkzeuge; Backup-Rhythmus und -Prüfung; Kapazitäts-Monitoring bei wachsendem Kontext-Pool.
Platzhalter bis I5.
Gesetze, Richtlinien und interne Dienstanweisungen erfassen, normalisieren und versionieren — als maschinenlesbare Grundlage für die agentische Compliance-Prüfung.
Compliance-Prüfung durch Agenten setzt voraus, dass der Prüf-Korpus selbst strukturiert, versioniert und referenzierbar vorliegt. Rohe PDF-Dokumente oder Intranet-Seiten ohne Struktur sind kein tauglicher Ausgangspunkt. Dieses Paket erschließt den Korpus: EU AI Act (Risikoklassen, Art. 4 Literacy), DSGVO (Verarbeitungsverzeichnis, DSFA-Pflicht), BetrVG §87, interne IT-Dienstanweisungen.
Erschließen bedeutet: Dokumente in maschinenlesbare Abschnitte zerlegen (Paragraphen, Erwägungsgründe, Dienstanweisungs-Artikel), mit IDs versehen, versionieren und in CTX-1 als Kontextelemente registrieren. Ändert sich ein Dokument, zeigt die Provenance-Kette (CTX-2), welche abgeleiteten Artefakte (DSFA, AVV, Stellungnahme) davon betroffen sind.
In I1–I2 werden die Kerndokumente erschlossen: EU AI Act Kernartikel, DSGVO Art. 6/9/13/28/35, BetrVG §87, IT-Dienstanweisung Cloud-Nutzung. Vollständigkeit des gesamten Regelwerks folgt in I3.
Auftragsverarbeitungsverträge je Provider und Datenschutz-Folgenabschätzung für den KI-Einsatz in bearbeitbare, agentisch prüfbare Form bringen.
Ein AVV, der als PDF in einem Intranet-Ordner liegt, ist für agentische Prüfung wertlos. Dieses Paket überführt AVVs je Provider (nach INF-2 identifiziert) und die DSFA in strukturierte, versionierte Artefakte: Je AVV eine Metazeile (Provider, Datum, Gültigkeitsdauer, Klassen-Freigabe, offene Klärungspunkte), je DSFA eine Bewertungsstruktur (Verarbeitung, Risiko, Maßnahme, Verantwortlicher).
Die DSFA ist kein einmaliges Dokument — sie wird angepasst, wenn sich der Verarbeitungskontext ändert (neuer Use Case, neue Datenklasse, neuer Anbieter). Strukturiert bedeutet: Frontmatter in Markdown oder YAML, maschinenlesbar, referenzierbar aus CMP-3 (agentische Prüfung). Änderungen an AVV oder DSFA lösen automatisch eine HITL-Benachrichtigung aus.
In I2 wird die DSFA-Erstfassung für den Verarbeitungskontext der ersten Use Cases erstellt (UC-2, UC-3). In I3 werden alle AVVs der bis dahin aktiven Anbieter strukturiert. Freigabe durch DSB und Legal ist Gate für UC-2-Produktivstart.
Prüfung in jeden Arbeitsschritt eingebaut — nicht als nachgelagerter Audit, sondern als inhärentes Gate. HITL ab definierter Schwere.
Compliance-Prüfung als nachgelagerter Schritt kommt zu spät: bis dahin sind Entscheidungen bereits getroffen, Kontext bereits verarbeitet. Inhärente Prüfung bedeutet, dass jeder relevante Arbeitsschritt die Prüfung als Teil seines Ablaufs enthält — nicht als Anhang. Welche Prüfungen für welchen Schritt nötig sind, leitet sich aus dem Prüf-Korpus (CMP-1) und der AVV/DSFA (CMP-2) ab.
Die Prüftiefe skaliert mit der Schwere: einfache Schritte bekommen eine schnelle Regel-Prüfung (ist der Kontext klassifiziert, ist der Provider freigegeben), komplexe Schritte bekommen eine tiefere Prüfung (DSFA-Konsistenz, HITL-Gate). HITL-Eskalation greift, wenn eine Prüfung nicht eindeutig entschieden werden kann oder wenn die Schwere-Schwelle überschritten ist.
In I3 wird die agentische Compliance-Prüfung für UC-2 (Auftragsklärung) implementiert. In I4 wird sie auf UC-4 (Statusberichte) ausgedehnt. Vollständige Abdeckung aller Use Cases in I5.
KI-Kompetenz-Anforderungen je Rolle ableiten und belegbar nachweisen — Art. 4 EU AI Act als Pflicht, nicht als Kulisse.
Art. 4 EU AI Act verpflichtet Betreiber von KI-Systemen, sicherzustellen, dass Personal im Umgang mit KI ausreichend kompetent ist. Was das je Rolle bedeutet, ist nicht im Gesetz definiert — es muss für jeden Kontext abgeleitet werden. Dieses Paket übersetzt Art. 4 in konkrete Kompetenz-Profile je Rolle im Vorhaben: Projektleitung, HITL-Verantwortliche, Use-Case-Betreibende, Governance-Rollen.
Belegbarkeit ist Pflicht: kein Schulungsnachweis-Theater, sondern nachweisliche Kompetenz-Verifikation. Das kann eine dokumentierte Einweisung sein, eine Prüfungsaufgabe, oder ein Nachweis aus einem bestehenden Schulungsprogramm. Der Nachweis ist je Person in CTX-2 protokolliert. Bei Rollenwechsel greift eine erneute Prüfung.
In I3 werden die Kompetenz-Profile erstellt und die erste Runde Nachweise für alle aktiven Rollen eingeholt. Die Compliance-Prüfung (CMP-3) prüft je Use-Case-Start, ob alle beteiligten Rollen nachgewiesen qualifiziert sind.
Wo Vorgaben hemmen und Nachteile gering sind: belegte Änderungsvorschläge erzeugen — nicht als Kritik, sondern als fundierte Entscheidungsvorlage.
Nicht alle hemmenden Vorgaben sind schlechte Vorgaben — manche sind Schutzmaßnahmen mit gutem Grund. Dieses Paket erzeugt Änderungsvorschläge nur, wenn drei Bedingungen erfüllt sind: die Vorgabe hemmt einen Use Case messbar, die Nachteile einer Änderung sind gering, und es gibt eine belegte Alternative (aus dem Compliance-Korpus oder externen Quellen).
Änderungsvorschläge werden als Entscheidungsvorlage aufbereitet: aktuelle Regelung, Hemmungs-Nachweis, Änderungsvorschlag, Risiko der Änderung, Empfehlung. Nicht als Beschwerde, sondern als Analyse mit Handlungsoption. Der Lenkungsausschuss entscheidet; das Vorhaben implementiert.
In I5 wird ein erster Durchlauf aller bis dahin identifizierten Hemmungen gemacht. Vorschläge mit besonders klarem Nutzenpotenzial werden priorisiert und zur LA-Sitzung I5 vorgelegt.
Platzhalter — Formales Freigabe-Gate für rechtlich kritische Entscheidungen und ein Rechtsregister als Nachschlagewerk in I6.
Dieses Paket ist ein Platzhalter. Scope wird in I4 nach CMP-3 definiert.
Geplanter Scope: Formaler Gate-Prozess für Use Cases und Integrationen mit rechtlichem Risiko; Rechtsregister als maschinenlesbares Verzeichnis aller abgeklärten Rechtsfragen mit Ergebnis und Datum.
Platzhalter bis I4.
Platzhalter — Prüfung, wem KI-generierte Outputs gehören und welche Lizenzbedingungen der eingesetzten Modelle gelten in I7.
Dieses Paket ist ein Platzhalter. Scope wird in I5 nach den ersten produktiven Use Cases definiert.
Geplanter Scope: Überblick Lizenzregime der eingesetzten Modelle (Training-Daten-Herkunft, Output-Lizenz, kommerzielle Nutzungsbedingungen); Richtlinie für KI-generierte Outputs im Projektkontext (Urheberschaft, Verwendungspflicht der Angabe).
Platzhalter bis I5.
Erste Use Cases nach drei Kriterien auswählen: niedrig-riskant (Datenklasse handhabbar), schnell wertschöpfend (Ergebnis in I2–I3 sichtbar), lehrreich (Plattform-Erkenntnisse für weitere Use Cases).
Nicht jeder mögliche Use Case ist der richtige erste Use Case. In einem Vorhaben, das gleichzeitig Unterbau baut und Use Cases liefern soll, braucht die Auswahl drei Kriterien: Das Risiko-Profil muss handhabbar sein (Datenklasse, HITL-Bedarf, Compliance-Betroffenheit), der Nutzen muss in I2–I3 sichtbar sein (kein Ergebnis in I7 für den ersten Use Case), und der Use Case muss Erkenntnisse liefern, die die Plattform für nachfolgende Use Cases verbessern.
Die Auswahl ist keine einmalige Entscheidung — das Use-Case-Portfolio wird je Iteration überprüft. Neue Kandidaten durchlaufen dasselbe Kriterien-Raster; Kandidaten, die nicht mehr passen, werden zurückgestellt oder gestrichen. Scope Creep beim Portfolio ist das häufigste Risiko in Phase I3–I5.
In I1 wird das Use-Case-Portfolio (UC-2 bis UC-7) anhand der Kriterien priorisiert. Das Ergebnis ist eine Priorisierungstabelle: Use Case, Kriterium-Scores, Startiteration, Verantwortlicher. UC-2 und UC-3 starten in I2.
Klärungsdialog zwischen Auftraggeber und Projektleitung → strukturierter Kontext → abgeleitete Klärungsfragen je Element. Ergebnis: Kontextmodell stärker als vorher.
Die Auftragsklärung ist der schwerste Schritt im Projektplanungszyklus — und am häufigsten der unschärfste. Klärungsfragen helfen, Annahmen explizit zu machen, bevor der Plan darauf aufbaut. Dieser Use Case nimmt einen bestehenden Klärungsdialog (Meeting, Interview, Workshop-Transkript aus INT-5) und erzeugt daraus: einen strukturierten Kontext (was ist bekannt, was ist Annahme, was ist offen), und für jedes Element des PM-Zyklus abgeleitete Klärungsfragen — priorisiert nach Dringlichkeit.
Der Use Case ist read-only in Bezug auf das Produktivsystem der Organisation: es werden keine Entscheidungen in Fremdsysteme zurückgeschrieben. Die Ausgabe geht in den Kontext-Pool (CTX-1), wo sie vom nächsten Agenten-Schritt aufgenommen wird. HITL-Gate: eine Person prüft die generierten Fragen, bevor sie zum Auftraggeber gehen.
Voraussetzung für den Produktivstart: GOV-2 (Betriebsrat-Zustimmung) und CMP-2 (AVV/DSFA für den Verarbeitungskontext) sind abgenommen. In I2 wird der Use Case in einer Test-Runde mit internem Material geprüft; in I3 geht er in den produktiven Einsatz.
Meeting-Audio lokal in strukturierten, vertraulichkeitskonformen Kontext überführen. Parakeet TDT 0.6B v3 (nvidia/parakeet-tdt-0.6b-v3) via parakeet-mlx — keine Cloud für vertrauliche Inhalte.
Meetings, Workshops und Klärungsgespräche sind die reichsten Kontextquellen im Projekt — und die flüchtigsten. Ohne Transkription gehen Entscheidungen, Bedenken und implizites Wissen verloren oder werden falsch erinnert. Dieser Use Case macht die Meeting-Transkription zum Standardprozess: Audio lokal aufnehmen, lokal transkribieren, Transkript strukturieren und in CTX-1 registrieren.
Das STT-Modell ist Parakeet TDT 0.6B v3 (nvidia/parakeet-tdt-0.6b-v3) via parakeet-mlx auf Apple Silicon. Es läuft vollständig lokal — kein Audio verlässt das Gerät. Für nicht-vertrauliche Meetings kann Cloud-STT als Alternative konfiguriert werden, wenn INF-1 das erlaubt. Bestehende Captions/Untertitel werden bevorzugt vor eigenem Transkript.
Das strukturierte Transkript enthält: Zeitmarken, Sprecherkennung (wo möglich), identifizierte Entscheidungen und offene Punkte als maschinenlesbare Felder. Es fließt in CTX-1 als Kontextelement und steht UC-2 und UC-4 als Eingabe zur Verfügung. Rohdatei wird aufbewahrt, Transkriptionsquelle im Frontmatter.
Berichte aus dem Kontext verdichten — jede Aussage über Provenance belegbar. Kein Bericht ohne Quellenangabe, kein Bericht ohne HITL-Freigabe.
Statusberichte sind der häufigste Kommunikationskanal im Projekt — und oft der aufwändigste manuell zu erstellende. Dieser Use Case erzeugt einen Statusbericht-Entwurf aus dem Kontext-Pool: Stand je Strom, offene Gate-Blocker, Abweichungen gegen Baseline, nächste Meilensteine. Jede Aussage hat eine Provenance-Referenz (CTX-2): woher kommt die Information, wann war sie aktuell.
Der Entwurf ist ein Entwurf — er geht in HITL-Freigabe bevor er versendet wird. HITL-Verantwortlicher prüft: Sind alle kritischen Informationen vollständig? Gibt es Widersprüche zwischen Strom-Status und Gesamt-Status? Wird etwas beschönigt, was rot sein sollte? Die Freigabe wird in CTX-2 protokolliert.
In I3 wird der Use Case für den Lenkungsausschuss-Bericht implementiert. Das Gate-Protokoll zum Quality Gate I3 ist der erste produktive Lauf. In I4 wird der Use Case auf wöchentliche Statusberichte ausgedehnt.
Register KI-getrieben mitlaufen lassen — Änderungen nach GOV-1-Leitplanken, HITL bei strategischen Einträgen.
Risiken- und Stakeholder-Register sind klassische Artefakte, die am ersten Tag sehr gepflegt sind und dann in der Hektik des Projektalltags veralten. Dieser Use Case macht sie zu lebenden Dokumenten: bei jedem relevanten Kontext-Update (neues Meeting-Transkript, neue Stakeholder-Rückmeldung, neuer Compliance-Befund) prüft ein Agent, ob ein Eintrag anzupassen ist, und schlägt eine Änderung vor.
GOV-1 definiert die Leitplanken: Agenten schlagen vor, HITL entscheidet bei strategischen Einträgen (Stakeholder-Eskalation, neues kritisches Risiko). Nicht-strategische Updates (Aktualisierung eines Kontakts, Status-Change bei bestehendem Risiko) können mit niedrigerer HITL-Schranke behandelt werden.
In I3 wird der Use Case für das Risiken-Register implementiert. Stakeholder-Register folgt in I4, wenn der Use Case für Risiken stabil läuft und die HITL-Protokolle etabliert sind.
Abhängige Projektdokumente bei Quell-Änderung erkennen und angleichen — kein stilles Veralten von Folge-Dokumenten.
Wenn sich die Auftragsklärung in I3 ändert, betrifft das potenziell Ziele, Risiken, Stakeholder-Profil und Kostenplan. Manuell ist dieser Propagations-Schritt aufwändig und fehleranfällig — er wird oft ausgelassen. Dieser Use Case erkennt bei einer Quell-Änderung automatisch, welche Folgedokumente betroffen sind (via Provenance-Kette CTX-2) und erzeugt Aktualisierungs-Vorschläge.
Die Propagation ist konservativ: kein Dokument wird automatisch geändert. Der Vorschlag enthält: betroffenes Dokument, betroffene Stelle, vorgeschlagene Änderung, Begründung (welche Quell-Änderung hat das ausgelöst). HITL entscheidet je Vorschlag. Vorschläge ohne HITL-Entscheid nach 7 Tagen werden eskaliert.
In I4 wird der Use Case für die Propagation aus der Auftragsklärung implementiert. Es ist einer der komplexeren Use Cases — er setzt CTX-2 (Provenance) stabil voraus. Vollständige Propagation für alle 14 PM-Elemente folgt in I5–I6.
Platzhalter — Automatisierte Pflege der Iterations-Historie und Provenance-Kette für den gesamten Plan in I5.
Dieses Paket ist ein Platzhalter. Scope wird in I4 nach den Erfahrungen aus UC-2 bis UC-6 definiert.
Geplanter Scope: Automatisiertes Diff je Iteration (was hat sich im Plan geändert, warum); Iterations-Eintrag in die Historie (CTX-2); Provenance-Lücken im Plan erkennen und HITL auslösen.
Platzhalter bis I4.
Was darf die KI autonom: deterministisch vs. probabilistisch, Gates nach Reversibilität, HITL nach Schwere. Leitplanken sind schriftlich — nicht implizit.
Ohne explizite Leitplanken entscheiden Agenten nach Kontext, nicht nach Organisation. Leitplanken definieren, was automatisiert und was mit HITL läuft, welche Ausgaben vor Verwendung durch eine Person geprüft werden und welche Entscheidungen reversibel vs. irreversibel sind. Irreversible Entscheidungen (Daten gelöscht, Dokument versendet, Entscheidung protokolliert) bekommen immer ein HITL-Gate — keine Ausnahme.
Das deterministische vs. probabilistische Spektrum wird je Werkzeug explizit gemacht: ein Routing-Gate ist deterministisch (Hard Rule, keine LLM-Entscheidung), ein Entwurf-Generator ist probabilistisch (Ergebnis variiert, braucht HITL). Diese Unterscheidung verhindert, dass probabilistische Werkzeuge an Stellen eingesetzt werden, die Zuverlässigkeit erfordern.
In I1 werden die Leitplanken für die Use Cases UC-2 und UC-3 formuliert. In I2 folgt das vollständige Leitplanken-Dokument für alle Ströme. Das Dokument ist SSoT für GOV-4 (Management-Transparenz) und CMP-3 (Compliance-Prüfung).
Betriebsrat früh als Partner, nicht als Hürde am Ende. Material für eine Betriebsvereinbarung bereitstellen — transparent, überprüfbar, mit nachweisbaren Ausschlüssen.
Der Betriebsrat hat nach §87 BetrVG Mitbestimmungsrecht bei technischen Einrichtungen, die Verhalten oder Leistung überwachen können. KI-Systeme berühren dieses Recht nahezu immer. Eine frühe, transparente Einbindung ist kein Risiko, sondern die Grundlage dafür, dass das Vorhaben überhaupt starten kann, ohne später blockiert zu werden.
Das Material für die Betriebsvereinbarung enthält: Liste der eingesetzten Systeme, je System was es erfasst und was es nicht erfasst, welche Personendaten es verarbeitet, welche HITL-Rollen Zugriff haben und welche Ausschlüsse technisch implementiert sind (nicht nur zugesagt). Ausschlüsse sind belegt, nicht behauptet — der Betriebsrat erhält Zugang zum Audit-Log-Format als Verifikation.
In I1 findet die erste Informationssitzung mit dem Betriebsrat statt (orientierend, ohne formalen Beschluss). In I2 wird das Material für eine Betriebsvereinbarung vorgelegt. Produktivstart von UC-2 ist erst nach BR-Zustimmung oder nach Ablauf der Mitbestimmungsfrist.
Verschiebung vom Ausführen zum Entscheiden begleiten: KI übernimmt Routinen, Menschen übernehmen Urteilsvermögen. Kein Widerstand durch Überraschung.
Die größte Hürde bei KI-Einführung ist nicht die Technologie, sondern die Veränderung des Selbstverständnisses: wer heute Berichte zusammenstellt, prüft morgen KI-generierte Entwürfe. Das ist eine andere Tätigkeit, die andere Kompetenz verlangt. Change-Begleitung bedeutet: Rollen explizit machen (was tut die KI, was tut der Mensch), neue Kompetenz aufbauen (wie erkenne ich guten KI-Output, wie korrigiere ich ihn) und Vertrauen herstellen (durch nachvollziehbare Ausgaben mit Provenance).
Coaching ist keine einmalige Schulung — es ist ein laufender Prozess je Use Case. Vor dem ersten produktiven Lauf eines Use Cases erhält die HITL-Person eine geführte Einführung: was kann dieser Use Case, was sind seine bekannten Grenzen, wie ist das HITL-Gate gestaltet. Feedback aus dem Coaching fließt in GOV-4 (Leitplanken-Aktualisierung) zurück.
In I2 startet das Change-Programm mit den HITL-Rollen für UC-2 und UC-3. In I3 wird es auf alle produktiven Use Cases ausgedehnt. Das Programm ist dokumentiert und wiederholbar — nicht von einer einzelnen Person abhängig.
Permanente, automatisierte Sicht auf aktive Leitplanken und Erlaubnisse — für das Management, nicht nur für das Projektteam.
Management-Transparenz bedeutet, dass die Führungsebene jederzeit wissen kann, was die KI-Systeme dürfen und was nicht — ohne das Projektteam fragen zu müssen. Das ist kein Vertrauens-Proxy, sondern ein technischer Nachweis: aktive Leitplanken als maschinenlesbares Dokument, zuletzt geändert wann und von wem, mit welcher Begründung.
Das Leitplanken-Dokument aus GOV-1 wird zur Grundlage einer automatisierten Management-Ansicht: ein kompaktes Übersichtsdokument (HTML oder PDF), das bei jeder Leitplanken-Änderung neu generiert wird. Inhalt: welche Systeme aktiv sind, was sie dürfen und was nicht, welche HITL-Rollen existieren, wer Zugriff auf den Audit-Log hat.
In I3 wird die erste Version der Management-Ansicht generiert und dem Lenkungsausschuss vorgelegt. Sie ist ab dann ein fester Bestandteil des Iterations-Statusberichts.
Wer treibt, betreibt und verantwortet die KI-Governance nach Projektende. Verantwortung an Wirkungsfäden, nicht an Orgchart-Position.
Governance endet nicht mit dem Projekt. Nach I7 muss eine Struktur existieren, die Leitplanken aktuell hält, neue Use Cases bewertet, Compliance-Änderungen aufnimmt und das HITL-Qualitätsniveau sichert. Dieses Paket definiert das Betriebsmodell: welche Rollen welche Governance-Aufgaben übernehmen, in welchem Rhythmus, mit welchen Werkzeugen.
Das Modell unterscheidet: treibende Rollen (prüfen Leitplanken auf Aktualität, schlagen Anpassungen vor), betreibende Rollen (stellen den technischen Betrieb der Leitplanken-Erzwingung sicher) und verantwortende Rollen (entscheiden über Leitplanken-Änderungen, sind benachrichtigt bei Verstößen). Eine Rolle kann mehrere Funktion haben — aber jede Funktion braucht genau eine verantwortliche Person.
In I3 wird das Betriebsmodell dokumentiert und den identifizierten Personen zur Bestätigung vorgelegt. Es ist Gate für die Projektübergabe in I7: kein Abschluss ohne bestätigtes Betriebsmodell.
Platzhalter — Systematisches Messen des Governance-Reifegrads und der KPI-Erfüllung über die Iterationen.
Dieses Paket ist ein Platzhalter. Scope wird in I4 nach GOV-4 und GOV-5 definiert.
Geplanter Scope: Reifegrad-Skala für Governance (1–5) je Dimension (Leitplanken-Qualität, HITL-Abdeckung, Transparenz, Compliance-Erfüllungsgrad); KPI-Tracking über Iterationen; automatisch generierter Reifegrad-Report je Iteration.
Platzhalter bis I4.
Platzhalter — Einheitliches Cockpit für Agenten-Betrieb, Orchestrierung und Leitplanken-Monitoring in I7.
Dieses Paket ist ein Platzhalter. Scope wird in I5–I6 nach Erfahrungen aus INT-4, GOV-4, GOV-5 definiert.
Geplanter Scope: Ein zentrales Cockpit, das Agenten-Betrieb (läuft, gestoppt, Fehler), Ressourcen (Token, Kosten), Leitplanken-Status (aktiv, verletzt, aktuell) und Management-Sicht (GOV-4) in einer Ansicht vereint. Nicht gebaut auf einem einzigen Dashboard-Werkzeug, sondern als Schicht über offenen Daten.
Platzhalter bis I5.
Den Startpunkt gemeinsam modellieren. Offene Klärungen schließen, um die nächsten Iterationen zu schärfen. Querfeldein, ein Durchgang.
Datenklassen. Lokal / Org-Server / Cloud. Zero-Retention-Nachweis je Anbieter.
DSGVO · EU AI Act · Mitbestimmung. Wer gibt frei: Legal, Datenschutz, Betriebsrat.
Lokal (Rechner der M5-Klasse) gegen Cloud mit geklärter Governance. Budgetrahmen.
Wo entsteht schnell operativer Nutzen, ohne auf die volle Klärung zu warten.
Woher kommt Kontext. Wer darf was sehen. Schluss mit Kopieren.
Wer baut und kuratiert den Unterbau. Projektleiter als Kontextkurator. Einbindung Betriebsrat / HR.
Deterministisch gegen probabilistisch. Gates und Human-in-the-Loop. Mechanismen zum Wieder-Einfangen.
Was wir als Nächstes schärfen. Welche Entscheidungen anstehen und bei wem.
Ein geschärfter Startpunkt, ein paar entschiedene Use Cases, klare offene Punkte mit Verantwortlichen — als Kontext für die nächste Iteration des Projektplans.
Iterations-Gantt über sechs Ströme: CTX · INF · INT · CMP · UC · GOV. Kritischer Pfad (CPM) automatisch berechnet. Hover/Touch für Details. Zoom nur Cmd/Ctrl+Scroll.
| ID | Titel | Strom | Iteration | Status | Präzision |
|---|
Vier PSP-Varianten derselben Projektarbeit, unterschiedlich gegliedert. Blätter referenzieren AP-IDs aus den sechs Strömen.
Wie sich der Plan über die Dokument-Versionen verändert hat — welche Elemente präziser wurden, welche neu hinzukamen, was sich strukturell geändert hat.