Faktenbasierte Synthese bedeutet, dass eine maschinell erzeugte Zusammenfassung ausschließlich Aussagen enthält, die durch die zugrunde liegenden Quellen belegt sind. Sie ist das Gegenteil einer frei formulierten Antwort: Jeder Satz ist an Fakten gebunden, die zuvor aus den Originalbeiträgen extrahiert und geprüft wurden.
Das Grundproblem jeder Media Intelligence ist Masse. Zu einem einzigen Ereignis erscheinen oft hunderte Beiträge — teils Dubletten, teils widersprüchlich, teils mit unterschiedlichem Fokus. Wer daraus von Hand eine verlässliche Lage destilliert, braucht Stunden. Wer es naiv einer generativen KI überlässt, riskiert flüssig formulierte Erfindungen.
Schritt 1: Aus Beiträgen werden Stories
Bevor irgendetwas zusammengefasst wird, müssen zusammengehörige Beiträge erkannt werden. Wir bündeln sie zu einer Story über drei Signale, die gemeinsam betrachtet werden:
- Semantische Ähnlichkeit: Beiträge, die inhaltlich nah beieinander liegen, gemessen über Vektorabstände ihrer Bedeutung — nicht über bloße Wortgleichheit.
- Entitätenüberlappung: dieselben Personen, Organisationen und Orte deuten auf dasselbe Geschehen.
- Zeitliche Nähe: Ereignisse entfalten sich in einem Zeitfenster; ein Beitrag von vor drei Wochen gehört selten zur akuten Story.
Erst das Zusammenspiel macht das Clustering robust. Jedes Signal allein führt in die Irre — gemeinsam ergeben sie eine nachvollziehbare Gruppierung.
Schritt 2: Fakten extrahieren und prüfen
Aus den Beiträgen einer Story werden einzelne, überprüfbare Aussagen extrahiert. Entscheidend ist die Korroboration: Eine Aussage, die nur in einer einzigen Quelle steht, wiegt weniger als eine, die mehrere unabhängige Quellen tragen. So lassen sich belastbare Kernaussagen von Einzelmeinungen und Spekulation trennen, bevor überhaupt ein Wort zusammengefasst wird.
Fail loud statt still falsch
Reichen die belegten Fakten nicht aus, brechen wir lieber ab, als zu raten. Eine fehlende Synthese ist ehrlicher als eine erfundene.
Schritt 3: Synthese, an die Fakten gebunden
Erst jetzt entsteht Text — und auch hier nicht frei. Die Synthese formuliert ausschließlich auf Basis der zuvor geprüften Fakten und wird gegen sie abgesichert: auf Halluzinationen, auf unbelegte Behauptungen, auf vorsichtshalber-Formulierungen. Das Ergebnis ist eine Zusammenfassung, deren Aussagen sich auf die Originalquellen zurückführen lassen.
Wir reproduzieren dabei keine fremden Texte. Die Synthese ist eine eigenständige, faktenbasierte Verdichtung — kein zusammenkopierter Auszug. Dieser Unterschied ist uns rechtlich wie publizistisch wichtig.
Warum wir das so machen
Man könnte schneller und billiger arbeiten — einfach Beiträge in ein Sprachmodell geben und das Ergebnis veröffentlichen. Wir tun das bewusst nicht. Nachvollziehbarkeit ist für uns kein Feature, sondern die Bedingung dafür, dass Media Intelligence überhaupt vertrauenswürdig sein kann. Und sie deckt sich, wie wir an anderer Stelle über den AI Act geschrieben haben, zunehmend mit dem, was Regulierung verlangt.
Gute Methodik ist unsichtbar, solange sie funktioniert. Sichtbar wird sie erst im Vertrauen, das man dem Ergebnis entgegenbringen kann.