Grundidee der EvidenceSeeker DemoApp

Die EvidenceSeeker Demoapp illustriert, wie man mit Hilfe der EvidenceSeeker Boilerplate KI Fact-Checking Tools aufsetzen kann, die prüfen, in welchem Grad eine beliebige Aussage über eine gegebene Wissensbasis gestützt oder widerlegt wird.

Einsatz von generativer KI

Die EvidenceSeeker Pipeline verwendet generative Sprachmodelle und geht bei der Prüfung einer Aussage in folgenden Schritten vor:

Voranalyse: Die Pipeline findet in einem ersten Schritt unterschiedliche Interpretationen der Eingabe und unterscheidet dabei deskriptive, zuschreibende und normative Aussagen.
Extraktion: Für die gefundenen deskriptiven und zuschreibenden Interpretationen wird dann in einer Wissensbasis nach relevanten Textstellen gesucht und analysiert, inwiefern die Textstellen die gefundene Interpretation bestätigen oder widerlegen.
Evidenzanalyse: Diese Einzelanalysen werden für jede Interpretation in Form eines Bestätigungslevels von insgesamt 7 aggregiert:
- 'im hohen Maße bestätigt',
- 'bestätigt',
- 'im geringen Maße bestätigt',
- 'weder bestätigt noch widerlegt',
- 'im niedrigen Maße widerlegt',
- 'widerlegt', und
- 'im hohen Maße widerlegt'.

Nähere Informationen zur Pipeline findest Du hier.

Verwendete Modelle und Wissensbasis:

In dieser Demo App verwenden wir:
- Kimi-K2-Instruct als generatives Sprachmodell für die Voranalyse,
- paraphrase-multilingual-mpnet-base-v2 als Embedding Modell für die Extraktion und
- Llama-3.3-70B-Instruct als generatives Sprachmodell für die Evidenzanalyse.
Als Wissensbasis dienen alle Ausgaben von "Aus Politik und Zeitgeschichte" (APuZ) aus dem Jahr 2024 (Link). APuZ wird von der Bundeszentrale für politische Bildung herausgegeben.

Hintergrund des EvidenceSeeker Projekts

Die EvidenceSeeker-Pipeline wurde im Rahmen des KIdeKu-Projekts am Karlsruher Institut für Technologie entwickelt. KIdeKu wird gefördert vom BMBFSFJ.

Nähere Informationen zur EvidenceSeeker Boilerplate findest Du hier.