ScaleTrust Archive

Abschlussveranstaltung des F&E‑Projekts ScaleTrust

3. März 2026

Die Abschlussveranstaltung mit über 25 Teilnehmenden des F&E‑Projekts ScaleTrust fand am 24. Februar 2026 in Leipzig statt und bot eine öffentliche Präsentation der zentralen Projektergebnisse.

Im Mittelpunkt der Veranstaltung standen die im Projekt entwickelten Ansätze, Ergebnisse und praktischen Erfahrungen sowie deren Bedeutung für den Aufbau vertrauenswürdiger Datentreuhandmodelle. Die Teilnehmenden erhielten umfassende Einblicke in Demonstratoren und konkrete Use Cases und konnten die Beiträge der beteiligten Projektpartner kennenlernen.

Besonders deutlich wurde, dass vertrauenswürdige Datentreuhandmodelle eine Schlüsselrolle für den sicheren und fairen Datenaustausch in datengetriebenen Ökosystemen spielen. Die vorgestellten Lösungen zeigten praxisnah, wie Vertrauen, Transparenz und Datenhoheit technisch und organisatorisch umgesetzt werden können.

Neben der Präsentation der Ergebnisse bot die Veranstaltung auch Raum für Austausch und Diskussion. Gemeinsam wurden zukünftige Entwicklungen, zentrale Herausforderungen und Potenziale von Datentreuhandmodellen beleuchtet.

Die Abschlussveranstaltung machte deutlich: Die im Projekt ScaleTrust entwickelten Ansätze liefern wichtige Impulse für einen verantwortungsvollen Umgang mit Daten und schaffen eine Grundlage für innovative, vertrauenswürdige Datenökosysteme.

Das InfAI beriet in dem Projekt ScaleTrust zur Architektur, unterstützte bei der Nutzung von Wissensgraphen und DCAT-AP.de und ergänzte einen Deep-Research-Agenten.

Mehr zu ScaleTrust:

ScaleTrust (Scalable Compliance and Leadership in Ethical Trusteeship) ist ein vom Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) aus Mitteln der Europäischen Union gefördertes Forschungs- und Entwicklungsprojekt mit dem Ziel, ein rechtssicheres, skalierbares und vertrauenswürdiges Datentreuhändermodell als Grundlage fairer und dezentraler Datenökosysteme zu etablieren.

Datentreuhänder agieren dabei als neutrale Intermediäre, die Daten im Auftrag der Dateneigentümer verantwortungsvoll verwalten und kontrolliert weitergeben. Das ScaleTrust-Projekt schafft den technischen, organisatorischen und rechtlichen Rahmen für einen fairen, anwendungs‑, sektoren- und länderübergreifenden Datenaustausch, beispielhaft in der Praxis in Datenräumen wie dem Green Deal Dataspace erprobt.

Unser Poster auf der SEMANTiCS 2025

14. August 2025

Unser Poster “Characterizing Knowledge Graph Tasks in LLM Benchmarks Using Cognitive Complexity Frameworks” wurde für die SEMANTiCS Konferenz am 03.–05. September 2025 in Wien angenommen.

Die Arbeit entstand im Rahmen der Projekte KupferDigital 2 und ScaleTrust. Hauptautorin Sara Todorovikj ist wissenschaftliche Mitarbeiterin und Doktorandin an der TU Chemnitz und wird das Poster vor Ort in Wien präsentieren. Co-Autoren sind Lars-Peter Meyer vom InfAI und Michael Martin, ebenfalls von der TU Chemnitz.

Wir freuen uns schon auf spannende Diskussionen mit der internationalen Community und richten ein großes Dankeschön an alle Beteiligten im Projektteam für die hervorragende Zusammenarbeit – und an die SEMANTiCS 2025 für die Möglichkeit, unsere Forschung vorzustellen!

Artikel „Assessing SPARQL capabilities of Large Language Models“ nun in den Workshop-Proceedings von NLP4KGc@SEMANTiCS24 veröffentlicht

12. Februar 2025

Grafik 1: Überblick zu den 4 betrachteten Task-Typen: Text2Sparql (T2S), Text2Answer (T2A), Sparql2Answer (S2A) und SparqlSyntaxFixing (SSF)

Unser bereits als Preprint veröffentlichter Artikel „Assessing SPARQL capabilities of Large Language Models“ (Lars-Peter Meyer, Johannes Frey, Felix Brei und Natanael Arndt 2024) ist nun offiziell veröffentlicht in den Proceedings des Workshop „NLP4KGC: 3rd International Workshop on Natural Language Processing for Knowledge Graph Creation in conjunction with SEMANTiCS 2024 Conference”. Wir stellen dort eine Ergänzung des LLM-KG-Bench-Frameworks vor, mit der die SPARQL-Fähigkeiten von großen Sprachmodellen (englisch: Large Language Modells, kurz: LLMs; englisch: Knowledge Graph, kurz: KG, deutsch: Wissensgraph) automatisiert gemessen werden können. Das LLM-KG-Bench-Framework ist ein am InfAI e. V. entwickeltes Werkzeug zum automatisierten Bewerten der Fähigkeiten von LLMs mit Wissensgraphen umzugehen. Wenn LLMs besser mit Wissensgraphen umgehen können, würden LLMs vielleicht weniger halluzinieren sowie die Arbeit mit Wissensgraphen für Menschen erleichtern können.

Das automatisierte Messen hilft dabei neue LLMs für fachspezifische Aufgaben objektiv einordnen zu können. Und durch die Automatisierung können viele Messwiederholungen durchgeführt werden, um trotz dem nichtdeterministischen Antwortverhalten von LLMs verlässliche Ergebnisse zu erhalten.

In der Welt von RDF-Wissensgraphen ist SPARQL die gebräuchlichste Schnittstelle und Abfragesprache. Deshalb geht es bei der nun vorgestellten Untersuchung um die Syntax und Semantik von SPARQL SELECT Anfragen. Diese wurden beispielhaft für insgesamt neun LLMs von OpenAI, Anthropic und Google gemessen. Basierend auf den in Grafik 1 dargestellten 4 Aufgabentypen wurden 13 verschiedene Aufgabenvarianten zu fünf verschiedenen Wissensgraphen betrachtet.

Grafik 2: Auszug aus dem Artikel mit Ergebnissen für den Bereich Text2Sparql(T2S). Die Ergebnisse sind als Boxplots gezeigt mit Kreuzen für einzelne Messwerte und Kreisen für den Mittelwert. Bei dem Score bedeutet 1 ein optimales Ergebnis, ein Score von 0,2 bedeutet ein syntaktisch richtiges aber semantisch falsches Ergebnis, ein Score von 0 wird bei Syntaxfehler vergeben. Für weitere Ergebnisse und Erläuterungen sei auf den vollständigen Artikel verwiesen.

Zentrales Ergebnis unserer Arbeit ist: Zwischen den einzelnen Aufgaben und LLMs gibt es große Unterschiede. Zusammenfassend kann man sagen, dass die besten der untersuchten aktuellen LLMs kaum Schwierigkeiten mit der Syntax haben, jedoch bei semantischen Aufgaben auf Herausforderungen stoßen. Für Details sei auf den frei verfügbaren Artikel und Repositorien verwiesen.

Die Arbeit wurde über verschiedene Projekte am InfAI e. V. gefördert: StahlDigital, ScaleTrust, KISS — KI-gestütztes Rapid Supply Network, CoyPu — Cognitive Economy Intelligence Plattform für die Resilienz wirtschaftlicher Ökosysteme.

Der Code zum LLM-KG-Bench-Frameworks ist bei Github sowie Zenodo zu finden und die vollständigen Ergebnisse wurden bei GitHub und Zenodo veröffentlicht.

Link zum Paper:

In den Proceedings: https://ceur-ws.org/Vol-3874/paper3.pdf

Unser Preprint: https://doi.org/10.48550/arXiv.2409.05925