SPARQL Archive

We’re excited to announce the release of graphql4sparql 0.7.0 — a fast, streaming GraphQL-to-SPARQL rewriting system that brings the power of GraphQL to query SPARQL endpoints and RDF data.

What is graphql4sparql?

graphql4sparql transforms GraphQL queries into SPARQL queries at runtime, enabling you to:

Query SPARQL endpoints using intuitive GraphQL syntax
Define custom mappings between GraphQL fields and SPARQL graph patterns
Leverage RDF’s flexibility while enjoying GraphQL’s declarative querying
Get JSON responses directly from SPARQL endpoints with streaming performance

The system doesn’t use GraphQL-Java’s execution engine. Instead, it rewrites GraphQL documents into SPARQL queries and post-processes the result sets — a more efficient approach for RDF data.

Key Features

Declarative SPARQL Mapping with GraphQL Directives

graphql4sparql introduces a powerful set of GraphQL directives for mapping to SPARQL patterns, such as:

@prefix — Define namespace prefixes for your queries
@pattern — Map GraphQL fields to SPARQL graph patterns
@bind — Bind SPARQL expressions to fields (e.g., generating IDs from entity URIs)
@one / @many — Control field cardinality for single or multiple values
@join — Explicitly define how parent and child fields join
@index — Transform query results into indexed JSON objects
@array — Flatten sub-fields into a single array (field name becomes array container)

Apache Jena Fuseki Integration

The release includes a fully functional Fuseki plugin that adds a native GraphQL endpoint type to Apache Jena Fuseki server. You can configure it with a simple Turtle configuration file and start querying your RDF data with GraphQL immediately.

See our example setup for a complete working configuration with demo data.

Schema Generator

Generate GraphQL schemas from your RDF data with the graphql4sparql schemagen CLI tool. This removes the need to write SPARQL patterns manually and provides type-safe querying out of the box.

Example Usage

Once the Fuseki plugin is configured, you can query your RDF data with simple GraphQL syntax:

query Works @pretty @debug {
  Work {
    type
    title
    creator
  }
}

Or use the sophisticated @index directive to group data by subjects and predicates:

query spo {
  subjects @pattern(of: "SELECT DISTINCT ?s { ?s ?p ?o } ", to: "s") 
           @index(by: "?s", oneIf: "true") {
    predicates @pattern(of: "?s2 ?p2 ?o2", from: "s2", to: "o2") 
               @index(by: "?p2", oneIf: "false") {
      objects @bind(of: "?o2")
    }
  }
}

Getting Started

With Apache Jena Fuseki

Download the graphql4sparql-fuseki-plugin JAR
Place it in Fuseki’s run/extra directory
Configure your Fuseki service with the GraphQl4Sparql endpoint
Start querying at http://localhost:3030/your-service/graphql

See our example setup for a complete, working configuration.

Technical Highlights

Fast streaming: Generates efficient SPARQL queries without breaking them into multiple requests and processes results as they arrive from the SPARQL endpoint
Bleeding-edge SPARQL features: Leverages cutting-edge SPARQL extensions like LATERAL joins. Note: These features may not be universally supported across all SPARQL engines
Apache Jena & GraphQL-Java: Built on proven, widely-used libraries

Resources

GitHub Repository

Acknowledgments

graphql4sparql is developed and maintained by the AKSW research group at the Institute for Applied Informatics.

This work was partially supported by grants from the German Federal Ministry of Transport (BMV) under the program mFund to the MobyDex project (19F2266A).

Grafik 1: Überblick zu den 4 betrachteten Task-Typen: Text2Sparql (T2S), Text2Answer (T2A), Sparql2Answer (S2A) und SparqlSyntaxFixing (SSF)

Unser bereits als Preprint veröffentlichter Artikel „Assessing SPARQL capabilities of Large Language Models“ (Lars-Peter Meyer, Johannes Frey, Felix Brei und Natanael Arndt 2024) ist nun offiziell veröffentlicht in den Proceedings des Workshop „NLP4KGC: 3rd International Workshop on Natural Language Processing for Knowledge Graph Creation in conjunction with SEMANTiCS 2024 Conference”. Wir stellen dort eine Ergänzung des LLM-KG-Bench-Frameworks vor, mit der die SPARQL-Fähigkeiten von großen Sprachmodellen (englisch: Large Language Modells, kurz: LLMs; englisch: Knowledge Graph, kurz: KG, deutsch: Wissensgraph) automatisiert gemessen werden können. Das LLM-KG-Bench-Framework ist ein am InfAI e. V. entwickeltes Werkzeug zum automatisierten Bewerten der Fähigkeiten von LLMs mit Wissensgraphen umzugehen. Wenn LLMs besser mit Wissensgraphen umgehen können, würden LLMs vielleicht weniger halluzinieren sowie die Arbeit mit Wissensgraphen für Menschen erleichtern können.

Das automatisierte Messen hilft dabei neue LLMs für fachspezifische Aufgaben objektiv einordnen zu können. Und durch die Automatisierung können viele Messwiederholungen durchgeführt werden, um trotz dem nichtdeterministischen Antwortverhalten von LLMs verlässliche Ergebnisse zu erhalten.

In der Welt von RDF-Wissensgraphen ist SPARQL die gebräuchlichste Schnittstelle und Abfragesprache. Deshalb geht es bei der nun vorgestellten Untersuchung um die Syntax und Semantik von SPARQL SELECT Anfragen. Diese wurden beispielhaft für insgesamt neun LLMs von OpenAI, Anthropic und Google gemessen. Basierend auf den in Grafik 1 dargestellten 4 Aufgabentypen wurden 13 verschiedene Aufgabenvarianten zu fünf verschiedenen Wissensgraphen betrachtet.

Grafik 2: Auszug aus dem Artikel mit Ergebnissen für den Bereich Text2Sparql(T2S). Die Ergebnisse sind als Boxplots gezeigt mit Kreuzen für einzelne Messwerte und Kreisen für den Mittelwert. Bei dem Score bedeutet 1 ein optimales Ergebnis, ein Score von 0,2 bedeutet ein syntaktisch richtiges aber semantisch falsches Ergebnis, ein Score von 0 wird bei Syntaxfehler vergeben. Für weitere Ergebnisse und Erläuterungen sei auf den vollständigen Artikel verwiesen.

Zentrales Ergebnis unserer Arbeit ist: Zwischen den einzelnen Aufgaben und LLMs gibt es große Unterschiede. Zusammenfassend kann man sagen, dass die besten der untersuchten aktuellen LLMs kaum Schwierigkeiten mit der Syntax haben, jedoch bei semantischen Aufgaben auf Herausforderungen stoßen. Für Details sei auf den frei verfügbaren Artikel und Repositorien verwiesen.

Die Arbeit wurde über verschiedene Projekte am InfAI e. V. gefördert: StahlDigital, ScaleTrust, KISS — KI-gestütztes Rapid Supply Network, CoyPu — Cognitive Economy Intelligence Plattform für die Resilienz wirtschaftlicher Ökosysteme.

Der Code zum LLM-KG-Bench-Frameworks ist bei Github sowie Zenodo zu finden und die vollständigen Ergebnisse wurden bei GitHub und Zenodo veröffentlicht.

Link zum Paper:

In den Proceedings: https://ceur-ws.org/Vol-3874/paper3.pdf

Unser Preprint: https://doi.org/10.48550/arXiv.2409.05925

Schlagwort: SPARQL

graphql4sparql 0.7.0 Released

Artikel „Assessing SPARQL capabilities of Large Language Models“ nun in den Workshop-Proceedings von NLP4KGc@SEMANTiCS24 veröffentlicht