Artikel „Assessing SPARQL capabilities of Large Language Models“ nun in den Workshop-Proceedings von NLP4KGc@SEMANTiCS24 veröffentlicht 

Grafik 1: Überblick zu den 4 betra­chteten Task-Typen: Text2Sparql (T2S), Text2Answer (T2A), Sparql2Answer (S2A) und Spar­ql­Syn­tax­Fix­ing (SSF) 

Unser bere­its als Preprint veröf­fentlichter Artikel „Assess­ing SPARQL capa­bil­i­ties of Large Lan­guage Mod­els“ (Lars-Peter Mey­er, Johannes Frey, Felix Brei und Natanael Arndt 2024) ist nun offiziell veröf­fentlicht in den Pro­ceed­ings des Work­shop „NLP4KGC: 3rd Inter­na­tion­al Work­shop on Nat­ur­al Lan­guage Pro­cess­ing for Knowl­edge Graph Cre­ation in con­junc­tion with SEMAN­TiCS 2024 Con­fer­ence”. Wir stellen dort eine Ergänzung des LLM-KG-Bench-Frame­works vor, mit der die SPAR­QL-Fähigkeit­en von großen Sprach­mod­ellen (englisch: Large Lan­guage Mod­ells, kurz: LLMs; englisch: Knowl­edge Graph, kurz: KG, deutsch: Wis­sens­graph) automa­tisiert gemessen wer­den kön­nen. Das LLM-KG-Bench-Frame­work ist ein am InfAI e. V. entwick­eltes Werkzeug zum automa­tisierten Bew­erten der Fähigkeit­en von LLMs mit Wis­sens­graphen umzuge­hen. Wenn LLMs bess­er mit Wis­sens­graphen umge­hen kön­nen, wür­den LLMs vielle­icht weniger hal­luzinieren sowie die Arbeit mit Wis­sens­graphen für Men­schen erle­ichtern können. 

Das automa­tisierte Messen hil­ft dabei neue LLMs für fach­spez­i­fis­che Auf­gaben objek­tiv einord­nen zu kön­nen. Und durch die Automa­tisierung kön­nen viele Mess­wieder­hol­un­gen durchge­führt wer­den, um trotz dem nicht­de­ter­min­is­tis­chen Antwortver­hal­ten von LLMs ver­lässliche Ergeb­nisse zu erhalten. 

In der Welt von RDF-Wis­sens­graphen ist SPARQL die gebräuch­lich­ste Schnittstelle und Abfrage­sprache.  Deshalb geht es bei der nun vorgestell­ten Unter­suchung um die Syn­tax und Seman­tik von SPARQL SELECT Anfra­gen. Diese wur­den beispiel­haft für ins­ge­samt neun LLMs von Ope­nAI, Anthrop­ic und Google gemessen. Basierend auf den in Grafik 1 dargestell­ten 4 Auf­gaben­typen wur­den 13 ver­schiedene Auf­gaben­vari­anten zu fünf ver­schiede­nen Wis­sens­graphen betrachtet. 

Grafik 2: Auszug aus dem Artikel mit Ergeb­nis­sen für den Bere­ich Text2Sparql(T2S). Die Ergeb­nisse sind als Box­plots gezeigt mit Kreuzen für einzelne Mess­werte und Kreisen für den Mit­tel­w­ert. Bei dem Score bedeutet 1 ein opti­males Ergeb­nis, ein Score von 0,2 bedeutet ein syn­tak­tisch richtiges aber seman­tisch falsches Ergeb­nis, ein Score von 0 wird bei Syn­taxfehler vergeben. Für weit­ere Ergeb­nisse und Erläuterun­gen sei auf den voll­ständi­gen Artikel verwiesen. 

Zen­trales Ergeb­nis unser­er Arbeit ist: Zwis­chen den einzel­nen Auf­gaben und LLMs gibt es große Unter­schiede. Zusam­men­fassend kann man sagen, dass die besten der unter­sucht­en aktuellen LLMs kaum Schwierigkeit­en mit der Syn­tax haben, jedoch bei seman­tis­chen Auf­gaben auf Her­aus­forderun­gen stoßen. Für Details sei auf den frei ver­füg­baren Artikel und Repos­i­to­rien verwiesen. 

Die Arbeit wurde über ver­schiedene Pro­jek­te am InfAI e. V. gefördert: StahlDig­i­tal, ScaleTrust, KISS — KI-gestütztes Rapid Sup­ply Net­work, Coy­Pu — Cog­ni­tive Econ­o­my Intel­li­gence Plat­tform für die Resilienz wirtschaftlich­er Ökosysteme. 

Der Code zum LLM-KG-Bench-Frame­works ist bei Github sowie Zen­o­do zu find­en und die voll­ständi­gen Ergeb­nisse wur­den bei  GitHub und Zen­o­do veröffentlicht. 

Link zum Paper: 

Abschlusstreffen des CoyPu-Projektes

Am 26. Novem­ber waren wir von 10 bis 15 Uhr mit dem Coy­Pu-Pro­jekt beim Abschlusstr­e­f­fen in den Räu­men von ScaDS.AI Leipzig im Löhrs Carré.

Das Pro­gramm bot einen bre­it­ge­fächerten Ein­blick in das Pro­jekt. Nach ein­er Begrüßung gab Prof. Dr. Michael Mar­tin eine Zusam­men­fas­sung des Pro­jek­tes seit Beginn der Laufzeit, gefol­gt von einem Überblick über die Coy­Pu-Kern­daten­in­fra­struk­tur von Kurt Junghanns.

In den einzel­nen Ses­sions präsen­tierten die Forschungspart­ner außer­dem ihre Demon­stra­toren — unter anderem Claus Stadler mit der Präsen­ta­tion “InfAI Coy­pu Demos” und Sebas­t­ian Tramp mit “eccen­ca Cor­po­rate Mem­o­ry”. Weit­ere Demon­stra­toren wur­den von den Forschungspart­nern L3S Research Cen­ter, TIB, Hitec, DIW, Siemens, DATEV, Infi­neon und Implisense präsentiert.

Nach einem weit­eren Pro­gramm­punkt zu rechtlichen Aspek­ten im Coy­Pu-Pro­jekt von Frank Ingen­ri­eth (SRIW) fol­gte die finale Ses­sion mit ein­er Präsen­ta­tion über den Resilience Mesh von Prof. Dr. Michael Mar­tin und mit abschließen­den Dankesworten der Vertreterin vom Pro­jek­t­träger Deutsches Zen­trum für Luft- und Raum­fahrt (DLR) Petra Post.

Wir freuen uns über die zahlre­iche Teil­nahme an der span­nen­den Abschlussver­anstal­tung des CoyPu-Projektes.

CoyPu bei den Tagen der digitalen Technologien

Am 7. und 8. Okto­ber waren wir mit dem Coy­Pu-Pro­jekt bei den Tagen der dig­i­tal­en Tech­nolo­gien 2024 im bcc Berlin Con­gress Cen­ter, wo Mitar­bei­t­ende das Pro­jekt präsen­tiert haben. 

Die Tage der dig­i­tal­en Tech­nolo­gien, eine Ver­anstal­tung des Bun­desmin­is­teri­ums für Wirtschaft und Kli­maschutz (BMWK), standen dieses Jahr unter dem Mot­to “Trans­for­ma­tion durch Inno­va­tion — nach­haltig, sou­verän, ver­net­zt” und beschäftigten sich mit den The­men Dig­i­tal­isierung, Nach­haltigkeit und Innovation.

An zwei Tagen wur­den Fra­gen, wie zum Beispiel die erfol­gre­iche Inte­gra­tion neuer dig­i­taler Tech­nolo­gien in die unternehmerische Prax­is oder welche Chan­cen gen­er­a­tive KI dem Mit­tel­stand bietet, umfassend diskutiert.

Am Coy­Pu-Stand haben sich während der Ver­anstal­tungstage die Part­ner InfAI, Infi­neon, L3S Research Cen­ter sowie DATEV präsen­tiert. Außer­dem hat Prof. Dr. Michael Mar­tin am zweit­en Ver­anstal­tungstag am Fach­fo­rum “Dig­i­tale Plat­tfor­men und Ökosys­teme zum Erfolg brin­gen” teilgenommen.

Wir freuen uns, dass wir Teil dieser span­nen­den Ver­anstal­tung waren, welche neben span­nen­den Diskus­sio­nen und Präsen­ta­tio­nen auch eine ide­ale Gele­gen­heit für Ver­net­zung und Aus­tausch bot. Das kom­plette Pro­gramm kann hier noch ein­mal nachge­le­sen werden. 

Weit­ere Infor­ma­tio­nen zur Ver­anstal­tung sind auf der Web­site zu finden.

Michael Mar­tin (InfAI) und Ahmad Sakor (L3S, TIB)

Workshop Krisenresilienz @ Data Week Leipzig 2024

Am 15. April haben wir im Rah­men der Data Week Leipzig mit dem Coy­Pu-Pro­jekt einen Work­shop zur Krisen­re­silienz organ­isiert. Ver­schiedene Pro­jek­te aus dem 3. Förder­aufruf des KI-Inno­va­tion­swet­tbe­werbs vom BMWK haben viel­seit­ige Anwen­dungs­felder und Demon­stra­toren vorgestellt. In dem 90-minüti­gen Work­shop kon­nten wir mit drei Vorträ­gen einen Ein­blick in die Ein­satzmöglichkeit­en der entste­hen­den Dash­boards und Plat­tfor­men geben und darüber hin­aus bere­its fer­tige Arbeit­sergeb­nisse präsentieren.

Eröffnet wurde die Vor­tragsrei­he durch Fatih Kil­ic (Insti­tut für Ange­wandte Infor­matik e.V.) und Julia Lücke (Ger­man Insti­tute for Eco­nom­ic Research (DIW Berlin)), die über “Risiken von Liefer­ket­ten­ab­hängigkeit­en regionaler Wirtschaft­sräume erken­nen — Dash­board für die Resilienz der säch­sis­chen Wirtschaft” sprachen. 

Anknüpfend daran fol­gte der Beitrag “Von glob­alen Net­zw­erken zur lokalen Resilienz: Ver­ständ­nis der Liefer­ket­tenkom­plex­ität in Not­fall­si­t­u­a­tio­nen” von Paul Geo­erg (Vere­ini­gung zur Förderung des Deutschen Brand­schutzes e.V.). Anhand von prax­is­na­hen Beispie­len erläuterte er dabei die Prob­lematik der man­gel­nden Trans­parenz und die damit ver­bun­de­nen Schwach­stellen in glob­alen Liefer­ket­ten, welche in den aktuellen Zeit­en glob­aler Krisen deut­lich werden. 

Im drit­ten und let­zten Vor­trag sprach Rolf Fricke (Con­dat) über das Pro­jekt ResKriV­er, wobei er das The­ma “Social Media Mon­i­tor­ing für Leit­stellen und Krisen­stäbe” beleuchtete. Der Fokus lag in sein­er Präsen­ta­tion auf der Rel­e­vanz des Social Media Mon­i­tor­ings, welch­es in Krisen­zeit­en dabei helfen soll, Prob­leme in betrof­fe­nen Gebi­eten zu erken­nen und konkrete Maß­nah­men ver­an­lassen zu können.

Wir freuen uns, dass wir mit unserem Work­shop Teil der Data Week Leipzig waren und mit unseren Pro­jek­ten einen bre­it­ge­fächerten Ein­blick in das The­ma Krisen­re­silienz geben konnten.

Wir bedanken uns bei allen Vor­tra­gen­den und Teil­nehmenden für den span­nen­den Workshop.

Die Folien zum Work­shop wer­den in Kürze hier bere­it­gestellt: https://2024.dataweek.de/2024–04-15/Ratsplenarsaal.html#11:00

Veranstaltung “KI-Krisenresilienzplattformen: Chancen und Herausforderungen” in Berlin

Am 27. Novem­ber 2023 haben wir in Berlin beim Deutschen Zen­trum für Luft- und Raum­fahrt e.V. an ein­er span­nen­den Ver­anstal­tung zur Vere­in­barkeit von Recht und Prax­is im Forschung­spro­jekt Coy­Pu teilgenom­men. Diese ganztägige Ver­anstal­tung „KI – Krisen­re­silien­z­plat­tfor­men: Chan­cen und Her­aus­forderun­gen“ wurde vom Selb­streg­ulierung Infor­ma­tion­swirtschaft e.V. (SRIW) organ­isiert und bot einen Überblick über das Krisen­re­silien­zpro­jekt Cog­ni­tive Econ­o­my Intel­li­gence Plat­tform für die Resilienz wirtschaftlich­er Ökosys­teme (Coy­Pu). Im Laufe des Fach­tages wur­den in ver­schiede­nen Keynotes und Pan­eld­iskus­sio­nen daten­schutzrechtliche Fragestel­lun­gen im Kon­text von KI-basierten Krisen­re­silien­z­plat­tfor­men the­ma­tisiert. The­men­schw­er­punk­te waren unter anderem die aktuellen Entwick­lun­gen der EU – Geset­zesvorhaben im Bere­ich KI sowie Ver­hal­tensregeln als Chance für die Prax­is. Disku­tiert wur­den außer­dem Fra­gen nach der Her­aus­forderung bei der Ver­wen­dung von KI im Daten­schutz und nach der Anonymisierung und Pseu­do­nymisierung von Daten.

Agenda

Es waren hochkarätige Rechtsexpert:innen aus den Bere­ichen Forschung und Wirtschaft anwe­send, wie beispiel­sweise Dr. Thomas Niet­zsche (Part­ner, K&L Gates), Fred­erik Richter, LL.M. (Stiftung Daten­schutz, Vor­stand), Rebek­ka Weiß, LL.M. (Bitkom e.V., Lei­t­erin Ver­trauen & Sicher­heit) sowie Jörn Wittmann (Volk­swa­gen AG, Head of Pri­va­cy Leg­isla­tive Strat­e­gy & Pub­lic Affairs). Eröffnet wurde das Meet­ing durch das Gruß­wort von Her­rn Dr. Klaus Glas­mach­er vom BMWK — Bun­desmin­is­teri­um für Wirtschaft und Kli­maschutz. Danach hat unser Mitar­beit­er Kurt Jung­hanns die Keynote „Vorstel­lung des Krisen­re­silien­zpro­jek­ts Coy­Pu“ gehal­ten und eine all­ge­meine Ein­führung zum Pro­jekt gegeben. Anschließend fol­gten die Keynote-Präsen­ta­tio­nen „Krisen­re­silienz im Mit­telpunkt von KI-Plat­tfor­men“, „Resilienz­man­age­ment aus Unternehmensper­spek­tive“ und „Methodik und Her­aus­forderung bei der Iden­ti­fizierung rechtlich­er Fragestel­lun­gen im Rah­men des Pro­jek­tes“. Nach der Mit­tagspause fan­den drei Pan­eld­iskus­sio­nen mit inter­es­san­ten Gespräch­srun­den zu den Fragestel­lun­gen „KI quo vadis?“, „Daten­schutz — Fluch oder Segen für KI-Sys­teme?“ und dem The­ma „Pseu­do­nymisierung und Anonymisierung von Dat­en“ statt.

Wir bedanken uns beim SRIW e.V. und allen Teil­nehmenden und Organisator:innen für den span­nen­den Veranstaltungstag.