Wir freuen uns, den Beginn des Projektes “Materialdatenraum zur Steigerung von Effizienz und Nachhaltigkeit des Kupferlebenszyklus (KupferDigital2)” bekanntgeben zu können. Gemeinsam mit dreizehn anderen Partnern arbeiten wir bis Anfang 2028 an der Umsetzung des Projektes.
Teilvorhaben: Semantische Technologie zur Erstellung eines interoperablen Datenraumes und erweiterten Produktpasses in der Kupfer-Materialforschung
Im Rahmen des KupferDigital2-Projektes vertieft das InfAI-Teilvorhaben die Konzepte aus KupferDigital und forscht an einer umfangreicheren Implementierung einer geeigneteren Daten- und Softwareinfrastruktur für die standardisierte und schemakonforme Beschreibung des Kupferwerkstoffes entlang seines Lebenszyklus inkl. aller relevanten Prozesse rund um dessen Entwicklung, Herstellung, Verarbeitung und das Recycling. Diese ganzheitliche Betrachtung des Werkstoffes Kupfer ist einzigartig und stellt hohe Anforderungen an die Ontologieentwicklung sowie an die softwaretechnische Unterstützung des Datenmanagements, wie in KupferDigitalerläutert. Der Datenraum aus dem Vorgängerprojekt KupferDigital vereint bereits einen Großteil des Kupfer-Lebenszyklus auf der schematischen Ebene und stellt grundlegende und repräsentative semantische Daten bereit.
Grafik 1: Überblick zu den 4 betrachteten Task-Typen: Text2Sparql (T2S), Text2Answer (T2A), Sparql2Answer (S2A) und SparqlSyntaxFixing (SSF)
Unser bereits als Preprint veröffentlichter Artikel „Assessing SPARQL capabilities of Large Language Models“ (Lars-Peter Meyer, Johannes Frey, Felix Brei und Natanael Arndt 2024) ist nun offiziell veröffentlicht in den Proceedings des Workshop „NLP4KGC: 3rd International Workshop on Natural Language Processing for Knowledge Graph Creation in conjunction with SEMANTiCS 2024 Conference”. Wir stellen dort eine Ergänzung des LLM-KG-Bench-Frameworks vor, mit der die SPARQL-Fähigkeiten von großen Sprachmodellen (englisch: Large Language Modells, kurz: LLMs; englisch: Knowledge Graph, kurz: KG, deutsch: Wissensgraph) automatisiert gemessen werden können. Das LLM-KG-Bench-Framework ist ein am InfAI e. V. entwickeltes Werkzeug zum automatisierten Bewerten der Fähigkeiten von LLMs mit Wissensgraphen umzugehen. Wenn LLMs besser mit Wissensgraphen umgehen können, würden LLMs vielleicht weniger halluzinieren sowie die Arbeit mit Wissensgraphen für Menschen erleichtern können.
Das automatisierte Messen hilft dabei neue LLMs für fachspezifische Aufgaben objektiv einordnen zu können. Und durch die Automatisierung können viele Messwiederholungen durchgeführt werden, um trotz dem nichtdeterministischen Antwortverhalten von LLMs verlässliche Ergebnisse zu erhalten.
In der Welt von RDF-Wissensgraphen ist SPARQL die gebräuchlichste Schnittstelle und Abfragesprache. Deshalb geht es bei der nun vorgestellten Untersuchung um die Syntax und Semantik von SPARQL SELECT Anfragen. Diese wurden beispielhaft für insgesamt neun LLMs von OpenAI, Anthropic und Google gemessen. Basierend auf den in Grafik 1 dargestellten 4 Aufgabentypen wurden 13 verschiedene Aufgabenvarianten zu fünf verschiedenen Wissensgraphen betrachtet.
Grafik 2: Auszug aus dem Artikel mit Ergebnissen für den Bereich Text2Sparql(T2S). Die Ergebnisse sind als Boxplots gezeigt mit Kreuzen für einzelne Messwerte und Kreisen für den Mittelwert. Bei dem Score bedeutet 1 ein optimales Ergebnis, ein Score von 0,2 bedeutet ein syntaktisch richtiges aber semantisch falsches Ergebnis, ein Score von 0 wird bei Syntaxfehler vergeben. Für weitere Ergebnisse und Erläuterungen sei auf den vollständigen Artikel verwiesen.
Zentrales Ergebnis unserer Arbeit ist: Zwischen den einzelnen Aufgaben und LLMs gibt es große Unterschiede. Zusammenfassend kann man sagen, dass die besten der untersuchten aktuellen LLMs kaum Schwierigkeiten mit der Syntax haben, jedoch bei semantischen Aufgaben auf Herausforderungen stoßen. Für Details sei auf den frei verfügbaren Artikel und Repositorien verwiesen.
Die Arbeit wurde über verschiedene Projekte am InfAI e. V. gefördert: StahlDigital, ScaleTrust, KISS — KI-gestütztes Rapid Supply Network, CoyPu — Cognitive Economy Intelligence Plattform für die Resilienz wirtschaftlicher Ökosysteme.
Der Code zum LLM-KG-Bench-Frameworks ist bei Github sowie Zenodo zu finden und die vollständigen Ergebnisse wurden bei GitHub und Zenodo veröffentlicht.
Am 26. November waren wir von 10 bis 15 Uhr mit dem CoyPu-Projekt beim Abschlusstreffen in den Räumen von ScaDS.AI Leipzig im Löhrs Carré.
Das Programm bot einen breitgefächerten Einblick in das Projekt. Nach einer Begrüßung gab Prof. Dr. Michael Martin eine Zusammenfassung des Projektes seit Beginn der Laufzeit, gefolgt von einem Überblick über die CoyPu-Kerndateninfrastruktur von Kurt Junghanns.
In den einzelnen Sessions präsentierten die Forschungspartner außerdem ihre Demonstratoren — unter anderem Claus Stadler mit der Präsentation “InfAI Coypu Demos” und Sebastian Tramp mit “eccenca Corporate Memory”. Weitere Demonstratoren wurden von den Forschungspartnern L3S Research Center, TIB, Hitec, DIW, Siemens, DATEV, Infineon und Implisense präsentiert.
Nach einem weiteren Programmpunkt zu rechtlichen Aspekten im CoyPu-Projekt von Frank Ingenrieth (SRIW) folgte die finale Session mit einer Präsentation über den Resilience Mesh von Prof. Dr. Michael Martin und mit abschließenden Dankesworten der Vertreterin vom Projektträger Deutsches Zentrum für Luft- und Raumfahrt (DLR) Petra Post.
Wir freuen uns über die zahlreiche Teilnahme an der spannenden Abschlussveranstaltung des CoyPu-Projektes.
Ein weiteres Highlight in den letzten Wochen war unsere Teilnahme mit dem Projekt ScaleTrust bei der DTM-Vernetzungskonferenz 2024 der BMBF-Förderprojekte zu Datentreuhandmodellen. die vom 11. bis 13. September in Berlin stattfand.
Die Konferenz bot neben einem interessanten Programm und inspirierenden Sessions auch die Möglichkeit für Vernetzung und Austausch.
Wir freuen uns sehr, dass wir an dieser interessanten Veranstaltung teilgenommen haben.
Weitere Informationen zum Veranstalter sind auf der Website zu finden.
Am 7. und 8. Oktober waren wir mit dem CoyPu-Projekt bei den Tagen der digitalen Technologien 2024 im bcc Berlin Congress Center, wo Mitarbeitende das Projekt präsentiert haben.
Die Tage der digitalen Technologien, eine Veranstaltung des Bundesministeriums für Wirtschaft und Klimaschutz (BMWK), standen dieses Jahr unter dem Motto “Transformation durch Innovation — nachhaltig, souverän, vernetzt” und beschäftigten sich mit den Themen Digitalisierung, Nachhaltigkeit und Innovation.
An zwei Tagen wurden Fragen, wie zum Beispiel die erfolgreiche Integration neuer digitaler Technologien in die unternehmerische Praxis oder welche Chancen generative KI dem Mittelstand bietet, umfassend diskutiert.
Am CoyPu-Stand haben sich während der Veranstaltungstage die Partner InfAI, Infineon, L3S Research Center sowie DATEV präsentiert. Außerdem hat Prof. Dr. Michael Martin am zweiten Veranstaltungstag am Fachforum “Digitale Plattformen und Ökosysteme zum Erfolg bringen” teilgenommen.
Wir freuen uns, dass wir Teil dieser spannenden Veranstaltung waren, welche neben spannenden Diskussionen und Präsentationen auch eine ideale Gelegenheit für Vernetzung und Austausch bot. Das komplette Programm kann hier noch einmal nachgelesen werden.
Weitere Informationen zur Veranstaltung sind auf der Website zu finden.
Michael Martin (InfAI) und Ahmad Sakor (L3S, TIB)
Vom 17. bis 19. September haben wir an der SEMANTiCS 2024, die dieses Jahr in Amsterdam stattfand, teilgenommen.
Wir freuen uns sehr, dass unser Mitarbeiter Lars-Peter Meyer am 17. September beim Workshop 3rd NLP4KGC — International Workshop on Natural Language Processing for Knowledge Graph Creation — mit vertreten war. In diesem Workshop wurden Methoden und Ansätze der Wissens- und Datenextraktion aus Texten thematisiert. Weitere Schwerpunkte waren theoretische und praktische Aspekte der Nutzung von Semantik und natürlicher Sprachverarbeitung für die Erstellung und Verwendung von Wissensgraphen. Lars-Peter Meyer präsentierte während des Workshops das Paper “Assessing SPARQL capabilities of Large Language Models”. Dies hat er mit den Kollegen Johannes Frey, Felix Brei und Natanael Arndt geschrieben.
Wir haben uns sehr gefreut, wieder Teil der SEMANTiCS Konferenz zu sein.
Mehr Informationen zum Workshop können auf der Website nachgelesen werden.
Wir arbeiten aktuell an einer spannenden Studie, die vomNEGZ — Nationales E‑Government Kompetenzzentrum gefördert wird. Unser Thema ist: „Wissensgraphen und semantische Datentechnologien in der Registermodernisierung – Potenziale, Barrieren und Anwendungsfälle“. Jetzt sind Sie gefragt! Wir suchen nach Praxisbeispielen und Expertinnen, die sich auf kommunaler‑, landes- oder Bundesebene mit Wissensgraphen und semantischen Technologien beschäftigen oder beschäftigen wollen.
Haben Sie Erfahrungen oder spannende Projekte laufen? Dann würden wir uns über einen Austausch freuen! Im Rahmen der Studie planen wir Interviews und sind für jeden Input dankbar.
Bei Interesse oder Rückfragen schreiben Sie bitte eine E‑Mail an Univ.-Prof. Dr. Michael Martin: martin@infai.org
Am 19. Juni 2024 nehmen wir an einem spannenden Event zum Thema KI in Sachsen teil:
Die vom Institut für Angewandte Informatik (InfAI) e.V. durchgeführte Veranstaltung „Künstliche Intelligenz in Sachsen: eine gemeinsame Vision für Wirtschaft, Forschung und Bildung” findet um 17.00 Uhr im Smart City Lab Leipzig, Magazingasse 3 statt.
Ein Höhepunkt der Veranstaltung ist die Präsentation der aktuellen Studie „KI in Sachsen 2024“ durch Dr. Christian Papsdorf, Leiter der sächsischen Kompetenzstelle für KI. Es wird nicht nur die gegenwärtige Situation der KI-Landschaft in Sachsen beleuchtet, es werden auch Fragen und Handlungsbedarfe thematisiert.
Im Fokus stehen Themen wie die Verbesserung des Transfers von Forschungsergebnissen in die Praxis, die Weiterentwicklung der Vernetzung der Akteur:innen und die Frage danach, wie sich die Hochschulbildung in Zukunft an das Thema KI anpassen muss.
Für die Teilnahme ist eine rechtzeitige Anmeldung wichtig.
Bei weiteren Fragen können Sie sich an Daniel Gerber wenden: gerber@infai.org Wir freuen uns auf einen spannenden Austausch zum Thema KI in Sachsen!
Vom 26. bis zum 30. Mai 2024 haben wir an der Extended Semantic Web Conference 2024 in Hersonissos (Kreta) teilgenommen. Die ESWC ist eine wichtige Austauschplattform für die neuesten wissenschaftlichen Ergebnisse und technologischen Innovationen im Bereich der semantischen Technologien. Dieses Jahr stand die Konferenz unter dem Titel “Fabrics of Knowledge: Knowledge Graphs and Generative AI”. Die aktuelle ESWC verfolgte das Ziel, die Schwerpunkte auf andere Bereiche zum Thema Web-Semantik auszuweiten.
Wir freuen uns sehr, dass unsere Mitarbeitenden mit zahlreichen Vorträgen auf der Konferenz vertreten waren. Im Rahmen von Workshops wurden folgende Vorträge präsentiert:
“Getting practical with GeoSPARQL and Apache Jena“ (Simon Bin, Claus Stadler, Lorenz Bühmann, Michael Martin)
“Towards a Regional Public Dashboard for Crisis and Resilience Management” (Till Grabo, Fatih Kilic, Julia Lücke, Sabine Gründer-Fahrer, Michael Martin, Norman Radtke and Christian Danne)
“Leveraging small language models for Text2SPARQL tasks to improve the resilience of AI assistance” (Felix Brei, Johannes Frey and Lars-Peter Meyer)
Neben spannenden Workshops und Tutorials hielt das vielseitige Programm auch Systembeschreibungen und Demonstrationen, eine Posterausstellung und ein Doktorand:innensymposium bereit.
Am 15. April haben wir im Rahmen der Data Week Leipzig mit dem CoyPu-Projekt einen Workshop zur Krisenresilienz organisiert. Verschiedene Projekte aus dem 3. Förderaufruf des KI-Innovationswettbewerbs vom BMWK haben vielseitige Anwendungsfelder und Demonstratoren vorgestellt. In dem 90-minütigen Workshop konnten wir mit drei Vorträgen einen Einblick in die Einsatzmöglichkeiten der entstehenden Dashboards und Plattformen geben und darüber hinaus bereits fertige Arbeitsergebnisse präsentieren.
Eröffnet wurde die Vortragsreihe durch Fatih Kilic (Institut für Angewandte Informatik e.V.) und Julia Lücke (German Institute for Economic Research (DIW Berlin)), die über “Risiken von Lieferkettenabhängigkeiten regionaler Wirtschaftsräume erkennen — Dashboard für die Resilienz der sächsischen Wirtschaft” sprachen.
Anknüpfend daran folgte der Beitrag “Von globalen Netzwerken zur lokalen Resilienz: Verständnis der Lieferkettenkomplexität in Notfallsituationen” von Paul Geoerg (Vereinigung zur Förderung des Deutschen Brandschutzes e.V.). Anhand von praxisnahen Beispielen erläuterte er dabei die Problematik der mangelnden Transparenz und die damit verbundenen Schwachstellen in globalen Lieferketten, welche in den aktuellen Zeiten globaler Krisen deutlich werden.
Im dritten und letzten Vortrag sprach Rolf Fricke (Condat) über das Projekt ResKriVer, wobei er das Thema “Social Media Monitoring für Leitstellen und Krisenstäbe” beleuchtete. Der Fokus lag in seiner Präsentation auf der Relevanz des Social Media Monitorings, welches in Krisenzeiten dabei helfen soll, Probleme in betroffenen Gebieten zu erkennen und konkrete Maßnahmen veranlassen zu können.
Wir freuen uns, dass wir mit unserem Workshop Teil der Data Week Leipzig waren und mit unseren Projekten einen breitgefächerten Einblick in das Thema Krisenresilienz geben konnten.
Wir bedanken uns bei allen Vortragenden und Teilnehmenden für den spannenden Workshop.
Umfassende Experimente wurden mit ChatGPT durchgeführt, um sein Potenzial zur Unterstützung von Knowledge Graph Engineering zu untersuchen. Das Paper von Lars-Peter Meyer et al. präsentiert eine Auswahl dieser Experimente und ihre Ergebnisse und zeigt, wie ChatGPT uns bei der Entwicklung und Verwaltung von Wissensgraphen unterstützen kann.
Halten Sie sich den 26. bis 30. Juni frei und freuen Sie sich auf die Data Week Leipzig 2023. Es wird interaktive Workshops und Schulungen geben sowie inspirierende Keynotes und Möglichkeiten sich mit anderen IT-Begeisterten und WissenschaftlerInnen über die neusten Trends und Forschungsergebnisse im Bereich Daten und Künstliche Intelligenz.
Die Veranstaltungswoche ist ein gemeinschaftliches Projekt verschiedener Forschungs- und Transfereinrichtungen, darunter das Institut für Angewandte Informatik e.V., Scads.AI Dresden/Leipzig, eccenca GmbH, der Verein DBpedia und das AKSW-Netzwerk. Erneut liegt der Fokus der Veranstaltungswoche auf den Themen Digitalisierung, Daten, Künstliche Intelligenz und Herausforderungen der Stadtentwicklung. Vor allem soll die Bedeutung internationaler Datenräume für Strategien und Maßnahmen des Klimaschutzes hervorgehoben werden. Inhaltlich werden die ganze Woche über wissenschaftliche, wirtschaftliche und gesellschaftliche Perspektiven auf Daten und Künstliche Intelligenz aufgezeigt und diskutiert.
Darüber hinaus unterstützen die OrganisatorInnen gemeinsam mit den AkteurInnen der Stadt Leipzig Formate, die neben der Industrie- und Wissenschaftscommunity auch eine breite, interessierte Öffentlichkeit ansprechen sollen. Hierfür sind Hackathons, Podiumsdiskussionen, Workshops und andere spannende Veranstaltungsformate organisiert. Das Programm für die diesjährige Veranstaltung wird stätig befüllt und ist auf der Data Week Website zu finden.