Fortschritte im Projekt RegioNachhaltigkeit: Cloudbasiertes Bewertungssystem für nachhaltige Landwirtschaft 

Wie nach­haltig ist ein land­wirtschaftlich­er Betrieb wirk­lich? Und wie lassen sich die Ergeb­nisse ein­er umfassenden Nach­haltigkeits­be­w­er­tung trans­par­ent ent­lang der gesamten Wertschöp­fungs­kette kom­mu­nizieren? Genau diesen Fra­gen wid­met sich das Pro­jekt RegioNach­haltigkeit, ein gemein­sames Vorhaben des Insti­tuts für Ange­wandte Infor­matik (InfAI) e.V, der IAK Agrar Con­sult­ing GmbH und der INL – Insti­tut für Nach­haltige Land­be­wirtschaf­tung GmbH. In diesem Blog­beitrag geben wir Ein­blick in die aktuellen Fortschritte unser­er Arbeit am Teil­pro­jekt “Konzep­tion, Imple­men­tierung und Eval­u­a­tion von Daten­for­mat­en, Prozessen und IT-Infra­struk­tur” durch das InfAI. 

Ein System für die Nachhaltigkeitsbewertung 

Die Basis für unsere Nach­haltigkeits­be­w­er­tung bildet das DINAK-Kri­te­rien- und Indika­toren­mod­ell, dass die drei zen­tralen Säulen der Nach­haltigkeit umfasst: Ökolo­gie, Ökonomie und Soziales. Unsere Auf­gabe im Pro­jekt ist es, diese Bew­er­tung in ein leis­tungs­fähiges dig­i­tales Sys­tem zu übersetzen. 

Beispiel­ergeb­nis ein­er Nachhaltigkeitsbewertung.

Fortschritte in der technischen Entwicklung 

Im let­zten Jahr lag der Fokus unser­er Arbeit auf der Entwick­lung von Importrou­ti­nen, Daten­ver­ar­beitung­sprozessen und Schnittstellen zur beste­hen­den Soft­ware REPRO. REPRO ist ein umfassendes Sys­tem zur ökol­o­gis­chen und datengetriebe­nen Analyse von Ack­er­schlagkarteien der INL GmbH und spielt eine zen­trale Rolle bei der Datenintegration. 

Damit das Pro­jekt effizient und struk­turi­ert voran­schre­it­en kann, haben wir zu Beginn des Jahres mehrere tech­nis­che und organ­isatorische Maß­nah­men umgesetzt: 

  • Ein­rich­tung eines Issue-Man­age­ment-Sys­tems: Mit Red­mine haben wir ein zen­trales Tool für Auf­gaben­man­age­ment, Doku­men­ta­tion und Zusam­me­nar­beit geschaffen. 
  • Opti­mierung der DevOps-Prozesse und Server­ad­min­is­tra­tion, um einen rei­bungslosen Entwick­lung­sprozess zu gewährleisten. 
  • Struk­turierung des Berichtswe­sens, um den Pro­jek­t­fortschritt trans­par­ent zu dokumentieren. 

Meilensteine: Datenverarbeitung und Systemintegration 

In den let­zten Monat­en lag unser Fokus auf der Mod­el­lierung und Entwick­lung von Daten­ver­ar­beitungsrou­ti­nen. Beson­ders für die Säulen Soziales und Ökonomie kon­nten wir entschei­dende Fortschritte erzie­len und die Anbindung an REPRO erfol­gre­ich realisieren. 

Darüber hin­aus waren wir aktiv an der Konzep­tion der Gesamtar­chitek­tur beteiligt. In Zusam­me­nar­beit mit der IAK haben wir Mock­ups und Schnittstellen entwick­elt, um die dig­i­tale Umset­zung des Sys­tems zu unterstützen. 

Nachhaltigkeitsbewertung als Webanwendung 

Ein High­light unser­er bish­eri­gen Arbeit ist die dig­i­tale Darstel­lung der Nach­haltigkeits­be­w­er­tung für einen Beispiel­be­trieb. Diese Weban­wen­dung wurde bere­its von der IAK der Öffentlichkeit präsen­tiert und bietet land­wirtschaftlichen Betrieben einen wertvollen Ein­blick in ihre Nachhaltigkeitsperformance. 

Durch diese dig­i­tale Auf­bere­itung kön­nen Betriebe: 

  • die Ergeb­nisse ihrer Nach­haltigkeits­be­w­er­tung intern analysieren, 
  • die Dat­en trans­par­ent gegenüber exter­nen Stake­hold­ern (z. B. Behör­den, Kun­den, Zer­ti­fizierungsstellen) kommunizieren, 
  • sowohl aggregierte als auch detail­lierte Ein­blicke in die drei Nach­haltigkeits­di­men­sio­nen erhalten. 

Näch­ste Schritte: Aus­bau und Optimierung 

Basierend auf den bish­eri­gen Ergeb­nis­sen konzen­tri­eren wir uns nun auf: 

  • die Imple­men­tierung weit­er­er Systemkomponenten, 
  • die Schaf­fung zusät­zlich­er Schnittstellen, 
  • die Ein­bindung weit­er­er Datenquellen. 

Nach ein­er aus­führlichen Test- und Erprobungsphase wird das InfAI eine tech­nis­che Bew­er­tung und Opti­mierung des Sys­tems vornehmen. Ziel ist es, eine robuste, prax­is­na­he und ein­fach nutzbare Lösung für nach­haltige Land­wirtschaft zu schaffen. 

Wir freuen uns darauf, die kom­menden Entwick­lun­gen hier auf unser­er Web­site zu teilen und sind ges­pan­nt auf das Feed­back aus der Praxis! 

Dig­i­tale Ergeb­nis­darstel­lung der Bew­er­tung entsprechend den DINAK-Kri­te­rien für einen beispiel­haften Betrieb, umge­set­zt durch IAK GmbH

Neues Projekt: KupferDigital2

Wir freuen uns, den Beginn des Pro­jek­tes “Mate­ri­al­daten­raum zur Steigerung von Effizienz und Nach­haltigkeit des
Kupfer­leben­szyk­lus (KupferDigital2)” bekan­nt­geben zu kön­nen. Gemein­sam mit dreizehn anderen Part­nern arbeit­en wir bis Anfang 2028 an der Umset­zung des Projektes.

Teil­vorhaben: Seman­tis­che Tech­nolo­gie zur Erstel­lung eines inter­op­er­a­blen Daten­raumes und erweit­erten Pro­duk­t­pass­es in der Kupfer-Materialforschung

Im Rah­men des Kupfer­Dig­i­tal2-Pro­jek­tes ver­tieft das InfAI-Teil­vorhaben die Konzepte aus Kupfer­Dig­i­tal und forscht an ein­er umfan­gre­icheren Imple­men­tierung ein­er geeigneteren Dat­en- und Soft­ware­in­fra­struk­tur für die stan­dar­d­isierte und schemakon­forme Beschrei­bung des Kupfer­w­erk­stoffes ent­lang seines Leben­szyk­lus inkl. aller rel­e­van­ten Prozesse rund um dessen Entwick­lung, Her­stel­lung, Ver­ar­beitung und das Recy­cling. Diese ganzheitliche Betra­ch­tung des Werk­stoffes Kupfer ist einzi­gar­tig und stellt hohe Anforderun­gen an die Ontolo­gieen­twick­lung sowie an die soft­waretech­nis­che Unter­stützung des Daten­man­age­ments, wie in Kupfer­Dig­i­taler­läutert. Der Daten­raum aus dem Vorgänger­pro­jekt Kupfer­Dig­i­tal vere­int bere­its einen Großteil des Kupfer-Leben­szyk­lus auf der schema­tis­chen Ebene und stellt grundle­gende und repräsen­ta­tive seman­tis­che Dat­en bereit.

Artikel „Assessing SPARQL capabilities of Large Language Models“ nun in den Workshop-Proceedings von NLP4KGc@SEMANTiCS24 veröffentlicht 

Grafik 1: Überblick zu den 4 betra­chteten Task-Typen: Text2Sparql (T2S), Text2Answer (T2A), Sparql2Answer (S2A) und Spar­ql­Syn­tax­Fix­ing (SSF) 

Unser bere­its als Preprint veröf­fentlichter Artikel „Assess­ing SPARQL capa­bil­i­ties of Large Lan­guage Mod­els“ (Lars-Peter Mey­er, Johannes Frey, Felix Brei und Natanael Arndt 2024) ist nun offiziell veröf­fentlicht in den Pro­ceed­ings des Work­shop „NLP4KGC: 3rd Inter­na­tion­al Work­shop on Nat­ur­al Lan­guage Pro­cess­ing for Knowl­edge Graph Cre­ation in con­junc­tion with SEMAN­TiCS 2024 Con­fer­ence”. Wir stellen dort eine Ergänzung des LLM-KG-Bench-Frame­works vor, mit der die SPAR­QL-Fähigkeit­en von großen Sprach­mod­ellen (englisch: Large Lan­guage Mod­ells, kurz: LLMs; englisch: Knowl­edge Graph, kurz: KG, deutsch: Wis­sens­graph) automa­tisiert gemessen wer­den kön­nen. Das LLM-KG-Bench-Frame­work ist ein am InfAI e. V. entwick­eltes Werkzeug zum automa­tisierten Bew­erten der Fähigkeit­en von LLMs mit Wis­sens­graphen umzuge­hen. Wenn LLMs bess­er mit Wis­sens­graphen umge­hen kön­nen, wür­den LLMs vielle­icht weniger hal­luzinieren sowie die Arbeit mit Wis­sens­graphen für Men­schen erle­ichtern können. 

Das automa­tisierte Messen hil­ft dabei neue LLMs für fach­spez­i­fis­che Auf­gaben objek­tiv einord­nen zu kön­nen. Und durch die Automa­tisierung kön­nen viele Mess­wieder­hol­un­gen durchge­führt wer­den, um trotz dem nicht­de­ter­min­is­tis­chen Antwortver­hal­ten von LLMs ver­lässliche Ergeb­nisse zu erhalten. 

In der Welt von RDF-Wis­sens­graphen ist SPARQL die gebräuch­lich­ste Schnittstelle und Abfrage­sprache.  Deshalb geht es bei der nun vorgestell­ten Unter­suchung um die Syn­tax und Seman­tik von SPARQL SELECT Anfra­gen. Diese wur­den beispiel­haft für ins­ge­samt neun LLMs von Ope­nAI, Anthrop­ic und Google gemessen. Basierend auf den in Grafik 1 dargestell­ten 4 Auf­gaben­typen wur­den 13 ver­schiedene Auf­gaben­vari­anten zu fünf ver­schiede­nen Wis­sens­graphen betrachtet. 

Grafik 2: Auszug aus dem Artikel mit Ergeb­nis­sen für den Bere­ich Text2Sparql(T2S). Die Ergeb­nisse sind als Box­plots gezeigt mit Kreuzen für einzelne Mess­werte und Kreisen für den Mit­tel­w­ert. Bei dem Score bedeutet 1 ein opti­males Ergeb­nis, ein Score von 0,2 bedeutet ein syn­tak­tisch richtiges aber seman­tisch falsches Ergeb­nis, ein Score von 0 wird bei Syn­taxfehler vergeben. Für weit­ere Ergeb­nisse und Erläuterun­gen sei auf den voll­ständi­gen Artikel verwiesen. 

Zen­trales Ergeb­nis unser­er Arbeit ist: Zwis­chen den einzel­nen Auf­gaben und LLMs gibt es große Unter­schiede. Zusam­men­fassend kann man sagen, dass die besten der unter­sucht­en aktuellen LLMs kaum Schwierigkeit­en mit der Syn­tax haben, jedoch bei seman­tis­chen Auf­gaben auf Her­aus­forderun­gen stoßen. Für Details sei auf den frei ver­füg­baren Artikel und Repos­i­to­rien verwiesen. 

Die Arbeit wurde über ver­schiedene Pro­jek­te am InfAI e. V. gefördert: StahlDig­i­tal, ScaleTrust, KISS — KI-gestütztes Rapid Sup­ply Net­work, Coy­Pu — Cog­ni­tive Econ­o­my Intel­li­gence Plat­tform für die Resilienz wirtschaftlich­er Ökosysteme. 

Der Code zum LLM-KG-Bench-Frame­works ist bei Github sowie Zen­o­do zu find­en und die voll­ständi­gen Ergeb­nisse wur­den bei  GitHub und Zen­o­do veröffentlicht. 

Link zum Paper: 

Neues Projekt: ScaleTrust

Wir freuen uns, den Beginn des Pro­jek­tes “ScaleTrust – Scal­able Com­pli­ance and Lead­er­ship in Eth­i­cal Trustee­ship” bekan­nt zu geben! Gemein­sam mit unseren Part­nern Adva­neo GmbH, Uni­ver­sität des Saar­lan­des und dem Green Deal Data­space e.V. arbeit­en wir bis Ende 2025 an der Umset­zung des Projekts.

Das Pro­jekt zielt darauf ab, eine skalier­fähige Blau­pause für einen sektor‑, anwen­dungs- und län­derüber­greifend­en Date­naus­tausch in Daten­räu­men zu schaf­fen und gle­ichzeit­ig ein über­trag­bares Treuhän­der­mod­ell zu entwick­eln, so dass dessen erfol­gre­iche Etablierung eine zukün­ftige Datenin­no­va­tion­sökonomie mit höheren Datenbestän­den für eine höhere Anzahl von Akteuren erre­icht wer­den kann. Im Pro­jek­tvorhaben wird beispiel­haft der Green Deal Data­space als beste Aus­gangsvo­raus­set­zung für die Auf- und Aus­bau eines rechtssicheren und ver­trauensvollen Daten­treuhän­der­mod­ells aufgezeigt. Der Green Deal Data­space ist als ein offenes Ökosys­tem für Resilienz und Nach­haltigkeit konzip­iert und ist auf die Opti­mierung der Kreis­laufwirtschaft und Trans­parenz von Liefer­ket­ten ausgerichtet. 

An zwei prax­isori­en­tierte Use cas­es, die sich mit der Prob­lematik von Liefer­ket­ten und dem­nächst meldepflichti­gen Emis­sions­dat­en beschäfti­gen, wer­den dabei Wege aufgezeigt, wie der Ein­satz eines Treuhän­der­mod­ells den Daten­tausch in der Wirtschaft und der Wis­senschaft zu befeuern beiträgt.

Gratulation an Prof. Dr. Michael Martin

Foto: Prof. Dr. Michael Mar­tin (l.) erhielt aus den Hän­den des Prorek­tors für Lehre und Inter­na­tionales der TUC, Prof. Dr. Max­i­m­il­ian Eibl, seine Beru­fung­surkunde. Foto Kred­it: Niklas Schindler

Leipzig, 28.11.2023: Wir freuen uns, Prof. Dr. Michael Mar­tin zu sein­er Pro­fes­sur für Daten­man­age­ment an der Tech­nis­che Uni­ver­sität Chem­nitz zu grat­ulieren. Seit 2018 ist er am Insti­tut für Ange­wandte Infor­matik (InfAI) e. V. Leit­er des Kom­pe­tenzzen­trums Effiziente Tech­nolo­giein­te­gra­tion (ETi) und betreut unter anderem das Pro­jekt Coy­Pu.

Als Uni­ver­sität­spro­fes­sor an der Fakultät für Infor­matik wird sich Pro­fes­sor Mar­tin in Forschung und Lehre den Schw­er­punk­ten „FAIR und Open Data“, „Wis­sens­graphen und Daten­in­te­gra­tion“, „Analyse und Auswer­tung von Dat­en“ sowie „Unter­stützung­sprozesse für Data Sci­ences“, „Ver­ar­beitung von indus­triellen und mobil­ität­srel­e­van­ten Dat­en“, sowie „Datengetriebene Resilien­zwis­senschaften“ widmen.

Wir wün­schen einen erfol­gre­ichen Arbeitsstart an der TU Chem­nitz! Mehr Infor­ma­tio­nen sind hier zu find­en: https://www.tu-chemnitz.de/tu/pressestelle/aktuell/12170

Data Week Leipzig

Hal­ten Sie sich den 26. bis 30. Juni frei und freuen Sie sich auf die Data Week Leipzig 2023. Es wird inter­ak­tive Work­shops und Schu­lun­gen geben sowie inspiri­erende Keynotes und Möglichkeit­en sich mit anderen IT-Begeis­terten und Wis­senschaft­lerIn­nen über die neusten Trends und Forschungsergeb­nisse im Bere­ich Dat­en und Kün­stliche Intelligenz. 

Die Ver­anstal­tungswoche ist ein gemein­schaftlich­es Pro­jekt ver­schieden­er Forschungs- und Trans­fer­e­in­rich­tun­gen, darunter das Insti­tut für Ange­wandte Infor­matik e.V., Scads.AI Dresden/Leipzig, eccen­ca GmbH, der Vere­in DBpe­dia und das AKSW-Net­zw­erk. Erneut liegt der Fokus der Ver­anstal­tungswoche auf den The­men Dig­i­tal­isierung, Dat­en, Kün­stliche Intel­li­genz und Her­aus­forderun­gen der Stad­ten­twick­lung. Vor allem soll die Bedeu­tung inter­na­tionaler Daten­räume für Strate­gien und Maß­nah­men des Kli­maschutzes her­vorge­hoben wer­den. Inhaltlich wer­den die ganze Woche über wis­senschaftliche, wirtschaftliche und gesellschaftliche Per­spek­tiv­en auf Dat­en und Kün­stliche Intel­li­genz aufgezeigt und diskutiert. 

Darüber hin­aus unter­stützen die Organ­isatorIn­nen gemein­sam mit den AkteurIn­nen der Stadt Leipzig For­mate, die neben der Indus­trie- und Wis­senschaftscom­mu­ni­ty auch eine bre­ite, inter­essierte Öffentlichkeit ansprechen sollen. Hier­für sind Hackathons, Podi­ums­diskus­sio­nen, Work­shops und andere span­nende Ver­anstal­tungs­for­mate organ­isiert. Das Pro­gramm für die diesjährige Ver­anstal­tung wird stätig befüllt und ist auf der Data Week Web­site zu finden.

Veröffentlicht in:  News

Arbeitsgruppen am KPZ ETI

In den let­zten Jahren ist das Kom­pe­tenzzen­trum (KPZ) am InfAI stark gewach­sen. Nun wollen wir die Chance ergreifen und allen Mitar­bei­t­en­den eine Plat­tform zur Darstel­lung von Pro­jekt- und Forschungsergeb­nis­sen geben. Begonnen haben wir mit unge­fähr 10 Mitar­bei­t­erin­nen, sind stetig gewach­sen und zu Beginn von 2023 umfasste unser KPZ mehr als 55 Mitar­bei­t­ende und stu­den­tis­che Hil­f­skräfte an zwei Stan­dorten. Möchte Sie mehr über unsere Struk­tur und die Arbeits­grup­pen erfahren? 

Hello World!

Wir am Kom­pe­tenzzen­trum (KPZ) Effiziente Tech­nolo­giein­te­gra­tion heißen Sie her­zlich willkom­men auf unser­er neuen Web­site. Das KPZ ist am Insti­tut für Ange­wandte Infor­matik ange­siedelt und beste­ht aus mehreren Arbeits­grup­pen. Infor­ma­tio­nen zu den Arbeits­grup­pen und dessen Leit­ern. Des Weit­eren find­en Sie Infor­ma­tio­nen zu unseren Forschungss­chw­er­punk­ten, Part­neror­gan­i­sa­tio­nen und unser­er Projektarbeit.