27.03.2026 –, Bof3/Expert:innen (ZHG 006)
Landwirtschaftliche Felddaten aus dem IACS (Integrated Administration and Control System) werden zu Datenpunkten mit mehrjährigen Sequenzen aufbereitet. Im Rahmen der Masterarbeit werden diese Sequenzen mittels k-medoid-clustering in Fruchtfolgegruppen zusammengefasst, die durch eine repräsentative Sequenz verkörpert werden. Anschließend werden die Gruppen räumlich dargestellt und mit Transiogrammen analysiert.
Art der Arbeit: Masterarbeit
Der Orginale Tilel lautet: "Cluster analysis of crop rotations in Lower Saxony using machine learning"
Wesentliche Ziele der Arbeit sind heraus zu finden welche Fruchtfolgen es in Niedersachsen gibt, wie nah diese an den Empfehlungen der Fachliteratur folgen und ob sie räumliche oder zeitliche Muster aufweisen.
Fruchtfolgen werden auf Grundlage der Anbauhistorie (im Folgenden Sequenz) eines Feldes analysiert. Die Daten aus dem IACS (Integrated Administration and Control System) enthalten einen Nutzungscode pro Jahr und Fläche. Für diese Arbeit wird ein Punktraster verwendet um die Sequenzen aus den mehrjährigen Flächendaten zu extrahieren und in ein handhabbares Format zu bringen.
Bisherige Forschung wie durch Stein [1] bearbeiten die Fragestellung durch Analyse der Anteile von Fruchtkategorien (Sommerung und Winterung, sowie Blatt und Halmfrucht) pro Fruchtfolge. Durch die Betrachtung der Anteile gehen Informationen zur Sequenz verloren. Im Gegensatz dazu betrachten Steinmann und Dober [2] die häufigsten Fruchtfolgen ohne Berücksichtigung von Abweichungen, was bei langen Sequenzen zu einer Inflation unterschiedlicher Kombinationen führt. Zudem werden die Daten in beiden Ansätzen intensiv gefiltert, wodurch eine detaillierte, lokale Analyse auf Feldebene nicht möglich ist.
Um eine Toleranz gegen geringfügige Abweichungen zu erlauben und Sequenzinformationen zu berücksichtigen, wird die Ähnlichkeit zwischen den Sequenzen mit dem Optimal-Matching Algorithmus, einer Adoption der Levenshtein Distance, in Kombination mit einer kontextspezifischen Substitutionsmatrix berechnet [3].
Diese Ähnlichkeitswerte werden dann mit dem k-Medoids Algorithmus (ähnlich k-Means) geclusteret [4].
Die Substitutionsmatrix berechnet sich wiederum aus der Ähnlichkeiten zwischen der Verteilung von Sequenznachbarn verschiedener Fruchtfolgeelemente abgeleitet wurden, wobei besonderes Augenmerk auf Selbstfolgen gelegt wurde. (Beispielsweise kommt Raps in Kontexten vor, die ähnlicher zu denen von Rüben als zu den Weizenkontexten sind)
Aus den Daten bilden sich deutlich unterschiedliche Fruchtfolgen heraus, die stark räumlich konzentriert sind. So lassen sich die Fruchtfolgecluster zu den regionalen Kontexten analysieren und mutmaßliche Einflussfaktoren ausmachen. Wie etwa die Nähe zu Stärkefabriken für Kartoffelcluster. Zur Betrachtung räumlicher Konzentrationen und Beziehungen zwischen Clustern werden Transiogramme verwendet, die das Vorkommen von Clustern / Kategorien in Bezug auf Entfernungsklassen ausgehend von den Punkten eines Clusters auftragen.
Die agronomische Analyse der Fruchtfolgecluster zeigt Probleme in allen relevanten Clustern mit sehr unterschiedlicher Intensität.
Limitationen des Ansatzes sind, dass das Modell zu kurzen Fruchtfohlen neigt und es schwierig ist die korrekte Anzahl an Clustern, als für K-Medoid notwendigen Parameter, fest zu stelle. (Für Niedersachsen wurden 9 Cluster verwendet)
Aufbauend auf dieser Arbeit lassen sich so Einflussfaktoren auf Fruchtfolgen besser erforschen und es können detailliertere Analysen zur Verteilung der Qualität von Fruchtfolgen auf Basis von Fruchtfolgeindices wie dem von Letinhuter [5] durch geführt werden. Somit eignet sich das Modell zum Monitorring der regionalen landwirtschaftlichen Praxis, da diese eng mit Fruchtfolgen zusammen hängt. Des weiteren können die Ergebnisse verwendet werden um Studienregionen für Landschaftsexperimente aus zu wählen. Es wurde ein Fokus darauf gelegt das Modell auf andere Regionen mit vergleichbaren Daten übertragbar zu machen, so das auch andere Regionen analysiert und verglichen werden können. (Die Anwendung auf weitere Regionen wurde für Brandenburg schon demonstriert)
Das Modell ist in R mit den Packages TraMineR [3] und sf geschrieben.
Die Daten sind jährlich frei über Landesportale verfügbar und für manche Regionen gibt es mittlerweile auch mehrjährige vereinheitlichte Datensätze [6].
[1] S. Stein, ‘Spatial analysis of crop rotation practice in North-western Germany’, Doctoral dissertation, University Göttingen, 2020. doi: 10.53846/goediss-8200.
[2] S. Stein and H.-H. Steinmann, ‘The situation of current crop rotations in Northern Germany: risks and chances for future farming systems’.
[3] M. Studer and G. Ritschard, ‘A comparative review of sequence dissimilarity measures’, 2014, doi: 10.12682/LIVES.2296-1658.2014.33.
[4] H.-S. Park and C.-H. Jun, ‘A simple and fast algorithm for K-medoids clustering’, Expert Systems with Applications, vol. 36, no. 2, pp. 3336–3341, Mar. 2009, doi: 10.1016/j.eswa.2008.01.039.
[5] B. Leteinturier, J. L. Herman, F. D. Longueville, L. Quintin, and R. Oger, ‘Adaptation of a crop sequence indicator based on a land parcel management system’, Agriculture, Ecosystems & Environment, vol. 112, no. 4, pp. 324–334, Mar. 2006, doi: 10.1016/j.agee.2005.07.011.
[6] C. Jänicke, K. A. Petersen, P. Schmidts, D. Müller, and M. R. Jepsen, ‘Harmonized IACS inventory’. Zenodo, Dec. 11, 2024. doi: 10.5281/zenodo.14384070.
Hat Agrartechnik in Triesdorf und Agrarwissenschaften in Göttingen studiert.