Band 69:
Hounkpatin, O. (2017): Digital soil mapping using survey data and soil organic carbon dynamics in semi-arid Burkina Faso.
Bonner Bodenkundl. Abh. 69, 169 S., 15,- €
Kurzfassung Band 69
Hounkpatin, O. (2017): Digital soil mapping using survey data and soil organic carbon dynamics in semi-arid Burkina Faso.
Kurzfassung
Mit Hilfe Computer-basierter Methoden der Geostatistik und Datenbankauswertung bietet die digitale Bodenkartierung (digital soil mapping, DSM) neue Möglichkeiten zur Bereitstellung räumlicher Bodeninformationen für Regionen wie West Afrika, in denen solche Informationen nicht oder nur teilweise vorhanden sind. Diese Informationen können auch wichtig sein für die Abschätzung der Speicherkapazität und -dynamik von organischem Kohlenstoff (soil organic carbon, SOC) in tropischen Böden. Allerdings hängt die Genauigkeit vom gewählten statistischen Modell ab, dessen richtige Wahl für solche Umweltbedingungen anfangs nicht klar ist. Darüber hinaus ist die Vorhersage von Bodentypen (reference soil groups, RSG) durch digitale Bodenkartierung auf Grundlage von Datensätzen mit ungleich verteilten Bodentypen oft beeinflusst durch einen einzelnen dominanten Bodentyp. Meine Hypothesen sind, dass (i) statistische Modelle, die mit linearen und nicht-linearen Mustern in Datensätzen umgehen können, bessere Genauigkeiten bei der Vorhersage erreichen als die Modelle, die auf lineare Muster ausgerichtet sind, (ii) das statistische Beschneiden der Daten des dominanten Bodentyps (Plinthosol, PT) zu einer erhöhten Vorhersagegenauigkeit der anderen Bodentypen führt, (iii) Böden an Savanne-Standorten (SA) durch größere Bodenkohlenstoffvorräte charakterisiert sind als Böden unter Ackerland (cropland, CR), und (iv) mit einer Landnutzungsänderung (land use change, LUC) von Savanne zu Ackerland auch Plinthosole zu einem schnellen Verlust an organischem Bodenkohlenstoff neigen, und zwar insbesondere in den gröberen Fraktionen der partikulären organischen Substanz.
Um diese Hypothesen zu testen, habe ich im Dano-Einzugsgebiet Standorte mit den Landnutzungen CR und SA und verschiedenen RSGs beprobt. Für die digitale Bodenkartierung der Bodeneigenschaften (Sand, Schluff, Ton, CEC, SOC, N-gesamt) im Oberboden (0 - 30 cm) wurden vier statistische Vorhersagemodelle genutzt und verglichen: multiple linear regression (MLR), random forest regression (RF), support vector machine (SVM), stochastic gradient boosting (SGB). Um das Risiko zu reduzieren, dass die Vorhersage der RSGs von der dominanten Klasse (Plinthosols) beeinflusst wird, wurde ein statistischer Ansatz zum Beschneiden der Daten genutzt. Dabei wurden die unteren und oberen 5 % und 10 % sowie die Bereiche außerhalb der Standardabweichung der Plinthosol-Daten beschnitten, so dass nur die Daten innerhalb der genannten Grenzen genutzt wurden. Random Forest wurde als robuste Methode zur Datenauswertung genutzt. Die letztendliche Einschätzung der Kohlenstoffvorräte wurde unter Berücksichtigung ihrer Variation in CR- und SA-Flächen und in verschieden RSGs in unterschiedlicher Tiefe vorgenommen. Die räumliche Verteilung der Kohlenstoffvorräte und der damit zusammenhängenden Faktoren wurde dann erneut durch Random Forest und MLR erklärt. Um die zeitliche Dynamik von SOC-Vorräten zu verstehen, wurde eine falsche Chronosequenz von Plinthosolen untersucht, deren Nutzung sich von SA zu CR über unterschiedliche Zeiträume (0 – 29 Jahre) geändert hat.
In Bezug auf die digitale Bodenkartierung der Bodeneigenschaften zeigte sich, dass die machine learning techniques (RF, SVM, SGB) geringfügig besser abschneiden als MLR, wobei RF in den meisten Fällen die höchste Genauigkeit erreichte. Das schlechtere Abschneiden von MLR liegt wahrscheinlich daran, dass es nicht-lineare Beziehungen zwischen Ergebnisvariablen und Einflussvariablen nicht wiedergeben kann. Die Satellitendaten, die während der Phase des Pflügens oder der frühen Pflanzentwicklung (z.B. Mai, Juni) aufgenommen wurden, stellten sich als wichtigste spektrale Prädikatoren heraus, während Geländehöhe, Temperatur und Niederschlag wichtige Gelände-/Klimavariablen bildeten.
Im Hinblick auf das Beschneiden der Daten wurden die besten Vorhersagen erreicht, wenn alle PT-Punkte kleiner als 5 % und größer als 95 % des kumulativen Anteils der wichtigsten Variable (wetness index) entfernt wurden. Die Modellierung wurde dann nur mit Geländeparametern und spektralen Parametern (terrain and spectral parameter, TSP) durchgeführt und zwar mit optimalen Prädiktoren aus der RF-Regression. Das daraus resultierende Modell zeigte eine gute Übereinstimmung von Vorhersage und tatsächlicher Beobachtung; der Kappa-Wert erreichte dabei 0.57 und die Vorhersagegenauigkeit stieg an um 35 % für Cambisols, 16 % für Stagnosols und 7 % für Gleysols. Der SAGA wetness indes (S.Wet.Ind) war für die Vorhersage der RSGs die wichtigste erklärende Variable. Das Feuchteregime kann also als diskriminierendes Schlüsselelement zwischen den RSGs angesehen werden.
Die SOC-Vorräte im Oberboden waren an Savanne-Standorten (41.4 t C ha-1) leicht höher als an Ackerstandorten (39.1 t C ha-1). Im Gegensatz dazu waren im Unterboden die SOC-Vorräte bei CR signifikant höher (40.2 t C ha-1) als bei SA (26.3 t C ha-1). Unter den RSGs zeigen Gleye, die in niedrigeren Geländelagen zu finden sind, die größten SOC-Vorräte in 0 - 30 cm (44 t C ha-1) und 0 - 100 cm Tiefe (86.6 t C ha-1). Schluff war die am meisten verbreitete Korngröße im Oberboden und wurde vom RF-Modell als wichtigster Faktor für die räumliche Verbreitung der SOC-Vorräte identifiziert; dieses ist wahrscheinlich zurückzuführen auf den positiven Einfluß dieser Korngröße auf die Wasserhaltefähigkeit und auf die Aggregierung organo-mineralischer Partikel. Der Niederschlag bildete den wichtigsten Faktor für die Verteilung der SOC-Vorräte im Unterboden. Da der Unterboden oft durch eine Tonanreicherung geprägt war, kann der vertikale Transport von kohlenstoffreichen Sedimenten bei tropischem Starkregen hier als ebenfalls wichtiger bodenbildender Prozess angesehen werden.
Der Landnutzungswandel hin zu Ackerland führte bei den untersuchten Plinthosolen zu SOC-Verlusten von 24 t C ha-1 in den oberen 10 cm und 49 t C ha-1 in den oberen 30 cm. So wurden ca. 66 % (0 - 10 cm; p < 0.01) und 55 % (0 - 30 cm; p < 0.01) des anfänglichen Kohlenstoffs unter natürlicher Vegetation durch 29 Jahre landwirtschaftlicher Nutzung freigesetzt. Auch der Unterboden war anfällig für Landnutzungsänderungen mit SOC-Verlusten von 0.7 bis 19.5 t C ha-1 in 30 - 100 cm Tiefe. Verluste an SOC wurden in allen Korngrößenfraktionen des partikulären Humus beobachtet, wobei die mittlere Verweildauer bei den gröberen Fraktionen abnahm. In dieser Studie konnten die Fe-Oxide nicht als Schlüssel zur Stabilisierung von Kohlenstoffvorräten bestätigt werden, da nur 16 % der Vorräte an Fe-Oxide gebunden waren.
Zusammenfassend kann gesagt werden, dass die digitale Bodenkartierung mit Hilfe von RF und Fernerkundungsdaten akzeptable Vorhersagegenauigkeiten für eine große Bandbreite an Bodeneigenschaften und RSGs innerhalb einer sehr heterogenen Landschaft ermöglicht. Es stellte sich heraus, dass das Beschneiden der Daten dann effizient ist, wenn eine RSG, die zu einer weiten Spannweite von Geländeparametern Beziehungen aufweist, sich mit solchen Parametern überschneidet, die nur mit wenigen RSG-Einheiten zusammenhängen. Die hier quantifizierten SOC-Vorräte unterstreichen, dass die semi-ariden Ökosysteme West-Afrikas immer noch eine Möglichkeit zur Speicherung von Kohlenstoff bieten und dass die Ergebnisse eine Grundlage für die weitere Modellierung der SOC-Dynamik in der Region darstellen. Der Landnutzungswandel von Savanne zu permanenter Ackernutzung beeinflusst Kohlenstoff im Ober- und Unterboden, obwohl letzterer selten bei der Analyse von Auswirkungen des Landnutzungswandels in Afrika berücksichtigt wird.
Abstract Band 69
Hounkpatin, O. (2017): Digital soil mapping using survey data and soil organic carbon dynamics in semi-arid Burkina Faso.
Abstract
With computer-assisted geostatistics and data mining methods, digital soil mapping (DSM) offers new possibilities for providing soil spatial information for data scarce areas such as West Africa. Such information could also be essential for understanding tropical soil organic carbon (SOC) sequestration potentials and dynamics. However, the level of accuracy depends on the statistical model selected, the choice of which is not clear from the first for such environments. Moreover, for datasets with imbalanced soil orders, prediction of reference soil groups (RSG) using a DSM approach often biased towards the majority soil order class. I hypothesized that (i) statistical models, which are able to handle both linear and unlinear patterns in data, will provide higher prediction accuracy than those geared towards linear patterns, (ii) pruning the major soil group - the Plinthosols - will result in increased prediction accuracy of the minor RSG, (iii) sites with savannah (SA) and related RSG will present larger SOC stocks than cropland (CR), however, (iv), with land use change (LUC) also the Plinthosols are prone to rapid SOC losses from bulk soil and primarily from coarse particle-size fractions.
To test these hypotheses, I sampled sites within both CR and SA across different RSG in the Dano catchment. For the DSM of soil properties (sand, silt, clay, CEC, SOC, N) in the topsoil (0 - 30 cm), four statistical prediction models – multiple linear regression (MLR), random forest regression (RF), support vector machine (SVM), stochastic gradient boosting (SGB) – were used and compared. To reduce the risk that the spatial prediction of the RSG was biased by the majority class – the Plinthosols – I used a data pruning approach, accounting for 80 %, 90 % and standard deviation core range of the Plinthosols data, respectively, while cutting off all data points belonging to the outer range. Random Forest was used as a robust data mining method along with its recursive feature elimination option to evaluate the performance of these different data subsets. The final assessment of SOC stocks was conducted by considering its variation in CR and SA and in various RSG at different depths. The spatial distribution of SOC stocks as well as the main related factors were then again elucidated using Random Forest. For understanding the temporal dynamics of SOC storage, I investigated a false chronosequence of Plinthosols that had been converted from SA to CR at a duration between 0 and 29 years.
For the DSM of soil properties, results showed from the performance statistics that the machine learning techniques (RF, SVM, SGB) performed marginally better than the MLR, with the RF providing in most cases the highest accuracy. The lower performance of the MLR is attributed to its failure in accounting for non-linear relationships between response and predictor variables. The satellite data acquired during ploughing or early crop development stages (e.g. May, June) were found to be the most important spectral predictors, while elevation, temperature and precipitation came up as prominent terrain/climatic variables.
Upon the data pruning, the best predictions were observed when removing all PT points lower than 5 % and higher than 95 % of the cumulative percentage of the most important variable (wetness index). Modelling was then conducted solely with terrain and spectral parameters (TSP) with optimal predictors resulting from RF recursive feature elimination. The resulting prediction model provided a substantial agreement to observation, with a kappa value of 0.57 along with a 35 % increase in prediction accuracy for Cambisols, 16 % for Stagnosols and 7 % for Gleysols. The SAGA wetness index (S.Wet.Ind) was the most important variable driving the RSG suggesting that the humidity regime is a key discriminatory element among the RSG.
The SOC stock distribution in the topsoil revealed a slightly larger SOC stock in the savannah sites (41.4 t C ha-1) than in the cropland (39.1 t C ha-1). Contrastingly, in the subsoil, a significant difference (p < 0.05) was observed between the CR recording a larger SOC stock of 40.2 t C ha-1, while the subsoil of the SA sites contained only 26.3 t C ha-1, on the average. Among the RSG, the Gleysols located at lower elevation positions revealed the largest SOC stocks over 0 - 30 cm (44 t C ha-1) and 100 cm depth (86.6 t C ha-1). Silt was the most abundant soil particle in the topsoil and was identified by the RF model as the most important factor related to the spatial distribution of the SOC stock, probably via its influence on soil moisture preservation and SOC storage via aggregation. Precipitation was found as the major factor related to subsoil SOC stock distribution. As the subsoils were also enriched in clay, the vertical transport of SOC rich sediments under tropical heavy rains likely accompanied major soil forming process in the landscape.
The LUC in the chronosequence Plinthosols triggered losses in SOC stock of 24 t C ha-1from the upper 10 cm and 49 t C ha-1 from the upper 30 cm. Thus, about 66 % (0 - 10 cm; p < 0.01) and 55 % (0 - 30 cm; p < 0.01) of the initial stock in the native vegetation had been released after 29 years of cultivation. Also, subsoil was found to be vulnerable to LUC, with SOC losses amounting on average to 0.7 to 19.5 t C ha-1 from the 30 - 100 cm depth interval. Losses of SOC occurred from all particle-size fractions with a mean residence time of SOC generally decreasing with increasing equivalent diameter of the particle-size fraction. In this study, I could not confirm Fe oxides as key factor influencing SOC stock stabilization, because only an average of 16 % of the total SOC stock were apparently bound to Fe.
In summary, DSM at local scale using RF with remote sensing data resulted in reasonable prediction accuracy for a large array of soil properties and RSG within a highly heterogeneous landscape. Data pruning proved to be efficient in a context where a RSG belonging to a wide range of terrain parameters overlapped with those related to only few RSG units. The SOC stocks as quantified in the present study reinforce the view that the semi-arid ecosystems of West Africa still offer an opportunity for carbon sequestration and these results represent a baseline for future modelling of SOC dynamics in the region. LUC from natural savannah to permanent cropland, however, affects both topsoil and subsoil SOC though the latter is scarcely considered in the impact analysis of LUC in Africa.