Publication Cover
Canadian Journal of Remote Sensing
Journal canadien de télédétection
Volume 42, 2016 - Issue 6
439
Views
23
CrossRef citations to date
0
Altmetric
Original Articles

Comparing Modeling Methods for Predicting Forest Attributes Using LiDAR Metrics and Ground Measurements

, , &
Pages 739-765 | Received 17 Apr 2016, Accepted 26 Aug 2016, Published online: 18 Dec 2016
 

Abstract

Selected modeling methods are compared for predicting 5 forest attributes, basal area (BA), stem volume (VOL), Lorey's height (LOR), quadratic mean diameter (QMD), and tree density (DEN), from airborne LiDAR metrics in southwestern Oregon, in the United States. The selected methods included most similar neighbor (MSN) imputation, gradient nearest neighbor (GNN) imputation, Random Forest (RF)–based imputation, BestNN imputation, ordinary least square (OLS) regression, spatial linear model (SLM), and geographically weighted regression (GWR). Several performances of each method were assessed by 500 simulations with different numbers of training data. No single modeling method was always superior to the others in prediction of the forest attributes. The best method varied according to response variable, prediction type, and performance measures, even though there was a leading group (SLM, OLS, BestNN, and GWR) that always outperformed the other methods in root mean squared prediction error (RMSPE). The model's performance was quite affected when the number of training data used in the modeling procedure was small. The optimal sizes of training data were 100–150 for point prediction and 200–250 for total prediction. SLM showed its applicability to wider conditions in that it produced better performance in most cases. RF imputation produced poorer performances than the other methods, particularly with lower prediction interval coverage. This might be because RF imputation had some bias and a smaller prediction standard error; the poor performance by RF did not stem from the smaller number of predictor variables.

Résumé. Des méthodes de modélisation choisies sont comparées pour prédire 5 attributs de la forêt, la surface terrière (BA), le volume de la tige (VOL), la hauteur de Lorey (LOR), le diamètre de la tige de surface terrière moyenne (QMD) et la densité des arbres (DEN), à partir de mesures LiDAR aéroporté dans le sud-ouest de l'Oregon, aux États-Unis. Les méthodes choisies ont inclus l'imputation du voisin le plus similaire (most similar neighbor; MSN), l'imputation du gradient du plus proche voisin (gradient nearest neighbor; GNN), l'imputation basée sur les forêts d'arbres décisionnels (Random Forest; RF), l'imputation BestNN, la régression de la méthode des moindres carrés ordinaire (ordinary least square; OLS), le modèle spatial linéaire (spatial linear model; SLM), et la régression géographiquement pondérée (geographically weighted regression; GWR). Plusieurs essais de chaque méthode ont été évalués par 500 simulations avec des nombres différents de données d'apprentissage. Aucune méthode de modélisation ne fut toujours supérieure aux autres dans la prédiction des attributs forestiers. La meilleure méthode a varié selon la variable de réponse, le type de prédiction et les mesures de performance, même s'il y avait un meilleur groupe de méthodes (SLM, OLS, BestNN, et GWR) qui a toujours mieux performé que les autres en ce qui concerne l'erreur quadratique moyenne de prévision (RMSPE). La performance du modèle a été fortement affectée quand seulement un petit nombre de données d'apprentissage a été utilisé dans la procédure de modélisation. Les nombres optimaux de données d'apprentissage étaient de 100–150 pour des prévisions ponctuelles et 200–250 pour la prédiction totale. Le SLM a montré son applicabilité à des conditions plus étendues, car il a produit une meilleure performance dans la plupart des cas. L'imputation RF a produit des performances inférieures aux autres méthodes, notamment à cause d'une couverture inférieure de l'intervalle de prévision. Ce pourrait être parce que l'imputation RF avait un certain biais et une plus petite erreur standard de prévision. La mauvaise performance de l'imputation RF ne provient pas du plus petit nombre de variables prédictives.

ACKNOWLEDGMENTS

Thanks to Stephen E. Reutebuch and Robert J. McGaughey for their help and support. We are grateful to Dr. Jay Ver Hoef for sharing his R codes and for his insights. We also appreciate Dr. Jim Flewelling for his insights and review of an earlier draft.

FUNDING

This research is funded by USDA Forest Service (11-MU-11261979-053).

Notes

Reprints and Corporate Permissions

Please note: Selecting permissions does not provide access to the full text of the article, please see our help page How do I view content?

To request a reprint or corporate permissions for this article, please click on the relevant link below:

Academic Permissions

Please note: Selecting permissions does not provide access to the full text of the article, please see our help page How do I view content?

Obtain permissions instantly via Rightslink by clicking on the button below:

If you are unable to obtain permissions via Rightslink, please complete and submit this Permissions form. For more information, please visit our Permissions help page.