358
Views
3
CrossRef citations to date
0
Altmetric
Articles

Forecasting conflict using a diverse machine-learning ensemble: Ensemble averaging with multiple tree-based algorithms and variance promoting data configurations

Pages 555-578 | Published online: 01 Dec 2021
 

Abstract

The article examines the potential of multi-model ensemble learning techniques for conflict research and applies an ensemble averaging framework to the prediction task of the 2020 ViEWS armed conflict forecasting competition. The goal is to predict changes of conflict intensity in fifty-four African countries for 6 months into the future. The presented ensemble combines six individual models, using two tree-based learning algorithms, incorporating two distinct data foundations and two geographical selections into a unified forecasting framework. In one of the two applied datasets, the combination of conflict variables from recent months is implemented to train for inter-temporal connections of previous conflict levels. The second dataset contains important structural, economic, political, and social information relevant for each individual case. Both datasets are used to predict changes in conflict levels. The framework structure and the combination method are presented in detail, and the prediction results for both test periods between 2014–2016 and 2016–2019 are evaluated regarding their quality. The effect of the ensemble structure and the performance of all individual components is comprehensively examined. Real forecasts over the timespan of six months into the future are presented for the upcoming months of October 2020 through March 2021 generated from data available until August 2020. The paper concludes with the presentation and examination of three selected case forecasts for Egypt, Cameroon, and Mozambique.

El artículo examina el potencial de las técnicas de aprendizaje de conjuntos multimodelos para la investigación de conflictos y aplica un marco de promedio de conjuntos a la tarea de predicción del concurso de previsión de conflictos armados; ViEWS Citation2020. La meta es predecir los cambios en la intensidad de los conflictos en cincuenta y cuatro países africanos durante seis meses en el futuro. El conjunto presentado combina seis modelos individuales, que utilizan dos algoritmos de aprendizaje basados en árboles, y que incorporan dos bases de datos distintas y dos selecciones geográficas en un marco de previsión unificado. En uno de los dos conjuntos de datos aplicados, se implementa la combinación de variables de conflicto de los últimos meses para estudiar las conexiones intertemporales de los niveles de conflicto anteriores. El segundo conjunto de datos contiene información estructural, económica, política y social importante para cada caso individual. Ambos conjuntos de datos se utilizan para predecir los cambios en los niveles de conflicto. La estructura del marco y el método de combinación se presentan en detalle, y se evalúa la calidad de los resultados de la predicción para ambos períodos de prueba entre 2014-2016 y 2016-2019. Se analiza a fondo el efecto de la estructura del conjunto y el funcionamiento de todos los componentes individuales. Se presentan previsiones reales a seis meses, para los próximos meses de octubre de 2020 a marzo de 2021, generados a partir de los datos disponibles hasta agosto de 2020. El artículo concluye con la presentación y el análisis de tres previsiones de casos seleccionados de Egipto, Camerún y Mozambique.

Cet article examine le potentiel des techniques d’apprentissage ensembliste multi-modèles pour les recherches sur les conflits et applique un cadre de moyennage ensembliste à la tâche de prédiction du concours de prévision des conflits armés ViEWS (violence early-warning system, système d’alerte précoce sur la violence) 2020. L’objectif est de prédire les changements d’intensité des conflits dans cinquante-quatre pays africains sur les six mois à venir. L’ensemble présenté combine six modèles individuels en utilisant deux algorithmes d’apprentissage basés sur des arbres et en intégrant deux fondations de données distinctes et deux sélections géographiques à une infrastructure de prévision unifiée. Dans l’un des deux jeux de données appliqués, la combinaison des variables de conflit des derniers mois est implémentée pour entraîner les algorithmes sur les relations inter-temporelles des intensités de conflits précédentes. Le deuxième jeu de données contient d’importantes informations structurelles, économiques, politiques et sociales concernant chacun des cas individuels. Les deux jeux de données sont utilisés pour prédire les changements d’intensité des conflits. La structure de l’infrastructure et la méthode de combinaison sont présentées en détails et la qualité des résultats des prédictions est évaluée pour les deux périodes de test, 2014-2016 et 2016-2019. L’effet de la structure ensembliste et les performances de toutes les composantes individuelles sont examinés en profondeur. Les prévisions réelles sur une période de six mois sont présentées pour les mois à venir qui étaient octobre 2020 à mars 2021. Ces prévisions avaient été générées à partir des données disponibles jusqu’août 2020. L’article conclut par une présentation et un examen d’une sélection de prévisions pour trois cas, ceux de l’Égypte, du Cameroun et du Mozambique.

View correction statement:
Correction

Correction Statement

This article was originally published with errors, which have now been corrected in the online version. Please see Correction (http://dx.doi.org/10.1080/03050629.2022.2101217).

Acknowledgments

I want to thank both anonymous reviewers for their comprehensive feedback and Sarah Link and Elina Schleutker for their helpful comments on the draft.

Disclosure statement

No potential conflict of interest was reported by the author(s).

Notes

1 t0 is here defined as the last month of available data in consideration of the proposed time-step setup of the competition. For a forecast of 2 months into the future (defined as s = 2 by ViEWS) t0 represents the variable data available two months before the predicted month. The t-1 variable added to this time-step thus is the selected variable at 3 months before the predicted month. t-2 at 4 months, t-3 at 5 months and so on.

Log in via your institution

Log in to Taylor & Francis Online

PDF download + Online access

  • 48 hours access to article PDF & online version
  • Article PDF can be downloaded
  • Article PDF can be printed
USD 53.00 Add to cart

Issue Purchase

  • 30 days online access to complete issue
  • Article PDFs can be downloaded
  • Article PDFs can be printed
USD 640.00 Add to cart

* Local tax will be added as applicable

Related Research

People also read lists articles that other readers of this article have read.

Recommended articles lists articles that we recommend and is powered by our AI driven recommendation engine.

Cited by lists all citing articles based on Crossref citations.
Articles with the Crossref icon will open in a new tab.