9,080
Views
278
CrossRef citations to date
0
Altmetric
Methods, Models, and GIS

Principal Component Analysis on Spatial Data: An Overview

, , , &
Pages 106-128 | Received 01 Nov 2010, Accepted 01 Sep 2011, Published online: 05 Jul 2012
 

Abstract

This article considers critically how one of the oldest and most widely applied statistical methods, principal components analysis (PCA), is employed with spatial data. We first provide a brief guide to how PCA works: This includes robust and compositional PCA variants, links to factor analysis, latent variable modeling, and multilevel PCA. We then present two different approaches to using PCA with spatial data. First we look at the nonspatial approach, which avoids challenges posed by spatial data by using a standard PCA on attribute space only. Within this approach we identify four main methodologies, which we define as (1) PCA applied to spatial objects, (2) PCA applied to raster data, (3) atmospheric science PCA, and (4) PCA on flows. In the second approach, we look at PCA adapted for effects in geographical space by looking at PCA methods adapted for first-order nonstationary effects (spatial heterogeneity) and second-order stationary effects (spatial autocorrelation). We also describe how PCA can be used to investigate multiple scales of spatial autocorrelation. Furthermore, we attempt to disambiguate a terminology confusion by clarifying which methods are specifically termed “spatial PCA” in the literature and how this term has different meanings in different areas. Finally, we look at a further three variations of PCA that have not been used in a spatial context but show considerable potential in this respect: simple PCA, sparse PCA, and multilinear PCA.

Este artículo considera críticamente la manera de utilizar con datos espaciales uno de los métodos estadísticos más viejos y de aplicación generalizada, el análisis de componentes principales (ACP). Antes de todo, suministramos una breve guía sobre cómo trabaja el ACP: Esto incluye variantes del ACP robustas y composicionales, vínculos con el análisis factorial, modelización de variable latente, y ACP de nivel múltiple. Luego presentamos dos enfoques diferentes para utilizar el ACP con datos espaciales. Primero, dirigimos nuestra atención al enfoque no espacial, que evita los problemas que surgen cuando los datos espaciales se utilizan con un ACP estándar de solo el espacio como atributo. Dentro de este enfoque identificamos cuatro metodologías principales, las cuales definimos como (1) el ACP aplicado a objetos espaciales, (2) el ACP aplicado a datos raster, (3) el ACP para ciencia atmosférica, y (4) el ACP para flujos. En el segundo enfoque, tratamos al ACP adaptado para efectos en el espacio geográfico, examinando métodos de ACP adaptados para efectos no estacionarios de primer orden (heterogeneidad espacial) y efectos estacionarios de segundo orden (autocorrelación espacial). También describimos la manera de utilizar el ACP para investigar múltiples escalas de autocorrelación espacial. Adicionalmente, intentamos desambiguar una confusión de terminología aclarando qué métodos son específicamente denominados “ACP espacial” en la literatura y cómo esta expresión tiene significados diferentes en áreas distintas. Por último, dirigimos nuestra atención a tres variaciones adicionales del ACP que no han sido usadas en un contexto espacial pero que muestran considerable potencial en este respecto: ACP simple, ACP ralo y ACP multilineal.

Acknowledgments

The authors would like to thank the three anonymous reviewers whose comments helped to significantly improve this article. Urška Demšar's work on this topic is supported by a Research Frontiers Programme Grant (09/RFP/CMS2250) by Science Foundation Ireland under the National Development Plan. Paul Harris and Sean McLoone are funded by a Strategic Research Cluster Grant (07/SRC/I1168) by Science Foundation Ireland under the National Development Plan.

Reprints and Corporate Permissions

Please note: Selecting permissions does not provide access to the full text of the article, please see our help page How do I view content?

To request a reprint or corporate permissions for this article, please click on the relevant link below:

Academic Permissions

Please note: Selecting permissions does not provide access to the full text of the article, please see our help page How do I view content?

Obtain permissions instantly via Rightslink by clicking on the button below:

If you are unable to obtain permissions via Rightslink, please complete and submit this Permissions form. For more information, please visit our Permissions help page.