539
Views
6
CrossRef citations to date
0
Altmetric
Original Articles

An Application of Principal Component Analysis on Multivariate Time-stationary Spatio-temporal Data

Une application de l’Analyse de Composante principale sur des données spatio-temporelles à temps stationnaire multivarié

Una aplicación del análisis de componentes principales sobre datos multivariables espacio-temporales y estacionarios en el tiempo

关于多变量短时平稳时空数据的主成分分析应用

Pages 160-180 | Received 28 Feb 2014, Accepted 06 Nov 2014, Published online: 27 Mar 2015
 

Abstract

Principal component analysis (PCA) denotes a popular algorithmic technique to dimension reduction and factor extraction. Spatial variants have been proposed to account for the particularities of spatial data, namely spatial heterogeneity and spatial autocorrelation, and we present a novel approach which transfers PCA into the spatio-temporal realm. Our approach, named spatio-temporal principal component analysis (stPCA), allows for dimension reduction in the attribute space while striving to preserve much of the data's variance and maintaining the data's original structure in the spatio-temporal domain. Additionally to spatial autocorrelation stPCA exploits any serial correlation present in the data and consequently takes advantage of all particular features of spatial-temporal data. A simulation study underlines the superior performance of stPCA if compared to the original PCA or its spatial variants and an application on indicators of economic deprivation and urbanism demonstrates its suitability for practical use.

Résumé

L’analyse en composante principale (ACP) dénote une technique algorithmique populaire pour la réduction de dimensions et l’extraction de facteurs. Des variantes spatiales ont été proposées pour tenir compte des particularités des données spatiales, à savoir l’hétérogénéité spatiale et l’autocorrélation spatiale, et nous présentons une nouvelle méthode transférant l’analyse en composante principale dans le contexte spatio-temporel. Notre méthode, dénommée ACPst, tient compte de la réduction des dimensions dans l’attribut espace, tout en s’efforçant de conserver une grande partie de la variance des données et en maintenant la structure originale des données dans le contexte spatio-temporel. En plus de l’autocorrélation spatiale, l’ACPst exploite toute corrélation série présente dans les données, et tient compte, en conséquence, de toutes les particularités des données spatio-temporelles. Une étude de simulation souligne le rendement supérieur de l’ACPst lorsqu’on le compare à l’ACP original ou ses variantes spatiales, et une application sur les indicateurs du dénuement économique et de l’urbanisme démontre sa convenance pour des applications pratiques.

Resumen

el análisis de componentes principales indica una técnica algorítmica conocida para la reducción dimensional y la extracción factorial. Se han propuesto variables espaciales para tener en cuenta las particularidades de los datos espaciales, específicamente la heterogeneidad espacial y la autocorrelación espacial, y presentamos un nuevo enfoque que transfiere el análisis de componentes principales al dominio espaciotemporal. Nuestro enfoque, que se denomina stPCA, da cabida a la reducción dimensional en el espacio de los atributos, además de preservar una gran parte de la varianza de los datos y de mantener la estructura original de los datos en el dominio espaciotemporal. Además de la autocorrelación espacial, el método stPCA explota cualquier correlación serial presente en los datos y, en consecuencia, aprovecha todas las características particulares de los datos espaciotemporales. Un estudio de simulación destaca el rendimiento superior del método stPCA si se compara con el PCA o sus variantes espaciales y una aplicación sobre los indicadores de privación económica y urbanismo, demuestra su idoneidad para el uso práctico.

摘要

主成分分析法是指一种流行的降维和因素抽取算法技术。已有人提出用空间变异来解释空间数据的特殊性,即空间异质性和空间自相关。我们则提出了一种将主成分分析转移到时空境界的新的做法。 我们采用的名为 stPCA 的方法,可在属性空间降低维度,同时尽量保持更多数据的方差,并维护时空域中数据的原始结构。除了空间自相关之外, stPCA 还利用存在于数据中的序列相关性。因此,利用了所有时空数据的特殊功能。与原来的PCA或其空间变异相比,模拟研究强调了 stPCA 的卓越性能,而经济贫困和城市化指标的应用则表明了其实际应用的适用性。

JEL Classification:

Additional information

Funding

The financial support from the Deutsche Forschungsgemeinschaft via SFB 649 ‘Ökonomisches Risiko’, Humboldt–Universität zu Berlin, and IRTG 1792 ‘High Dimensional Non Stationary Time Series’, Humboldt–Universität zu Berlin, is gratefully acknowledged.

Reprints and Corporate Permissions

Please note: Selecting permissions does not provide access to the full text of the article, please see our help page How do I view content?

To request a reprint or corporate permissions for this article, please click on the relevant link below:

Academic Permissions

Please note: Selecting permissions does not provide access to the full text of the article, please see our help page How do I view content?

Obtain permissions instantly via Rightslink by clicking on the button below:

If you are unable to obtain permissions via Rightslink, please complete and submit this Permissions form. For more information, please visit our Permissions help page.