Abstract
The effects of outliers on linear regression are examined. The sensitivity of classical least‐squares (LS) procedures to outliers is shown to be associated with the geometric inconsistency between the data space and the analysis space. This is illustrated for both estimation and inference. A geometrically consistent procedure based on the Euclidean distance is proposed. This procedure involves the least absolute deviation (LAD) regression and a new permutation test for matched pairs (PTMP). Comparisons made with LS techniques demonstrate that the proposed procedure is more resistant to the existence of outliers in the data set and leads to more intuitive results. Applications and illustrations using meteorological and climatological data are also discussed.
Résumé
On examine les effets des données séparées sur la regression linéaire. On montre que la sensibilité des méthodes types des moindres carrés (LS) aux données séparées est associée à l'inconsistance géométrique entre l'espace des données et celle de l'analyse; cela est illustré pour V estimation et l'inference. On propose une méthode géométrique consistante basée sur la distance euclédienne. Cette méthode comprend la regression de la moindre déviation absolue (LAD) et un nouvel essai de permutation pour les paires appariées (PTMP). Les comparaisons entre les techniques LS montrent que la méthode proposée résiste mieux aux données séparées de l'ensemble et entraîne des résultats plus intuitifs. On présente aussi des applications et des illustrations à l'aide de données météorologiques et climatologiques.