Abstract
In this paper, the central Indian Ocean (60°–95°E, 0°–37°S) has been selected as the research area, and Argo salinity data are used as the measured values. The Catboost algorithm is introduced for the first time to retrieve sea surface salinity, and a comparison is made with the traditional artificial neural network (ANN) and random forest (RF) machine learning algorithm. The results show that: (1) Through linear fitting with the Argo salinity, the R2 of the three machine learning methods are 0.9299, 0.88 and 0.83, respectively. The corresponding RMSE were 0.2360, 0.3004, and 0.3156 psu, and MAE were 0.1816, 0.2486, and 0.2641 psu, respectively. (2) The spatial distribution of salinity of Argo and SMOS was compared with the inversion results of the model. It was found that the salinity of the sea area was lower at (83°–88°E, 24°–27°S) and (68°–72°E, 17°–20°S), and higher at 30°–35° south latitude, showing consistent with Argo. (3) The stability of the model was independently verified using the data from January to March 2020, and it was found that the R2 of the RF model shows the best stability, while the R2 of the ANN model shows the worst stability.
RÉSUMÉ
Dans cet article, le centre de l’océan Indien (60°–95°E, 0°–37°S) a été choisi comme zone de recherche, et les données de salinité Argo sont utilisées comme valeurs mesurées. L’algorithme Catboost est introduit pour la première fois pour récupérer la salinité à la surface de la mer, et une comparaison est faite avec le traditionnel réseau de neurones artificielles (ANN) et l’algorithme d’apprentissage automatique Random Forest (RF). Les résultats montrent que: (1) Par ajustement linéaire avec la salinité Argo, les R2 des trois méthodes d’apprentissage automatique sont respectivement de 0.9299, 0.88 et 0.83. Les RMSE correspondantes sont 0.2360, 0.3004, et 0.3156 psu, et les MAE sont 0.1816, 0.2486, et 0.2641 psu, respectivement. (2) La distribution spatiale de la salinité d’Argo et de SMOS a été comparée aux résultats d’inversion du modèle. On a constaté que la salinité de la zone de la mer était plus basse à (83°–88°E, 24°–27°S) et (68°–72°E, 17°–20°S), et plus élevée à 30°–35° de latitude sud, ce qui correspond à Argo. (3) La stabilité du modèle a été vérifiée indépendamment en utilisant les données de janvier à mars 2020, et il a été constaté que le R2 du modèle RF montre la meilleure stabilité, tandis que le R2 du modèle ANN montre la plus mauvaise stabilité.
Acknowledgments
The authors would like to thank the European Centre for Medium-Range Weather Forecasts (ECMWF), data from the SMOS satellite and the Argo observations, which were instrumental to the success of this research. The authors are also grateful to Yuan Huang from Singularity Innovation Inc and Jingran Sheng from Ningbo Globfishing Corp for their significant contributions to the revision of this manuscript.
Disclosure statement
No conflict of interest was reported by the author (s).