Accéder directement au contenu Accéder directement à la navigation
Communication dans un congrès

Deux algorithmes pour la classification non supervisée de données géostatistiques

Résumé : Avec le développement des plateformes de télédétection, aéroportées ou satellites, et l'évolution des moyens d'échantillonnage des compagnies minières ou pétroli-ères, les jeux de données spatiales deviennent de plus en plus grands, renseignent un nombre croissant de variables et couvrent des étendues de plus en plus larges. De fait, il devient souvent nécessaire de séparer le domaine d'étude en différentes zones homogènes afin de simplifier l'étape de modélisation. La définition de ces zones peut se voir comme un problème de classification non supervisée où l'on cherche à découper le domaine d'étude en zones homogènes en fonction des variables renseignées. L'application des méthodes de classification pour des observations indépendantes ne permet généralement pas de conserver une cohérence spatiale dans les zones ainsi formées. Les algorithmes de segmentation d'image, basés sur des champs de Markov, ne sont quant à eux pas adaptées lorsque le plan d'échantillonnage n'est pas régulier (Ambroise et al., 1995 ). Les approches existantes (cf. e.g. Allard et Guillot, 2000 et Guillot et al., 2006), basées sur une estimation de mélange de fonctions aléatoires gaussiennes par l'algorithme E-M, sont limitées à des tailles d'échantillon raisonnables pour un faible nombre de variables. Nous proposons dans ce travail deux algorithmes basés sur des adaptations d'algorithmes classiques, qui permettent de traiter un large volume de données. Le premier procède par classification ascendante hiérarchique tandis que le second est basé sur la méthode de classification spectrale. Les deux algorithmes sont appliqués à des jeux de données synthétiques et à un jeu de données minières.
Type de document :
Communication dans un congrès
Liste complète des métadonnées

Littérature citée [4 références]  Voir  Masquer  Télécharger

https://hal-mines-paristech.archives-ouvertes.fr/hal-00842826
Contributeur : Thomas Romary <>
Soumis le : mardi 9 juillet 2013 - 15:11:53
Dernière modification le : jeudi 24 septembre 2020 - 16:34:06
Archivage à long terme le : : jeudi 10 octobre 2013 - 04:12:16

Fichier

TexteLong_vmodif.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-00842826, version 1

Citation

Thomas Romary. Deux algorithmes pour la classification non supervisée de données géostatistiques. 45e Journées de Statistique, May 2013, France. ⟨hal-00842826⟩

Partager

Métriques

Consultations de la notice

192

Téléchargements de fichiers

1958