Séminaire de Statistique et Optimisation

Optimalité de la Méthode Généralisée de Partage des Poids double et application à l'estimation du Trafic Postal en France

par Estelle Medous (Laboratoire de Mathématiques Jean Leray - LMJL)

Europe/Paris
Salle K. Johnson, 1er étage (1R3)

Salle K. Johnson, 1er étage

1R3

Description
Dans les enquêtes probabilistes, il arrive que la base de sondage de la population d’intérêt ne soit pas disponible. S’il existe une base de sondage liée à la population d’intérêt, un échantillon peut être obtenu par échantillonnage indirect. On peut ensuite déterminer les poids d’échantillonnage grâce à la méthode généralisée de partage des poids (MGPP) introduite par Deville et Lavallée (2006)[1] et Lavallée (2007)[2]. La MGPP est une méthode avantageuse, car il existe dans certaines situations des poids d’échantillonnage minimisant la variance de l’estimateur en résultant. Cependant, c’est une méthode complexe à appliquer quand les liens entre les populations sont difficiles à observer. Une solution est de considérer une population intermédiaire, liée à la base de sondage et à la population d’intérêt, puis d’utiliser un échantillonnage indirect double. Les poids d’échantillonnage peuvent être déterminés grâce à une MGPP double : la MGPP est utilisée deux fois, d’abord entre la base de sondage et la population intermédiaire, puis entre la population intermédiaire et la population d’intérêt. La MGPP double permet de réduire le nombre de liens à observer (Médous et al., 2023 [3]). Elle est donc plus facile à mettre en place que la MGPP, mais résulte souvent en une perte de précision. Néanmoins, il existe dans certaines situations des poids d’échantillonnage minimisant la variance de la MGPP double de manière à ne plus perdre en précision par rapport à la MGPP, tout en conservant les facilités de mise en place de la MGPP double. Quand ces poids ne sont pas calculables, comme dans l’enquête française sur le trafic postal, un poids alternatif peut être utilisé pour améliorer la précision de l’estimateur obtenu par MGPP double. Les résultats sont illustrés par des simulations Monte-Carlo et une application à l’estimation du trafic postal.
 


[1] Deville, J.-C. et Lavallée, P. (2006). Indirect sampling: the foundations of the generalized weight share method, Survey methodology, 32(2), 165-176.
 
[2] Lavallée, P. (2007). Indirect sampling, Springer-Verlag New York.
 
[3] Médous, E., Goga, C., Ruiz-Gazen, A., Beaumont, J. F., Dessertaine, A. et Puech, P. (2023). Many-to-One indirect sampling with application to the French postal traffic estimation. Annals of Applied Statistics,17 (1), 838-859.