Upcoming presentations
Réunion d'équipe
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 24 April 2025 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Pascal Moyal Résumé :Réunion d’équipe possible
Polytopes aléatoires et corps flottants - Partie 2
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 24 April 2025 15:30-17:00 Lieu : Salle de conférences Nancy Oratrice ou orateur : Xavier Goaoc Résumé :Deuxième de deux séances.
Un modèle classique de polytope aléatoire proposé par Renyi et Sulanke dans les années 60 consiste à fixer un corps convexe K de R^d, à y choisir n points aléatoires indépendants et uniformément distribués, et à en prendre l’enveloppe convexe K(n). L’asymptotique, pour d fixé et n tendant vers l’infini, du volume de K(n) a été reliée à l’analyse des corps flottants de K par Bárány et Larman dans les années 80. Certaines idées derrière ce lien ont été généralisées dans le “théorème de l’epsilon-net” prouvé par Haussler et Welzl au début des années 90.
Je donnerai une introduction à ces notions, avec l’idée d’aborder lors d’une éventuelle seconde séance, un travail commun avec Imre Bárány, Matthieu Fradelizi, Alfredo Hubard et Günter Rote sur la généralisation du lien polytope aléatoire/corps flottant au cas où la mesure uniforme sur K est remplacée par une mesure plus générale (https://doi.org/10.5802/ahl.44).
Skorokhod spaces and convergence of discontinuous processes.
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 15 May 2025 09:15-10:30 Lieu : Oratrice ou orateur : Virgile Brodu Résumé :What happens if we want to study the convergence of discontinuous real-valued stochastic processes, which is often the case for modelling purposes? For example, think of tracking the evolution of the population size of living species, where deaths are instantaneous negative jumps… In 1956, Skorokhod proposed a topology on the space of discontinuous functions, which is predominant today. The aim of this talk is to explain the simple and intuitive ideas underlying the construction of Skorokhod to facilitate its understanding, without going in the depth of technical proofs. If we have time, we will introduce measure-valued processes, with biological motivations, and explain how the Skorokhod construction can be generalized to more complex spaces such as these measure spaces.
Even if the present talk is self-contained, it can be seen as an introduction to the GdT of May, 22. I will also present my work about measure-valued processes during the GdT SIMBA of April, 24 (14h, Salle de Conférences). You are warmly welcome to attend one of these to discover some of my PhD research!
A result of convergence for measure-valued processes.
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 22 May 2025 09:15-10:30 Lieu : Oratrice ou orateur : Virgile Brodu Résumé :First, we introduce c`adl`ag measure-valued processes, with biological motivations. We focus on the
construction with Poisson point measures and the useful martingale properties it entails. Then, we
present a general convergence result for these measure-valued processes. We insist on the topological
difficulties encountered, related to Skorokhod spaces. Thus, even if it is self-contained, this talk can
be seen as a natural continuation of the GdT of May, 15.
Note that I also present this work during the GdT SIMBA on April, 24 (14h, Salle de Conf´erences),
with a focus on the new results we obtain compared to the existing literature. This is joint work with
Nicolas Champagnat and Coralie Fritsch
Pas presentations
Colloquinte et pique nique
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 20 June 2024 09:00-14:00 Lieu : Salle Döblin Oratrice ou orateur : Equipe PS Résumé :Voici à nouveau le colloquinte, photo d’équipe et pique nique. Tenez vous libres entre 9h15 et 14h. Nous serons en salle Döblin.
Programme preliminaire:
10h00 * Pause café *
10h30 Formes limites de tableaux de Young aléatoires et discontinuités, Valentin Feray,
11h15 Processus de branchement binaire avec interactions de type Moran (BBMMI), Denis Villemonais.
12h00 * Préparation pour le pique-nique sur le mode de l’auberge espagnole *
12h15 * Photo d’équipe *
A new sampling framework for spatial surveys with application to the french national forest inventory
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 30 May 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Trinh Duong (LIF, LabEx ARBRE) Résumé :Surveying natural populations is challenging due to their scattered distribution across a territory. To create spatially balanced samples, surveys typically divide the territory into a spatial grid and either use the grid nodes to form the sample or select points within the grid cells. Sampling the cells adds an additional stage, as currently employed by the French National Forest Inventory (NFI) for annual estimates. However, little attention has been given to accounting for this stage. Double sampling for stratification is a general method that helps reduce the size of a field sample, which is particularly costly. To improve sampling efficiency, we propose a new framework called two-stage two-phase sampling, incorporating a two-stage sampling design in the first phase.
The Horvitz-Thompson estimator is used to estimate the total value. In the first stage, cells are sampled using spatially systematic sampling, and in the second stage, points within these cells are sampled uniformly. The classification of first-phase points into strata is performed through photo-interpretation. In the second phase, points are sampled using spatially systematic sampling over the first-phase sample, based on varying sampling intensities across the strata. To calculate the variance estimator, the global first-phase sample is modeled as uniform sampling, and the global second-phase sample is modeled as stratified simple random sampling. Our results indicate that the expansion estimator remains unbiased and the variance estimators are moderately conservative for the sampling design used by the French NFI.
Additionally, the forest is undergoing rapid changes due to various disturbances, which can be large-scale, such as windthrow or fire, or small-scale, like bark beetle infestations. Our project focuses on large-scale disturbances. Estimating the area affected by such disturbances, known as the area of interest, is interesting for foresters. To address this, we are considering the intensification method, which increases sampling intensity in the area of interest. This method requires higher sampling intensity in specific zones compared to others, resulting in different sampling intensities across regions. A two-stage two-phase sampling framework is particularly useful for managing these varying sampling rates during the second phase, as disturbance information only becomes available at this phase.
Possible réunion d'équipe
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 16 May 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Pascal Moyal Résumé :Le créneau du GDT est reservé pour une eventuelle réunion d’équipe, si elle n’a pas lieu avant.
Modélisation de la dégradation de batteries électriques avec quantification des incertitudes
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 6 May 2024 14:00-15:30 Lieu : Salle Döblin Oratrice ou orateur : Benjamin Larvaron (IECL/TotalEnergies) Résumé :Groupe de travail extraordinaire: preparation à la soutenance.
Les batteries Lithium-ion représentent actuellement un enjeu majeur pour l’industrie. Elles sont appelées à être utilisées massivement avec le développement des voitures électriques, ainsi pour le stockage d’énergie d’origine renouvelable, par nature intermittente et décentralisée. Au vu de ces enjeux de nombreux nouveaux modèles de batteries sont développés. Chacun vise à améliorer les performances précédentes et en particulier en ce qui concerne la durée de vie et la vitesse de dégradation. Ici, nous nous intéresserons à la modélisation statistique de cette dégradation, apprise à partir de mesures expérimentales du vieillissement. Pour que son utilisation soit fiable en pratique, cette modélisation doit être accompagnée d’une quantification des différentes sources d’incertitudes.
Dans un premier temps nous présenterons la modélisation de la dégradation à une condition expérimentale de référence. Pour ce faire nous utiliserons des méthodes centrées sur l’utilisation des processus gaussiens. Ces méthodes ont l’avantage de permettre l’apprentissage de fonctions complexes, tout en permettant une quantification des incertitudes de part leur nature probabiliste. Partant de l’état de l’art avec la régression par processus gaussien, nous verrons les limites de cette approche pour quantifier l’évolution temporelle des incertitudes et extrapoler les cycles futurs. En réponse, nous proposerons l’utilisation du cadre plus général de la régression par processus gaussiens chaînés complétée par l’intégration de contraintes sur les dérivés.
Dans un second temps, nous élargirons le problème au cas de plusieurs conditions expérimentales, avec l’objectif de prédire la dégradation à des conditions expérimentales non observées. Face aux difficultés rencontrées pour modéliser l’effet des conditions avec les méthodes par processus gaussiens, nous proposons une autre approche reposant sur la théorie du transport optimal. Nous introduirons l’idée d’un barycentre conditionnel de Wassertein comme de méthode de régression lorsque les sorties sont des distributions de probabilités. La régression Fréchet, un type particulier de barycentre conditionnel, sera utilisée pour modéliser l’effet de la température sur le vieillissement des batteries.
Introduction aux EDPS singulières et aux Structures de Régularité(III)
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 18 April 2024 09:15-10:30 Lieu : Salle de conférences Nancy Oratrice ou orateur : Yvain Bruned Résumé :Semi-LASSO: un weighted LASSO pour l'intégration de régresseurs connus dans un modèle linéaire
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 11 April 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Anouk Rago (IECL) Résumé :Le LASSO est une technique très largement utilisée lorsqu’il s’agit à la fois d’estimer les paramètres d’un modèle et d’effectuer une sélection de variables. Il est particulièrement utile pour étudier de grands jeux de données, comme cela peut être le cas en biologie des systèmes par exemple, ce qui le rend très utilisé dans le domaine de l’inférence de réseaux de gènes. Cette méthode peut par ailleurs être enrichie et améliorée par des connaissances préalables sur les régresseurs potentiels, afin de guider la sélection de variables. Dans ce cas, on peut employer un weighted LASSO, dérivé du LASSO original, dans lequel l’ajout de poids spécifiques à chaque variable permet d’encoder des a priori. Le package R `glmnet’ permet à l’utilisateur de spécifier ses propres poids via un paramètre. Nous introduisons ici une nouvelle méthode appelée semi-LASSO qui résout un cas spécifique de weighted LASSO. Son implémentation repose sur l’utilisation du package `glmnet’, mais inclut une première étape de réduction de dimension pour une meilleure optimisation de la fonction de coût du LASSO. Des simulations numériques sont effectuées sur des données synthétiques afin de comparer les résultats obtenus avec le weighted LASSO de `glmnet’ et notre méthode semi-LASSO.
Introduction aux EDPS singulières et aux Structures de Régularité(II)
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 4 April 2024 09:15-10:30 Lieu : Salle Döblin Oratrice ou orateur : Yvain Bruned Résumé :Introduction aux EDPS singulières et aux Structures de Régularité(I)
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 21 March 2024 09:15-10:30 Lieu : Salle de conférences Nancy Oratrice ou orateur : Yvain Bruned Résumé :Moyenne et Composantes Principales de séries temporelles, une nouvelle approche avec la méthode de la signature II
Catégorie d'évènement : Groupe de travail Probabilités et Statistique Date/heure : 15 February 2024 09:15-10:15 Lieu : Salle de conférences Nancy Oratrice ou orateur : Raphael Mignot (IECL) Résumé :Suite du groupe de travail du 1er février. Le résumé est actualisé.
L’objectif de notre travail est double : établir un barycentre de séries temporelles multidimensionnelles et trouver des directions d’importance. Nous encodons les séries temporelles avec des intégrales de différents ordres de moments, constituant leur signature.
Dans un premier groupe de travail (1er fév.), nous avons introduit la topologie de l’espace des signatures et de leur espace ambiant, ainsi que leurs propriétés fondamentales. L’espace des coefficients de signature est une variété avec une structure de groupe mais sans métrique riemannienne bi-invariante, ce qui rend difficile l’utilisation d’approches Riemanniennes classiques.
Dans cet épisode 2, nous reviendrons sur les barycentres de signatures puis nous introduirons une généralisation de l’Analyse en Composantes Principales aux variétés différentiables. Dans le même esprit que la procédure de calcul de la moyenne, nous cherchons les géodésiques importantes. Importantes dans le sens où les coefficients de signature ont une variance maximale le long de ces géodésiques. Elles décrivent donc bien les données dans l’espace des coefficients de signature. Ces directions principales peuvent être utilisées pour une interprétation qualitative des données, mais aussi pour la réduction de dimension, comme on le fait avec l’analyse en composantes principales lorsqu’on analyse des données dans un espace Euclidien.