Exposés à venir
Archives
Algorithmes stochastiques pour la statistique robuste en grande dimension
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 11 janvier 2018 10:45-11:45 Lieu : Oratrice ou orateur : Antoine Godichon Résumé :La médiane géométrique est souvent utilisée en statistique du fait de sa robustesse. On s’intéresse donc à des estimateurs rapides de la médiane, qui consistent en des algorithmes de gradient stochastiques moyennés. On définit aussi un nouvel indicateur de dispersion robuste, appelé Matrice de Covariance Médiane, avant d’en donner des estimateurs récursifs. Cette matrice, sous certaines hypothèses, a les mêmes sous-espaces propres que la matrice de covariance, mais est moins sensible aux données atypiques, et est donc très intéressante pour l’Analyse en Composantes Principales Robuste. Travail joint avec Hervé Cardot et Peggy Cénac (Université de Bourgogne).
Automates cellulaires probabilistes de mémoire 2
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 21 décembre 2017 10:45-11:45 Lieu : Oratrice ou orateur : Jérôme Casse Résumé :Ces travaux ont été effectués en collaboration avec Irène Marcovici.
Un automate cellulaire probabiliste (ACP) de mémoire 2 est un algorithme stochastique qui transforme 2 mots bi-infinis $a = eta_0 = (a_i)_{i in Z}$ et $b = eta_1 = (b_i)_{i in Z}$ en un troisième $c = eta_3 = (c_i)_{i in Z}$ de tel sorte que la loi de la lettre $c_i$ ne dépend que des lettres $(b_i,a_{i+1},b_{i+1})$. Les lettres $c_i$ sont choisies de manière synchrone et indépendante. Après avoir obtenu le mot $c$, on peut ré-appliquer l’ACP en prenant en entrée les mots $(b,c)$ et ainsi de suite. On obtient alors une suite de mots $(eta_t)_{t > 0}$ dont les lettres $(eta_t(i))$ forme ce que l’on appelle le diagramme espace-temps.
Ces ACP de mémoire 2 ont été initialement définis pour étudier le modèle à 8 sommets et nous verrons qu’ils sont également liés à d’autres modèles de la physique statistique comme, par exemple, un nouveau modèle de TASEP synchrone ou le modèle d’Eden dans le demi-plan sur le réseau triangulaire.
Dans cet exposé, nous étudierons les lois invariantes de ces ACP, l’ergodicité de ces derniers, ainsi que les propriétés d’invariance de leur diagramme espace-temps. Ce sont des problèmes insolubles dans le cas général (y compris pour les ACP à mémoire 1) et pour cela nous verrons que nous devons restreindre l’étude à des cas o๠la loi invariante est de type mesure produit ou de type Markov.
S’il nous reste un peu de temps à la fin, nous verrons comme les méthodes employées dans cet exposé permettent de déduire rapidement des propriétés sur un modèle de TASEP synchrone
généralisé.
Estimation of Functional Sparsity in Nonparametric Varying Coefficient Models for Longitudinal Data Analysis
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 14 décembre 2017 10:45-11:45 Lieu : Oratrice ou orateur : Juhyun Park Résumé :We study the simultaneous domain selection problem for varying coefficient models as a functional regression model for longitudinal data with many covariates. The domain selection problem in functional regression mostly appears under the functional linear regression with scalar response but there is no direct correspondence to functional response models with many covariates. We reformulate the problem as nonparametric function estimation under the notation of « functional sparsity ». Sparsity is the recurrent theme that encapsulates interpretability in the face of regression with multiple inputs, and the problem of sparse estimation is well understood in the parametric setting as variable selection. For nonparametric models, interpretability not only concerns the number of covariates involved but also the {em functional form} of the estimates, and so the sparsity consideration is much more complex. To distinguish the types of sparsity in nonparametric models, we call the former « global sparsity » and the latter « local sparsity », which constitute functional sparsity. Most existing methods focus on directly extending the framework of parametric sparsity for linear models to nonparametric function estimation to address one or the other, but not both. We develop a penalized estimation procedure that simultaneously addresses both types of sparsity in a unified framework. We establish asymptotic properties of estimation consistency and sparsistency of the proposed method. Our method is illustrated in simulation study and real data analysis, and is shown to outperform the existing methods in identifying both local sparsity and global sparsity.
[this is a joint work with Catherine Y. Tu and Haonan Wang from Colorado State University, U.S.A.]
Convergence de la DSF vers le BW
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 7 décembre 2017 10:45-11:45 Lieu : Oratrice ou orateur : TRAN Viet Chi Résumé :Nous considérons, sur le plan, la DSF (Directed Spanning Forest) qui est une forêt dirigée introduite par Baccelli et Bordenave (2007). Soient un processus de Poisson homogène dans le plan et une direction privilégiée (par exemple -e_y). Nous définissons l’ancêtre de chaque atome du processus de Poisson comme étant l’atome le plus proche (pour la distance euclidienne) et d’ordonnée supérieure. Le graphe résultant est la DSF : il s’agit d’une forêt, et même presque sà»rement d’un arbre. Sous de bonnes renormalisations, nous montrons que cette forêt converge en loi vers la toile Brownienne (BW, comme Brownian Web). Dans le cas de la DSF, la difficulté majeure est que la construction, pourtant simple et naturelle, crée des dépendances géométriques très complexes : au fur et à mesure de la construction du graphe, on accumule une information sur la vacuité de certaines régions (aléatoires) du plan. Les critères de convergence existant dans la littérature s’appuient sur des estimées obtenues en général par la construction de martingales ou chaînes de Markov, constructions qui sont impossibles ici. L’obtention de ces estimées clé s’appuie sur des idées de renouvellement fondées sur la géométrie du problème.
Ceci est un travail en commun avec D. Coupier, K. Saha et A. Sarkar.
Exposé à la Journée de la Fédération Charles Hermite "Apprentissage, machine learning" au LORIA
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 30 novembre 2017 10:45-11:45 Lieu : Oratrice ou orateur : Gilles Blanchard Résumé :Exposé dans le cadre du Forum des jeunes mathématiciennes et mathématiciens (lieu: amphi 5, Nancy)
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 23 novembre 2017 10:45-11:45 Lieu : Oratrice ou orateur : Marie-Pierre Etienne Résumé :Large-scale structure of the Universe: observer's point of view
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 16 novembre 2017 10:45-11:45 Lieu : Oratrice ou orateur : Elmo Tempel Résumé :The cosmic web is a highly complex geometrical pattern, with galaxy clusters at the intersection of filaments and filaments at the intersection of walls. Using observational data, we can visually recognize the main components of the cosmic web: voids, filaments and (super)clusters. However, to classify the cosmic web using mathematical methods is much more complicated task, which also involves the analysis of observational selection effects. In my talk I will give a brief overview about the observed large-scale structure together with the main selection effects that should be taken into account while analyzing the data.
Risques garantis pour les systèmes discriminants multi-classes à marge
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 9 novembre 2017 10:45-11:45 Lieu : Oratrice ou orateur : Yann Guermeur Résumé :La théorie statistique de l’apprentissage porte sur trois problèmes d’inférence empirique : la discrimination, la régression et l’estimation de la fonction de densité. Cette présentation se concentre sur la discrimination. Nous exposons les garanties disponibles sur les performances en généralisation des systèmes discriminants (risques garantis), en privilégiant le cas o๠ceux-ci s’appuient sur le concept de marge. L’intervalle de confiance de ces risques garantis dépend de trois paramètres principaux : la taille m de l’échantillon, le nombre C de catégories et la valeur gamma du paramètre de marge. Nous caractérisons cette dépendance en fonction du choix de la fonction de perte.
Identification et caractérisation de l'isotropie des champs aléatoires déformés via leurs ensembles d'excursion
Catégorie d'évènement : Séminaire Probabilités et Statistique Date/heure : 19 octobre 2017 10:45-11:45 Lieu : Oratrice ou orateur : Julie Fournier Résumé :Une application déterministe $theta$ de $R^2$ dans lui-même déforme le plan de façon bijective et régulière. Avec un champ aléatoire $X$ réel et défini sur $R^2$, régulier, stationnaire et isotrope, elle entre dans la construction d’un champ déformé défini comme la composée de $X$ avec $theta$. Un champ déformé est en général anisotrope, cependant certaines applications $theta$, dont on propose une caractérisation explicite, préservent l’isotropie. En supposant en outre que $X$ est gaussien, on définit une forme faible d’isotropie d’un champ déformé par une condition d’invariance de la caractéristique d’Euler moyenne de certains de ses ensembles d’excursion. On prouve que les champs déformés satisfaisant cette définition sont en réalité isotropes en loi. Dans une dernière partie de l’exposé, en supposant connue la caractéristique d’Euler moyenne de certains ensembles d’excursion d’un champ déformé, on prouve qu’il est possible d’identifier la déformation $theta$ associée.