Mots clefs

théorie de la mesure, probabilité, intelligence artificielle, équité, confidentialité, théorie de l'information, analyse topologique des données

Résumé

Mes travaux se concentrent principalement autour de l'utilisation de probabilité, de la théorie de la mesure et de la théorie de l'information pour étudier la confidentialité dans plusieurs systèmes et protocoles informatiques. J'ai démontré les garanties théoriques et la robustesse des sequential private identifiers pour le protocole LoRaWAN. J'ai démontré aussi plusieurs résultats théoriques liant équité et confidentialité en apprentissage automatique.

Mon nouveau projet de recherche est à l'interface de l'analyse topologique des données et de la confidentialité différentielle ! Je suis actuellement à la recherche d'un postdoc pour mener ce projet. Si vous êtes interessé contactez-moi.

Conférences internationales

On the Alignment of Group Fairness with Attribute Privacy, Jan Aalmoes, Vasisht Duddu and Antoine Boutet, Wise 2024.

Dans cet article nous avons mis en avant comment l'attaque d'inférence d'attribut sensible pouvait être mitigée par des propriétés d'équité, notamment la parité démographique. J'ai démontré plusieurs liens théoriques entre ces notions et j'ai introduit la parité démographique généralisée. Ces travaux se concentrent sur des classifieurs binaires et attaquent des attributs sensibles binaires. Cependant j'ai inclus dans mon manuscrit de thèse des résultats plus généraux que je compte publier sous forme d'un autre article.

Privacy-Preserving Pseudonyms for LoRaWAN, Samuel Pélissier, Jan Aalmoes, Abhishek Kumar Mishra, Mathieu Cunche, Vincent Roca, and Didier Donsez, Wisec 2024

Ici nous avons créé une évolution du protocole IOT LoRaWAN qui permet d'assurer une plus grande confidentialité aux utilisateurs. Ma contribution est une analyse probabiliste visant à étudier la loi de probabilité des collisions de paquets engendrées par cette modification. Cela m'a amené à créer une nouvelle loi de probabilité discrète pour laquelle j'ai calculé les moments, la fonction de masse et la fonction de répartition. Je n'ai pas pu inclure ces développements dans l'article suite à une contrainte de place, je prévois donc de les publier séparément, voici la pré-publication. Dans cette publication, nous nous sommes donc restreint au calcul de l'espérance qui peut être fait facilement par le biais d'une chaîne de Markov mais qui ne permet pas d'obtenir la loi.

MixNN: Protection of Federated Learning Against Inference Attacks by Mixing Neural Network Layers, Antoine Boutet, Thomas Lebrun, Jan Aalmoes, Adrien Baud, Middleware 2022.

Dans cet article, nous avons mis au point un protocole permettant de masquer les attributs sensibles des participants à un apprentissage fédéré. Ma contribution a été de démontrer que cette méthode ne modifie pas le modèle aggloméré final. Pour cela j'ai juste eu à réaliser un calcul sur des sommes.

Exposés

Fairness and sensitive attribute inference, Jan Aalmoes, Antoine Boutet, Workshop @ Comète on Ethical AI, 2023, L'X, Palaiseau, Paris, France.

J'ai présenté dans cet exposé de 15 minutes comment la parité démographique est équivalente à dire que le maximum d'exactitude équilibrée possible de l'attaque d'inférence d'attribut sensbile est égal à $\frac{1}{m}$ où m est le cardinal du codomaine de la variable aléatoire qui modélise l'attribut sensible.

Dikaios: Privacy Auditing of Algorithmic Fairness via Attribute Inference Attacks Jan Aalmoes, Vasisht Duddu, Antoine Boutet, APVP 2022 : 12ème Atelier sur la Protection de la Vie Privée

Cet exposé avait pour but de mettre en lumière l'impact du paramètre de régularisation dans la méthode \textit{Exponantiated gradient descent for fair classification} sur l'attaque d'inférence d'attribut sensible.

Machine learning, or how to build a racist, sexist and unprivate world, Jan Aalmoes, Antoine Boutet, 2022, 6th Winter School Distributed Systems and Networks, GDR RSD and ACM SIGOPS France

Dans cet exposé j'ai présenté mes premiers résultats expérimentaux qui mettent en avant les problèmes de confidentialité et d'équité. J'ai montré que sur de nombreux jeux de données réels (COMPAS, CENSUS, MEPS, CREDIT, LAW) on observe qu'une forêt aléatoire se comporte différement pour différents sous groupes de la population. J'ai présenté une première attaque qui permet d'inférer l'attribut sensible des utilisateurs au moment de l'inférence.

Pré-publications

(Tout début) Reconciliating differencial privacy and demographic parity with the help of synthetic data, Chapitre 7, section 7.2 de mon manuscrit de thèse.

La protection de la confidentialité des données d'entraînement entre en conflit avec l'équité en apprentissage automatique. Dans ce papier je montre que ces notions peuvent s'aligner en passant par une génération de données synthétiques. Pour cela j'ai dû introduire plusieurs notions nouvelles en topologie :

Les espaces métriques informationnels.
La $ε^{0}$ convergence en entraînement.

ε > ε^{0}

Adaptating the behaviour knowled space method to maximize balanced accuracy, Chapitre 4 de mon manuscrit de thèse.

Dans ce papier j'introduis un nouvel algorithme d'apprentissage ensembliste ayant pour but de maximiser l'exactitude équilibrée. $\frac{1}{# F} \sum_{i \in F} P (\hat{Y} = i ∣ Y = i)$ Cela permet de prendre en compte le déséquilibre dans les classes lors de l'apprentissage. Comme expliqué dans mon manuscrit de thèse, cet algorithme est très utile pour l'audit de la fuite d'informations sur les attributs sensibles des utilisateurs de modèle d'apprentissage automatique.

Mass function of the number of coin flips to get m consecutive heads, Jan Aalmoes. Voir le papier

On considère le problème suivant. On lance une pièce et on compte le nombre de fois où elle tombe sur pile. Combien de fois faut-il lancer la pièce avant d'obtenir $m$ fois pile sans interruption ? Dans cet article, je calcule la loi de probabilité du nombre de lancer de pièce avant d'obtenir une suite ininterrompue de piles. Cette étude est importante pour mieux comprendre la fiabilité de systèmes critiques basés sur la redondance des pièces comme en aéronautique spatiale ou dans certains protocoles réseau (eg. TCP, LoRaWAN).

Enseignement

J'ai été chargé de travaux dirigés en mathématiques au sein de la prépa intégrée de l'INSA Lyon pour la totalité d'un programme de première année réparti sur deux ans. J'ai donné ces cours en anglais car les étudiants faisaient parti de la section SCiences & ANglais (SCAN). J'ai également mis à disposition, sur mon site web, des enregistrements vidéos de corrections commentées d'exercices pour approfondir certaines notions.

Programme d'algèbre

Linear Systems
Vector Spaces
Linear Maps
Matrices
Determinants
Diagonalization of Endomorphisms

Programme d'analyse

Sum, Product, Binomial Theorem
Elementary Trigonometry
Real Functions
Limits
Continuity
Derivation
Linear Differential Equations
Comparison of Functions
Taylor Expansions
Riemann Integrals
Fixed Point Theorem

Administration

De Septembre 2021 à Juin 2024, Réprésentant des doctorants au conseil de laboratoire du CITI, INSA-Lyon.

Le conseil est une instance administrative qui a pour but d'instaurer un cadre démocratique dans les décisions prises par le directeur du laboratoire. La compétence du conseil est vaste et va de l'amélioration de la qualité de vie au travail aux choix d'orientation morale des différentes politiques. Voici des exemples de points à l'ordre du jour :

Mise en place de tri sélectif
Choix de projet pour attribution de bourse doctorale
Politique de voyage et financement des déplacements dans un contexte de crise climatique
Ouverture de Chaire de Profeseur Junior (CPJ)
Discussion autour du rapport Hcéres
Description de poste pour recrutement d'un Maître de Conférence (MCF)
Recrutement d'un assistant d'équipe

Education

Doctorat mention mathématiques de l'INSA-Lyon membre de l'Université Lyon 1. IA pour des services moraux : concilier équité et confidentialité.
- DIRECTEUR DE THÈSE CUNCHE Mathieu
- CODIRECTEUR DE THÈS BOUTET Antoine
- JURY
  - BOUCHENAK, Sara, examinatrice
  - SIHEM, Amer-Yahia, rapporteus
  - ALLARD, Tristan, rapporteur
  - HUGUET, Mari-José, examinatrice
  - RUDAMETKIN, Walter, examinateur, président du jury
  - PERROT, Michael, examinateur
Master Mathématiques appliquées statistiques mention vision et images, Université Claude Bernard Lyon 1
Licence Mathématiques générales, Université de Montpellier