[Accueil]
Curriculum vitae
Jan Aalmoes
jaalmoes.com, jan@asgt.fr, 06.37.69.00.40

Mots clefs

théorie de la mesure, probabilité, intelligence artificielle, équité, confidentialité, théorie de l'information.

Résumé

Mes travaux se concentrent principalement autour de l'utilisation de probabilité, de la théorie de la mesure et de la théorie de l'information pour étudier la confidentialité dans plusieurs systèmes et protocoles informatiques. J'ai démontré les garanties théoriques et la robustesse des sequential private identifiers pour le protocole LoRaWAN. J'ai démontré aussi plusieurs résultats théoriques liant équité et confidentialité en apprentissage automatique.

Mes travaux les plus récents visent à montrer la possibilité de générer des données équitables et confidentielles. Pour cela je suis en train de développer les espaces métriques informationnels. Ce sont des espaces qui permettent de contourner le fait que la divergence de Kullback-Leibler n'est pas une distance. Grâce à cela je peux introduire des notions de convergence particulièrement utiles pour obtenir des propriétés sur des modèles après entraînement en partant de propriétés sur les données d'entraînement.

Conférences internationales

On the Alignment of Group Fairness with Attribute Privacy, Jan Aalmoes, Vasisht Duddu and Antoine Boutet, Wise 2024.

Dans cet article nous avons mis en avant comment l'attaque d'inférence d'attribut sensible pouvait être mitigée par des propriétés d'équité, notamment la parité démographique. J'ai démontré plusieurs liens théoriques entre ces notions et j'ai introduit la parité démographique généralisée. Ces travaux se concentrent sur des classifieurs binaires et attaquent des attributs sensibles binaires. Cependant j'ai inclus dans mon manuscrit de thèse des résultats plus généraux que je compte publier sous forme d'un autre article.

Privacy-Preserving Pseudonyms for LoRaWAN, Samuel Pélissier, Jan Aalmoes, Abhishek Kumar Mishra, Mathieu Cunche, Vincent Roca, and Didier Donsez, Wisec 2024

Ici nous avons créé une évolution du protocole IOT LoRaWAN qui permet d'assurer une plus grande confidentialité aux utilisateurs. Ma contribution est une analyse probabiliste visant à étudier la loi de probabilité des collisions de paquets engendrées par cette modification. Cela m'a amené à créer une nouvelle loi de probabilité discrète pour laquelle j'ai calculé les moments, la fonction de masse et la fonction de répartition. Je n'ai pas pu inclure ces développements dans l'article suite à une contrainte de place, je prévois donc de les publier séparément, voici la pré-publication. Dans cette publication, nous nous sommes donc restreint au calcul de l'espérance qui peut être fait facilement par le biais d'une chaîne de Markov mais qui ne permet pas d'obtenir la loi.

MixNN: Protection of Federated Learning Against Inference Attacks by Mixing Neural Network Layers, Antoine Boutet, Thomas Lebrun, Jan Aalmoes, Adrien Baud, Middleware 2022.

Dans cet article, nous avons mis au point un protocole permettant de masquer les attributs sensibles des participants à un apprentissage fédéré. Ma contribution a été de démontrer que cette méthode ne modifie pas le modèle aggloméré final. Pour cela j'ai juste eu à réaliser un calcul sur des sommes.

Exposés

Fairness and sensitive attribute inference, Jan Aalmoes, Antoine Boutet, Workshop @ Comète on Ethical AI, 2023, L'X, Palaiseau, Paris, France.

J'ai présenté dans cet exposé de 15 minutes comment la parité démographique est équivalente à dire que le maximum d'exactitude équilibrée possible de l'attaque d'inférence d'attribut sensbile est égal à 1 m où m est le cardinal du codomaine de la variable aléatoire qui modélise l'attribut sensible.

Dikaios: Privacy Auditing of Algorithmic Fairness via Attribute Inference Attacks Jan Aalmoes, Vasisht Duddu, Antoine Boutet, APVP 2022 : 12ème Atelier sur la Protection de la Vie Privée

Cet exposé avait pour but de mettre en lumière l'impact du paramètre de régularisation dans la méthode \textit{Exponantiated gradient descent for fair classification} sur l'attaque d'inférence d'attribut sensible.

Machine learning, or how to build a racist, sexist and unprivate world, Jan Aalmoes, Antoine Boutet, 2022, 6th Winter School Distributed Systems and Networks, GDR RSD and ACM SIGOPS France

Dans cet exposé j'ai présenté mes premiers résultats expérimentaux qui mettent en avant les problèmes de confidentialité et d'équité. J'ai montré que sur de nombreux jeux de données réels (COMPAS, CENSUS, MEPS, CREDIT, LAW) on observe qu'une forêt aléatoire se comporte différement pour différents sous groupes de la population. J'ai présenté une première attaque qui permet d'inférer l'attribut sensible des utilisateurs au moment de l'inférence.

Pré-publications

(Tout début) Reconciliating differencial privacy and demographic parity with the help of synthetic data, Chapitre 7, section 7.2 de mon manuscrit de thèse.

La protection de la confidentialité des données d'entraînement entre en conflit avec l'équité en apprentissage automatique. Dans ce papier je montre que ces notions peuvent s'aligner en passant par une génération de données synthétiques. Pour cela j'ai dû introduire plusieurs notions nouvelles en topologie :

Adaptating the behaviour knowled space method to maximize balanced accuracy, Chapitre 4 de mon manuscrit de thèse.

Dans ce papier j'introduis un nouvel algorithme d'apprentissage ensembliste ayant pour but de maximiser l'exactitude équilibrée. 1 # F i F P ( Y ̂ = i Y = i ) Cela permet de prendre en compte le déséquilibre dans les classes lors de l'apprentissage. Comme expliqué dans mon manuscrit de thèse, cet algorithme est très utile pour l'audit de la fuite d'informations sur les attributs sensibles des utilisateurs de modèle d'apprentissage automatique.

Mass function of the number of coin flips to get m consecutive heads, Jan Aalmoes. Voir le papier

On considère le problème suivant. On lance une pièce et on compte le nombre de fois où elle tombe sur pile. Combien de fois faut-il lancer la pièce avant d'obtenir $m$ fois pile sans interruption ? Dans cet article, je calcule la loi de probabilité du nombre de lancer de pièce avant d'obtenir une suite ininterrompue de piles. Cette étude est importante pour mieux comprendre la fiabilité de systèmes critiques basés sur la redondance des pièces comme en aéronautique spatiale ou dans certains protocoles réseau (eg. TCP, LoRaWAN).

Enseignement

J'ai été chargé de travaux dirigés en mathématiques au sein de la prépa intégrée de l'INSA Lyon pour la totalité d'un programme de première année réparti sur deux ans. J'ai donné ces cours en anglais car les étudiants faisaient parti de la section SCiences & ANglais (SCAN). J'ai également mis à disposition, sur mon site web, des enregistrements vidéos de corrections commentées d'exercices pour approfondir certaines notions.

Programme d'algèbre

  1. Linear Systems
  2. Vector Spaces
  3. Linear Maps
  4. Matrices
  5. Determinants
  6. Diagonalization of Endomorphisms

Programme d'analyse

  1. Sum, Product, Binomial Theorem
  2. Elementary Trigonometry
  3. Real Functions
  4. Limits
  5. Continuity
  6. Derivation
  7. Linear Differential Equations
  8. Comparison of Functions
  9. Taylor Expansions
  10. Riemann Integrals
  11. Fixed Point Theorem

Administration

De Septembre 2021 à Juin 2024, Réprésentant des doctorants au conseil de laboratoire du CITI, INSA-Lyon.

Le conseil est une instance administrative qui a pour but d'instaurer un cadre démocratique dans les décisions prises par le directeur du laboratoire. La compétence du conseil est vaste et va de l'amélioration de la qualité de vie au travail aux choix d'orientation morale des différentes politiques. Voici des exemples de points à l'ordre du jour :

Education