This site uses cookies to ensure you get the best experience. Learn more

Sign up or log in to follow your favorite podcasts and listen to episodes!

Post Mortem

François Paupier
14 episodes
In Post Mortem, engineers reflect on real-life incidents of IT systems they experienced. In each episode, we zoom on a specific event, ranging from a system outage, a cyber-attack, or a machine learning algorithm going wild with production data. We try to understand what happened and how the people behind those systems solved the situation. Along the way, you'll get hands-on advice shared by experienced practitioners that you can implement within your team to limit the risk of such incidents.

Disclaimer: the content and artwork of this podcast are the property of its owner and are not affiliated with nor endorsed by Audiotrails.

#12 Comment Google anonymise vos données personnelles avec la Differential Privacy

Des emojis les plus populaires sur iOS à l'affluence dans votre boutique préférée sur Google Maps; comment ces informations sont obtenues? Et quelles garanties peut-on avoir quant à la préservation de l'anonymat des utilisateurs? Dans ce Post Mortem thématique, le Docteur Damien Desfontaines - Se…
38min

#11 Prédiction de retards à la SNCF 🚉

Tous les jours, des millions de voyageurs prennent le train sur le réseau SNCF, mais parfois, un train subit un retard. Aujourd'hui je reçois Héloïse Nonne, Head of Data Science & Engineering @ eSNCF, pour comprendre comment ce problème est adressé en interne pour améliorer l'information voyageur…
36min

#10 Competitive Data Science Vs Réalité business

Les plateformes de Data Science comme Kaggle permettent de découvrir des jeux de données variés et de se tester face à d'autres compétiteurs. Plus votre modèle performe, meilleur est votre classement sur le leaderboard. Avec des jeux de données "curated" et des métriques à optimiser définies dè…
19min

#9 Avalanche de requêtes et effets de bords mystérieux

Les fêtes de fin d’années sont synonymes de pics d’activités pour le e-commerce. Alors comment réagir quand on se rend compte qu’un incident se profile à l’horizon du moment le plus business critique de l’année ? Une conversation avec Théo Carrive, CTO de Cheerz. Concepts mentionnés:  La comm…
23min

#8 When the facts change, I change my model

"When the Facts Change, I Change My Mind. What Do You Do, Sir?" disait JM Keynes.  L’économiste soulignait alors l’importance de réajuster ses a priori et sa représentation du monde lorsqu'on on est confronté à de nouveaux éléments. C’est la même chose lorsqu’on entraîne un modèle de machine l…
23min

#7 Don't knock the checklist

Action items resulting from a postmortem analysis are often to implement more advanced monitoring or deploy new tools to track usage at a fine-grain level.  Today, Timothy Raymond shows us that a good old checklist can sometimes be the most efficient way to prevent regressions in production. So…
20min

#6 Monitor early,  fix bugs early 🇫🇷

Loïc Carbonne, VP Engineering @ Theodo, nous partage son expérience sur la réduction du lead time de résolution des incidents. Au travers des leçons apprises lors du développement d’applications web, Loïc nous propose des outils et méthodes pour s’organiser afin: 1) d’identifier plus rapidement…
27min

#5 Autoscaling lag et gestion des incidents chez Doctolib 🇫🇷

Benoit Lafontaine, Engineering Director chez Doctolib, nous partage le post mortem d’un incident récent dû à une évolution soudaine de la charge sur la partie patient de leur service. Malgré une architecture d’auto-scaling déjà en place, le service a été dégradé quelques minutes. Benoît revient é…
33min

#4 La divulgation de vulnérabilités, théorie et pratique 🇫🇷

Que faire lorsque l'on rencontre une vulnérabilité dans un produit ou un service numérique?  On explore avec Rayna Stamboliyska (Twitter: @MaliciaRogue) le rôle de la divulgation coordonnée de vulnérabilités; en quoi celle-ci permet de fluidifier la remontée des vulnérabilités et offre un comprom…
36min

#3 La Data Science dans les grands groupes, avec Ouriel Bettach 🇫🇷

Ouriel Bettach , Data Scientist depuis plus de 6ans, nous propose un panorama de ses expériences au sein de grands groupes industriels sur des projets de machine learning (ML). On en profite pour faire le bilan sur la façon dont les grands groupes approchent des projets ML et d’évoquer les points…
28min

#2 Dragonblood is still leaking 🇫🇷

Wi-Fi Protected Access 3 (WPA3) est destiné à remplacer WPA 2 - en service depuis 2004 - en rendant presque impossible de craquer le mot de passe d'un réseau.  Problème, des chercheurs ont révélé qu'un attaquant peut exploiter des failles dans les implémentations existantes de WPA 3 pour récupére…
47min

What's this podcast about?

In Post Mortem, we have engineers coming back on real-life incidents of IT systems. In each episode, we zoom on a specific event, ranging from a system outage, a cyber-attack, or a machine learning algorithm going wild with production data. We try to understand what happened, how the people behind …
2min

Qu'est ce que Post Mortem? 🇫🇷

C’est quoi un « post mortem » ?  Dans cet épisode je définis le thème du podcast, on y partage des retours d’expériences sur des incidents survenus dans des systèmes informatique. Un post mortem , d’après Wikipédia, c’est un process que l’on réalise à la fin d’un projet pour analyser ce qui a …
2min

#1 A migration's tale

Nicolas walks us through a challenging service migration he experienced at Criteo, a personalized retargeting company. A Windows to Linux server migration was on the way for several months already when they realized that the logging backend they used was not working as expected under Linux and fa…
34min