dimanche 15 novembre 2020

Validation de la loi de Benford ?

 Je rebondis (boing !) sur mon article au sujet de la loi de Benford (voir La loi de Benford au secours des habituels idiots)

Comme j'avais un petit peu de temps à perdre ce dimanche en attendant le déjeuner je me suis demandé si on ne pouvait pas trouver une quelconque utilité à, par exemple, au hasard, le billet chez Rittaud intitulé Ce qui est rare est cher ; l'idée est donc de compter les occurrences des premiers chiffres significatifs rencontrés dans le texte, en omettant les commentaires parce qu'on n'a pas que ça à faire non plus.

C'est parti (je mentionne chaque extrait suivi des occurrences que je récapitulerai à la fin)

Publié le 11 novembre 2020 par MD
  • 1
  • 2
1/ Introduction.
  • 1
la période 2000-2019
  • 2
les périodes 1980-1999 et 2000-2019
  • 1
  • 2
2/ Base de données utilisée.
  • 2
Le fichier EM-DAT récapitule près de 25 000 évènements survenus entre 1900 et 2020
  • 2
  • 1
  • 2
la période 1900-2019
  • 1
sinistres déclarés entre 1900 et les années 2000
  • 1
  • 2
Dans les années 1980
  • 1
depuis l’année 2000
  • 2
La comparaison sans nuance entre les décennies 1980-1999 et 2000-2019 est donc largement biaisée.
  • 1
  • 2
la période 2000-2019
  • 2
3/ Période 2000-2019. Evolution générale.
  • 3
  • 2
Nombres d’évènements (7 500 évènements sur la période)
  • 7
Nombre de décès (1 240 000 décès sur la période)
  • 1
En substance, 13 évènements majeurs ont dépassé 10 000 morts et déterminé à eux seuls 75% des décès de la période
  • 1
  • 1
  • 7
9 séismes (680 000 décès, dont Inde 2001 et 2004, Sri-Lanka 2003, Indonésie avec un tsunami 2004, Iran 2004, Pakistan 2005, Chine 2008, Haïti 2010, Japon avec le tsunami de Fukushima 2011)
  • 9
  • 6
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
  • 2
1 cyclone (140 000 décès, Myanmar 2008,
  • 1
  • 1
  • 2
2 vagues de chaleur (72 000 décès en Europe de l’ouest en juillet 2003, 56 000 décès en Russie en août 2010) ; la vague de chaleur de 2003 est un exemple [...] elle est en effet comptée dans la base pour 15 évènements,
  • 2
  • 7
  • 2
  • 5
  • 2
  • 2
  • 1
1 sécheresse (Somalie 2010-2011).
  • 1
  • 2
Coût des dommages (près de 2 600 milliards de dollars
  • 2
le tsunami de 2011 de Fukushima déjà cité (évalué à 210 milliards de dollars)
  • 2
  • 2
le cyclone Katrina (125 milliards de dollars en 2005,
  • 1
  • 2
les cyclones Harvey, Irma et Maria en 2017 aux USA et aux Caraïbes (au total 230 milliards de dollars ; noter que Irma a été compté pour 16 « évènements »
  • 2
  • 2
  • 1
d’autres séismes en Chine (2008), au Chili (2010) et à nouveau au Japon (2004 et 2016).
  • 2
  • 2
  • 2
  • 2
4/ Période 2000-2019. Evolution de phénomènes particuliers.
  • 4
  • 2
5/ Période 2000-2019.
  • 5
  • 2
PIB mondiaux entre 2000 et 2019
  • 2
  • 2
dollars US base 2010
  • 2
Entre 2000 et 2019 la population a augmenté de 25% et le PIB en valeur réelle de 70%
  • 2
  • 2
  • 2
  • 7
6/ Période 2000-2019. Typologie des évènements.
  • 6
  • 2
7/ Conclusions.
  • 7
Récapitulatif

  1. mentionné 17 fois en première position (22,9%)
  2. mentionné 45 fois en première position (60,8%)
  3. mentionné 1 fois en première position (1,4%)
  4. mentionné 1 fois en première position (1,4%)
  5. mentionné 2 fois en première position (2,7%)
  6. mentionné 2 fois en première position (2,7%)
  7. mentionné 5 fois en première position (6,8%)
  8. mentionné 0 fois en première position (0%)
  9. mentionné 1 fois en première position (1,4%)
Total des mentions : 74 (100%)

A noter :
  • le total en % fait 100,1% à cause des arrondis ;
  • dans les occurrences telles que « la période 2000-2019 » je n'ai compté qu'une seule mention du chiffre 2 car je considère que 2000-2019 forme un tout ;
  • dans les occurrences telles que  « 2004 et 2016 » j'en ai compté 2 car les années sont détachées ;
  • la surreprésentation du chiffre 2 est bien évidemment due au fait que l'article est truffé de dates récentes ;
  • les chiffres 3 et 4 ne doivent leur mention qu'au seul fait qu'ils font partie d'une liste numérale, sans quoi ils auraient obtenu un score de 0 comme le chiffre 8, lequel avait peu de chances de figurer dans le récapitulatif puisque la liste s'arrête...à 7 !

Conclusion ?

L'article du sieur MD sur le blog de Benoit Rittaud ne respectant pas la loi de Benford est manifestement frauduleux.

Conclusion bis.

C'est beau les mathématiques quand ça permet de se foutre de la tronche de charlatans.

Aucun commentaire:

Enregistrer un commentaire