Une histoire presque drôle pour comprendre le small data
2 mai 2018 Laisser un commentaire
Un anglais débarque à Calais. Les rues sont désertes. Une voiture arrive, percute un lampadaire et s’immobilise. Une femme un peu sonnée en sort.
L’anglais en déduit que toutes les françaises sont de mauvaises conductrices.
Pour l’homme de la rue, la conclusion de l’anglais est ridicule, c’est évident.
Pour le mathématicien, il y a au moins une femme mauvaise conductrice en France, ça tombe sous le sens.
Le statisticien proteste : il ne peut conclure car l’échantillon est insuffisant, aucun de ses théorèmes ne s’applique.
Peut-on mieux faire ? C’est l’objet du small data
A l’aide du small data, nous pouvons, à partir d’une expérience unique, parvenir à une conclusion en fonction de l’information acquise.
Par exemple, sur les 10 prochaines conductrices que l’anglais croisera, la probabilité qu’elles aient toutes un accident de circulation est inférieure à 17%.
Mais si l’anglais n’a pas noté que le conducteur en France est à gauche du véhicule,… il n’a observé qu’une passagère sortie indemne de l’accident et a oublié d’aller porter à la personne restée dans le véhicule.
Ainsi, les données observées sont fondamentales ainsi que la qualité de leur relevé, d’autant plus qu’elles sont rares.
Histoire inspirée de Beauzamy, méthodes probabilistes pour l’étude des phénomènes réels, SCMSA, 2004.