Small data en assurance non vie : prévision de risques d’intensité jamais observée

Cet article prolonge directement le précédent : estimation d’une distribution d’événements extrêmes en assurance non vie. Il s’agit maintenant d’estimer la possibilité qu’un événement jamais observé se réalise.

Pour rappel, nous avons modélisé les données fournies dans le tableau ci-dessous correspondant à la fréquence d’évènements extrêmes en sinistre auto :

Afin d’estimer la probabilité d’évènements non observés, nous ajoutons une classe de risque « 6401 et + » dans la modélisation de la distribution. Evidemment, la fréquence empirique pour cette classe est nulle.

Dans le cas de l’utilisation d’une loi paramétrique, bien que les hypothèses changent, il s’agit d’un simple prolongement sur les nouvelles classes. Nous prolongeons donc la loi de Pareto sur ce nouveau support.

Dans le cas bayésien, puisque le cadre présente un nouveau contexte, on s’y adapte : le  modèle est bien différent de celui de l’article précédent, les calculs doivent être reconduits dans ces nouvelles conditions.

Les différentes estimations sont présentées ci-dessous.

On peut encore juger de la meilleure cohérence avec les données dans ce cadre. La probabilité de l’échantillon est sous l’approche bayésienne 0,0406% vs 0,014% sous Pareto.

Toutefois, faire des comparaisons, c’est bien mais cela ne suffit pas pour s’imposer. L’approche bayésienne a d’abord un intérêt par ce qu’elle n’a pas les défauts des approches paramétriques :

  • Si une loi ne convient, on ira en piocher une autre dans notre sac à loi. Ce choix est factice car la loi existe déjà pour modéliser un autre problème et on espère l’utiliser, la caler, pour un nouveau phénomène.
  • Les techniques de calibration ne sont pas uniques et chacune pourra donner des résultats différents
  • Et enfin ces approches éliminent l’incertitude en considérant la loi obtenue comme exacte. Les données sont oubliées.

Tous ces défauts qui plaident pour l’approche bayésienne dans un contexte de données rares, ce que j’ai appelé le small data, dont les avantages sont :

  • une information minimale
  • Prise en compte d’avis d’expert
  • Prise en compte des classes sans observations
  • On conserve l’incertitude de l’estimation. Dans notre exemple, on peut calculer des écart-types (on dispose en réalité de toute la distribution pour chaque probabilité) :
  • Souplesse de la méthode
  • Un modèle vraiment dédié au problème étudié
  • Pas de calibrage

On pourrait penser que cet article et les précédents ne font que relancer l’éternel débat pour ou contre bayésien. En réalité, nous avançons dans ce débat car nous proposons un choix systématique de loi a priori afin de refléter notre absence d’information initiale et nous mettons de côté l’utilisation de loi conjuguée puisque l’approche par simulations de Monte Carlo nous permet d’obtenir des résultats sans se soucier d’une facilité quelconque de calcul.

L’enrichissement de l’information que permet l’approche bayésienne au fur et à mesure que de nouvelles observations sont disponibles nous rapproche également d’une technique ancienne remise au goût du jour par un nouveau vocabulaire : le « machine learning » qui consiste à savoir bien extraire l’information à partir de l’observation de phénomènes suffisamment stationnaires.

 

Pour rappel, quelques références sur l’approche bayésienne :

  • Beauzamy Bernard, Méthodes probabilistes pour l’étude des phénomènes réels, SCMSA, 2004
  • Beauzamy Bernard, Méthodes Probabilistes Pour La Gestion Des Risques Extrêmes, SCMSA, 2016
  • Dacunha-Castelle Didier, Chemins de l’aléatoire, Champs Flammarion, 2002
  • Dacunha-Castelle Didier, Duflo Marie, Probabilités et Statistiques, 1. Problèmes à temps fixes, éd. Masson, coll. Math. Appl. pour la Maîtrise, 1982 (rééd. 1990)
  • Jacquard Albert, Les probabilités, Que sais-je ? n°1571, PUF, 2000
  • Laplace Pierre Simon, Théorie analytique des probabilités, 1812 (1ère édition)
  • Saporta Gilbert, Probabilités, Analyse des données et Statistiques, 2ème édition, Technip, 2006
  • Schwarz Daniel, Le jeu de la science et du hasard, Champs Flammarion, 1999

Le small data ou la fin des lois de probabilités artificielles

Le monde réel est limité

Dans un cadre d’univers borné, un phénomène réel est par nature limité : les valeurs observées ont des bornes maximales et minimales (pas toujours observables). Cette simple remarque devrait éliminer d’office toute modélisation par des lois de probabilité à support infini. Malheureusement, beaucoup de praticiens semblent attachés à ces distributions de probabilité alors pour ne pas trop s’en éloigner, ils sont amenés à les tordre en les tronquant ce qui induit d’autres difficultés, calculatoire notamment.

Stop aux réflexes inadaptés

D’autres d’habitudes peu rigoureuses nous tiennent au corps, comme par exemple la recherche d’une loi de probabilité académique dès que la loi de Gauss ne fonctionne pas, sans même tenter de rechercher la loi de distribution « réelle ». Cette simplification est acceptable dans une phase exploratoire, qui doit être suivie d’une seconde qui discute des hypothèses sous-jacentes. L’analyse ne peut s’abstenir d’une véritable démarche scientifique même si son cadre de travail est le monde réel et l’entreprise.

Trop souvent, les outils mathématiques existants sont utilisés de manière brute sans souci de leur validité. Cela peut se produire par exemple avec le test asymptotique du chi deux ou lorsqu’on utilise un modèle de régression sans avoir contrôlé la stationnarité des données ou des résidus. Les attentats du 11 septembre 2001 ont également révélé aux assureurs que leurs hypothèses d’indépendance de certaines branches d’activité étaient abusives.

Particulièrement pour les phénomènes extrêmes (ou rares), l’utilisation des lois paramétriques (loi GEV par exemple) s’est répandue sans justification scientifique poussée, l’argument principal étant la maniabilité. Le faible nombre de paramètres dont elles dépendent permet une calibration au phénomène étudié avec un faible nombre de données à disposition. Or les phénomènes réels auxquels s’exposent les entreprises nécessitent un soin plus approfondi et des lois de probabilité adaptées.

D’autres l’ont déjà dit

Nicolas Bouleau explique à ce sujet : « Ayant observé durant une période d’un siècle dans une certaine région des enregistrements sismiques de magnitude comprise entre 0 et 2, est-il possible d’en déduire avec quelle probabilité se produira un séisme d’une magnitude supérieure à 4 ? A un problème ainsi posé, rares seraient ceux qui répondrait par l’affirmative, néanmoins l’usage de plus en plus répandu dans le milieu des ingénieurs de procédures rapides utilisant les lois des valeurs extrêmes conduit à des affirmations de ce type, dont l’enjeu socio-politique est important notamment par l’habit de scientificité qui leur est donné. Après avoir rappelé les fondements de la théorie des lois des valeurs extrêmes et relevé quelques-unes des hypothèse cruciales, difficiles à vérifier en pratique, qui la sous-tendent, nous montrons que la méthode qui consiste à caler les paramètres d’une des trois lois de valeurs extrêmes à partir des extrêmes d’un échantillon fini dont la loi est mal connue, est fortement encouragée par la pression sociale de quantifier les risques graves d’autant plus que tels errements, par la rareté même des événements considérés sont peu réfutables. » [Bouleau Nicolas, Splendeurs et misères des lois de valeurs extrêmes, Risques, 3, 1991, p.85-92].

Puis il poursuit : «  […] toute démarche attribuant une valeur numérique précise pour la probabilité d’un phénomène rare est suspecte, sauf si les lois physiques régissant le phénomène sont explicitement et exhaustivement connues ».

Ces phénomènes ne peuvent donc simplement se résumer par un seul nombre et le croire promet des interprétations douteuses et donc dangereuses lorsque son utilisation se généralise au sein de la société.

Osons !

Engager des changements de méthodes est compliqué. Même lorsque les interlocuteurs entendent les défauts de leurs pratiques, ils se réfugient derrière un comportement conformiste, arguant que leurs voisins font comme eux. Il leur est trop dangereux de ne pas agir ou penser comme le reste du troupeau. Effectivement, pendant de nombreux siècles, notre civilisation a cru notre planète au centre du monde et que le Soleil lui tournait autour. Pourtant, comme le dit Warren Buffet : « vous n’avez jamais raison ou tort parce que les autres sont d’accord avec vous, vous avez raison parce que vos données sont exactes et votre raisonnement juste ».

Il faut donc oser. Oser ne pas simplifier par l’utilisation de résultats académiques, pratiques d’un point de vue calculatoire, mais possiblement dévastateur car leurs hypothèses ne sont pas satisfaites. C’est possible car il existe d’autres manières moins contestables scientifiquement pour analyser les problèmes qui se présentent dans le monde réel.

Assurance n°13 Règlement du sinistre

Prestation
Son objet est un versement d’argent avec possibilité de réparer en nature le dommage. Le montant est indemnitaire (en IARD) ou forfaitaire (capital ou rente en assurance de personnes).

Expertise après sinistre
Excepté en dommage ouvrage, il n’y a pas de réglementation sur l’évaluation. La police précise procédures et principes de l’estimation :

expertise amiable (toujours contestable en justice et n’exclut pas l’expertise judiciaire)
– évaluation de gré à gré puis proposition d’évaluation du dommage (pour les petits sinistres)
– si refus de l’assuré (ou si le sinistre est important), l’expertise amiable (ie accord entre les parties),
soit unilatérale : expert de l’assureur, les conclusions ne s’imposent pas à l’assuré, contestation possible via contre expertise
soit contradictoire : un expert par partie. Si pas d’entente, partage des frais pour une 3ème expertise.

expertise judiciaire : le juge désigne son expert ou suit l’un des experts nommés à l’amiable

Modalités de règlement
délai : imposé par certaines assurances, rien en général, mais mentionné dans la police (donc convenu entre les parties)
intérêts moratoires : si retard de l’assureur, le cumul indemnité + intérêts est valable (malgré le principe indemnitaire)
dommages et intérêts : en cas de préjudice personnel ET mauvaise foi de l’assureur
créancier de la prestation : bénéficiaire, assuré et titulaire d’une action directe (victime, créanciers munis d’une sûreté)

 

 

Assurance n°12 Déclaration du sinistre

Modalités de déclaration

En assurance non vie, obligation de déclaration dès la connaissance (et non survenance) du sinistre entrainant la garantie de l’assureur. Le délai commence à courir le lendemain à 0h00.
Le délai maximum est au moins de 5 jours avec quelques exceptions : pour le vol, 2 jours, pour la mortalité du bétail 24 heures. Il est fixé au contrat et peut donc être plus long.

En assurance vie, pas de délai mais avant la prescription.

La forme de déclaration est multiple (« par tous moyens », mais avec intérêt à preuve). Des exceptions peuvent être indiquées dans la police.

L’auteur de la déclaration est le souscripteur ou son mandataire, le destinataire l’assurreur ou son représentant mandataire.

L’enregistrement est obligatoire par l’assureur, à partir d’un numérotage continu (une liste précises des sinistres est établies à chaque fin d’exercice au moins)

Déchéances de garantie (déclaration tardive)

La déchéance est la perte du droit à garantie, que l’assuré soit ou non de bonne foi.

La clause de déchéance au contrat (rien ne le précise dans les textes) est recevable si le retard a été préjudiciable à l’assureur (il doit le prouver) et être mentionnée en caractère apparents dans la police.

Si aucune clause au contrat, pas de sanction possible.

La déchéance n’est pas recevable en cas de force majeure, est opposable au tiers avec des exceptions : pas les tiers lésés, mais alors l’assureur peut se retourner vers son assuré.

Preuve du sinistre

Aucune règle mais elle revient aux assurés et peut se faire par tous moyens.
Attention : la preuve du respect des conditions de garantie revient à l’assuré, la preuve de l’exclusion de garantie incombe à l’assureur.