Paléodémographie et statistique : incertitudes de l'histoire et histoire d'incertitudes
Henri Caussinus  1  
1 : Institut de Mathématiques de Toulouse
Université Toulouse III - Paul Sabatier

Si, comme l'affirmait Nietzsche, la certitude est ennemi de la vérité plus dangereux que le
mensonge, la recherche de la vérité historique, si vérité il y a, doit d'abord passer par la critique des
méthodes et l'analyse approfondie de leurs incertitudes : quelle est la nature de ces incertitudes,
peut-on parfois les quantifier, peut-on envisager de les réduire ? Nous retrouverons les traces de
cette démarche dans l'oeuvre de Jean-Pierre Bocquet-Appel en nous concentrant sur les incertitudes
d'ordre statistique (seul domaine de ma compétence) provenant de l'estimation de l'âge au décès
d'un adulte à partir d'un indicateur biologique de vieillissement. Peut-on avoir une idée précise de
l'âge de tel individu ? Peut-on au moins avoir une estimation fiable de la structure par âge d'un
groupe humain ? De l'âge moyen au décès ?
Au début de l'aventure, on trouve des erreurs méthodologiques flagrantes relevées par exemple dans
Masset (1971), rappelées par Bocquet-Appel and Masset (1982) en soulignant qu'il s'agit d'erreurs
de nature plus statistique que biologique. Mais, une fois celles-ci contournées, il reste à exploiter au
mieux les données disponibles, entreprise d'autant plus délicate que les données de référence
montrent des corrélations relativement faibles entre âge chronologique et âge biologique (quelque
soit l'indicateur considéré) et que les données de site sont parcimonieuses donc largement entachées
d'incertitude d'échantillonnage. Pour ces raisons, les premières méthodes d'estimation proposées
s'avèrent décevantes. Il s'agit essentiellement de méthodes de type maximum de vraisemblance
relevant de la statistique fréquentielle. Pour leur amélioration, un pas décisif est franchi par Jean-
Pierre Bocquet-Appel et Jean-Noël Bacro (2007) qui introduisent une information d'ordre
démographique : la structure par âge d'un groupe correspond à une certaine loi de mortalité donc à
une répartition des âges qui ne saurait être « n'importe quoi ». Cela conduit à l'algorithme Iterage.
En fait, cette introduction d'une information a priori est à très peu près la mise en oeuvre d'une
méthode « bayésienne », ce qui est proposé de façon plus formalisée par Caussinus et Courgeau
(2010) avec une meilleure prise en compte d'abord des diverses causes d'incertitude (données de
référence et de site), ensuite de plus d'information a priori sur la structure par âge à estimer
(Caussinus, Buchet, Courgeau, Séguy, 2017).
On présentera quelques exemples d'application des diverses méthodes statistiques proposées en
essayant de montrer comment l'incertitude statistique peut être contrôlée et dans une certaine
mesure réduite. Sans oublier que ces propositions sont elles-mêmes à regarder avec la plus grande
prudence, en ne perdant jamais de vue qu'elles restent soumises à de nombreux types d'incertitude,
mais en sachant mieux (espérons-le) en quoi et pourquoi.


Online user: 32