Annexes
du livre
Chauvel L., 2016, La spirale du déclassement. Essai sur la société des illusions,
Paris, Seuil.
Ce que j’aime dans les sciences, c’est la réplicabilité : équipés de quelques instruments idoines,
il doit être possible de vérifier les points essentiels d’un logos
scientifique, tout comme le pendule de Foucault peut se refaire à la maison,
ainsi que les observations de Galilée.
On raconte aux débutants en sociologie et en
sciences économiques que maintenant, on ne peut publier d’articles
scientifiques dans des revues décentes (des publications scientifiques
internationales revues par des pairs, et dont le facteur d’impact dépasse zéro
virgule quelque chose) sans remettre ce que l’on appelle dans la douce langue
de Shakespeare dans sa flexion scientifique les « replication files », les « fichiers de réplication ». Peut-être
la situation est-elle plus acceptable en sciences économiques (et dans les
domaines proches des miens je vois qu’il n’en est rien) mais mon expérience
personnelle est qu’en sociologie presque personne ne se soumet à l’idée et à la
pratique de se faire vérifier par les pairs, au risque de leur laisser des
données et les intuitions qu’ils pourraient réutiliser. Souvent, cette absence
de réplicabilité repose sur l’argument de la
confidentialité des sources, parfois remises à un chercheur particulier, pour
une tâche précise, par une institution pourvoyeuse de données spécifiques dont
elle dispose du monopole (ce peut être l’INSEE, Eurostat, etc.). Pour vérifier
le travail des collègues, il s’agirait alors de se lancer dans la démarche
administrative, la paperasse et la patience institutionnelle des auteurs
précédents, puis de refaire tout le travail de recodage, d’harmonisation, tout
ce labeur d’arrière-salle (cela s’appelle back
office) qui sont en général tenus à peu près secrets, des secrets de
Polichinelle qui n’intéressent personne, sauf exception (Reinhart,
Carmen M.; Rogoff, Kenneth S. (2010). "Growth in a Time of
Debt". American Economic Review 100 (2): 573–78.
doi:10.1257/aer.100.2.573).
La belle affaire : lorsque les données sont
un peu protégées, cela permet de dire à peu près tout ce que l’on veut. C’est
pourquoi, pour ma part, je préfère travailler sur des données que tout le monde
connaît pour valider des résultats nouveaux et laissés jusqu’alors inaperçus.
Comme Galilée, je préfère le ciel auquel tout le monde a accès, et observer à
la lunette la dance des satellites de Jupiter. Vous n’y croyez pas ? Alors
regardez par vous-même ! Personnellement, je considère qu’un
« résultat » que je ne pourrais retrouver par moi-même, pour une
raison ou une autre, ne mérite guère que le nom d’« assertion ».
Je m’efforce ci-dessous de remettre aux collègues
ou autres personnes intéressées une partie du matériau. Je précise qu’une
partie de ce travail et des calculs sous-jacents exige l’utilisation du
logiciel statistique STATA, peut-être le plus commun dans la profession. Le
souci est son cout : quelques centaines d’euros. Ethiquement, je ne trouve
pas correct de proposer à des étudiants de débourser cette somme, ou sinon de
faire appel à une version copyleft. Donc plus tard si j’en ai le temps, je
m’efforcerai d’en proposer une version R (un logiciel gratuit, assez complexe
en réalité, mais susceptible d’être installé sur la plupart des ordinateurs).
Ultime souci : la redistribution des données, lorsqu’il s’agit de
« micro-données » fondées sur des ménages ou des individus.
Plusieurs cas de figure se présentent :
1- les données américaines (sauf problème immédiat
de confidentialité et d’identification d’individus, tout ce qui est payé par le
public, comme le Census Bureau américain, doit pouvoir
retourner au public – pas mal non ? ) distribuées
par IPUMS : inscrivez-vous ici (https://www.ipums.org/) et au travail
(créez des extraits de microdonnées à télécharger sur
votre ordinateur, et exécutez mes programmes STATA).
2- les données internationales harmonisées par
IPUMS : même cas de figure.
3- les données internationales harmonisées par Luxembourg Income Study LIS. Les microdonnées
(les fichiers source harmonisés) ne peuvent pas circuler en dehors des bureaux
du LIS. La logique est d’envoyer des programmes STATA ou R qui sont exécutés
par un robot qui vous renvoie le listing des résultats. Inscrivez-vous ici
(http://www.lisdatacenter.org/) et suivez le mode d’emploi de LISSY (dont
l’installation de Java) et exécutez en ligne les programmes STATA que je
propose.
4- les données de l’INSEE dans l’onglet
« fichiers-detail » http://www.insee.fr/fr/bases-de-donnees/fichiers-detail.asp
: comme (1)
5- les données de l’INSEE, Eurostat, etc. etc. Il
convient de passer par des centres d’archives ou des démarches administratives
de contrôle a priori. C’est en
général long et fastidieux, destiné à calmer les jobards, à dissimuler que la
qualité des données n’est pas vraiment terrible ou à protéger quelques
corporations. Tout ce travail de contrôle des collègues est du temps en moins
pour le reste, qui est vraiment utile (harmonisation des données sur plusieurs
années, amélioration du service, détection de soucis, etc.). Bref, c’est mal
engagé pour vous proposer les micro-données, car, dans ces cas-là, je me
mettrais en faute vis-à-vis des contrats que j’ai signés si je vous
transmettais les sources. Qu’ai-je fait alors ? J’ai généralement créé un
fichier agrégé, avec chaque fois au moins 50 personnes par cellule de la table
d’agrégation, pour que jamais vous n’ayez accès aux microdonnées
mais qu’en revanche vous puissiez obtenir une approximation (un proxy) du résultat publié.
Veuillez apprécier…
Chapitre
1
Graphique 1.1. Courbe de
Lorenz du revenu (niveau de vie) et du patrimoine – France 2010
Tableau 1.1.
L’ordre pharaonique
Graphique 1.2. Strobiloïde du revenu et du patrimoine en Euros 2010
Chapitre
2
Tableau 2.1.
Niveau de vie (en kilo-euros 2014 par unité de
consommation) et définition de la hiérarchie des groupes sociaux et catégories
modales correspondantes parmi les 25 à 54 ans
Graphique 2.2. Rapport entre
le salaire net des professions intermédiaires et celui des ouvriers
Graphique 2.5. Taux de chômage
par catégorie socioprofessionnelle 1962-2011
Chapitre
3
Figure 3.1. Les
étapes de la socialisation
Figure 3.2. Le diagramme
de Lexis
Graphique 3.2. Progression
cohortale du niveau de vie selon le modèle APCT
Tableau 3.1.
Exemple de canton-villes hiérarchisés selon les catégories sociales salariées
de leurs résidents en sous-groupes hiérarchisés
Graphique 3.9. Le
« folium de Descartes » de l’anomie, selon la cohorte
Graphique 3.10. Progression
cohortale du taux de suicide masculin en France selon le modèle APCD
Chapitre
4
Graphique 4.3. Centiles
relatifs globaux moyens par centiles de la population française
Figure 4.1.
L’espace social en diamant du XXIe siècle
Tableau 4.1. Le
temps de rattrapage
Figure 4.2. La
spirale des inégalités et de la mobilisation sociale
Chapitre 5
Graphique 5.1. La
projection du désastre selon le Club de Rome
Graphique 5.2. Le
modèle non linéaire des ressources et des coûts
Graphique 5.3. La
perspective du redressement