Construire une variable de profession ISCO / CITP dans une enquête par questionnaire

, par Joël Girès

Il n’est pas nécessairement facile de produire une donnée de profession structurée dans une enquête par questionnaire. Cet article propose une solution pour créer directement une variable dans la nomenclature ISCO (CITP en français) à 3 chiffres de 2008, testée avec succès dans une enquête à laquelle j’ai participé.

Pour produire une donnée de profession dans une enquête, il y a deux solutions :

  • Soit demander la profession exacte dans un champ ouvert, et recoder ensuite à la main l’information dans une variable structurée ;
  • Soit proposer un choix dans une liste préétablie de professions.

Chacune de ces possibilité crée des difficultés : la première implique un gros travail de recodage, qui n’est pas toujours possible dans le cadre de la recherche en cours (financement trop faible pour avoir le temps de réaliser ce recodage, par exemple) ; la deuxième réduit la finesse de l’information récoltée, la liste devant être concise pour que les enquêté-es puissent s’y retrouver.

Dans le cadre d’une enquête sur les conditions de vie étudiantes à l’Université construite avec Jade Cauwe et Juliette Paume, j’ai malgré tout tenté de produire une donnée de profession dans la classification des professions ISCO à 3 chiffres directement à partir du questionnaire. L’objectif était d’obtenir une information sur la profession des parents des étudiant-es ; l’exemple est néanmoins certainement reproductible pour sonder un autre type de population, afin de connaître la profession des personnes interrogées dans le cadre d’une enquête sur la population active, par exemple.

Je désirais au minimum le détail du code ISCO à 3 chiffres pour catégoriser finement les individus dans une nomenclature davantage sociologique et théorique (par exemple le schéma de classe EGP). Le soucis est que la classification ISCO dans sa déclinaison à 3 chiffres comprend 130 professions : il n’était pas réaliste de proposer cette liste aux enquêté-es pour qu’ils/elles lisent l’ensemble des 130 modalités et choisissent alors celle qui leur correspondait le mieux. J’ai ainsi imaginé une procédure pour récolter cette information en posant deux questions successives.

  1. La première question est posée de cette manière : Quel est le métier qu’exerce votre père/mère en ce moment ? Si votre parent est pensionné, indiquez le dernier métier exercé . Cette première question se réduit au code ISCO à 2 chiffres, qui comprend des catégories générales de profession, qu’il est en réalité encore possible de simplifier. J’ai ainsi créé 23 catégories sur base du code ISCO à 2 chiffres (qui en compte à l’origine 43). De cette manière, la liste est réduite, beaucoup plus lisible, et les enquêté-es peuvent y répondre plus facilement.
  2. Cette première question ouvre alors une deuxième question : Veuillez indiquer plus précisément quel est métier exact de ce parent . Cette question est destinée à préciser la profession et à récolter le code ISCO à 3 chiffres. Seulement, toute la liste n’est pas présentée aux enquêté-es, mais uniquement les professions de la classification ISCO à 3 chiffres qui correspondent à la catégorie générale qu’ils/elles ont sélectionnée dans la question précédente. Le contenu de cette deuxième question est donc conditionné par la réponse fournie à la première, évitant que chaque enquêté-e soit confronté-e à l’ensemble des modalités. En outre, les appellations correspondant aux codes ISCO à 3 chiffres ont été simplifiées, pour faire sens dans un questionnaire. Cette procédure est réalisable facilement avec LimeSurvey dans le cas d’une enquête en ligne. Le nom des modalités de la variable qui est créée doit bien entendu être encodé comme le code ISCO à 3 chiffres.

L’illustration ci-dessous schématise la logique des deux questions successives :

Le lecteur trouvera un fichier tableur en fin d’article (au format Libre Office) reprenant les deux nomenclatures utilisées pour les deux questions (en bleu pour la première question, en vert pour la deuxième). Il trouvera dans le deuxième feuillet du fichier la nomenclature ISCO complète à 1, 2, 3 & 4 chiffres. Il s’agit bien de la dernière classification ISCO établie en 2008.

La dernière étape, une fois les données récoltées, est de consolider les réponses pour cette deuxième question. Dans la mesure où il y a 23 listes différentes pour cette dernière (du fait des 23 catégories différentes proposées dans la première question), il y a donc 23 variables à la fin. Les réunir n’est pas compliqué, puisque lorsqu’un champ est rempli dans une des 23 colonnes, les 22 autres sont vides. J’ai ainsi créé une syntaxe SPSS [1] pour créer des variables uniques isco0803M (pour la mère) et isco0803P (pour le père) en sommant les 23 variables produites par la deuxième question (nommées E1dx et E2dx dans la syntaxe) :

*** Père ISCO03 ***

COMPUTE isco0803P=SUM (E1d1, E1d2, E1d3, E1d4, E1d5, E1d6, E1d7, E1d8, E1d9, E1d10, E1d11, E1d12, 
    E1d13, E1d14, E1d15, E1d16, E1d17, E1d18, E1d19, E1d20, E1d21, E1d22, E1d23).
EXECUTE.

*** Mère ISCO03 ***

COMPUTE isco0803M=SUM (E2d1, E2d2, E2d3, E2d4, E2d5, E2d6, E2d7, E2d8, E2d9, E2d10, E2d11, E2d12, 
    E2d13, E2d14, E2d15, E2d16, E2d17, E2d18, E2d19, E2d20, E2d21, E2d22, E2d23).
EXECUTE.

var labs isco0803P '[Pères] Code professionnel ISCO08-03'.
var labs isco0803M '[Mères]  Code professionnel ISCO08-03'.

formats isco0803P (f8).
formats isco0803M (f8).

Notes

[1SPSS était le logiciel initialement employé pour l’enquête. La syntaxe peut être lue et appliquée sans problème par PSPP, équivalent libre de SPSS