Garder les colonnes communes de plusieurs fichiers Excel
Analyser 2 plages de données avec des colonnes différentes, c'est compliqué à agréger manuellement, voilà pourquoi je vous propose ce code VBA qui récupère les colonnes communes.
Demo (video)
Retrouvez ci-dessous l’automatisation en question.
Une application directe de ça ?
Oui.
Les données (ouvertes) de la plateforme ParcourSup ont beaucoup changé au fil des années :
- Des colonnes ont disparu ;
- D’autres colonnes sont apparus ;
- Des colonnes sont restées tout le long.
Evidemment c’est le 3ème point qui nous intéresse, parce qu’on veut de la donnée cohérente avant notre analyse. L’objectif est d’unir les fichiers exportés en 1 seul (très grand) fichier final, qui servira pour l’analyse globale.
J’ai d’ailleurs publié une dataviz à ce sujet pour aider les gens à choisir leur formation.
Et si on voyait plus loin…
L’historique de données m’a poussée à faire cette automatisation, mais rien n’empêche de le faire pour des systèmes d’informations qui ont changé, des sources de données différentes avec des informations communes, etc.
Code source
Vous pouvez télécharger les 4 fichiers sources (2018 à 2021) et le fichier d’automatisation directement ici 😊.
D’ailleurs, les 4 fichiers sources de ParcourSup sont également disponibles sur le site officiel de l’Enseignement supérieur.