Maintenant que nous disposons de nos données, il est nécessaire de les organiser de façon à faciliter leur exploitation. Que la récolte des données soit manuelle ou automatisée, il est indispensable de les formater en respectant certaines règles, qui permettront :
Pour cela, nous devons utiliser des fichiers de type “universels” qui devraient pouvoir encore être ouverts sur n’importe quel ordinateurs, même dans plusieurs années ou dizaines d’années. Au laboratoire, nous travaillerons généralement avec des fichiers de type ".csv", qui sont des fichiers textes permettant de stocker beaucoup d’information dans des fichiers de petite taille. Ceux-ci doivent être formatés d’une certaine manière afin de pouvoir être facilement traités par voie informatique. Pour cela, de nombreux logiciels en libre accès existent (e.g. OpenOffice).
Vous trouverez, en pièce jointe ci-dessous, un document montrant les différentes étapes de la structuration des données afin qu’elles puissent être rapidement exploitée via R. Pour cette démonstration, nous avons placé les différentes étapes de modification des données sous la forme d’un fichier “.ods”, et chaque étape est présente dans une “feuille” différente (les fichiers .csv ne permettent pas de faire différents onglets).