Comment organiser les données ?

logo-bio-designexp

Maintenant que nous disposons de nos données, il est nécessaire de les organiser de façon à faciliter leur exploitation. Que la récolte des données soit manuelle ou automatisée, il est indispensable de les formater en respectant certaines règles, qui permettront :

  • De stocker proprement l’information sur le long terme ;
  • De pouvoir partager les données avec n’importe quel laboratoire dans le monde ;
  • De permettre la réutilisation des données par d’autres scientifiques.

Pour cela, nous devons utiliser des fichiers de type “universels” qui devraient pouvoir encore être ouverts sur n’importe quel ordinateurs, même dans plusieurs années ou dizaines d’années. Au laboratoire, nous travaillerons généralement avec des fichiers de type ".csv", qui sont des fichiers textes permettant de stocker beaucoup d’information dans des fichiers de petite taille. Ceux-ci doivent être formatés d’une certaine manière afin de pouvoir être facilement traités par voie informatique. Pour cela, de nombreux logiciels en libre accès existent (e.g. OpenOffice).

Vous trouverez, en pièce jointe ci-dessous, un document montrant les différentes étapes de la structuration des données afin qu’elles puissent être rapidement exploitée via R. Pour cette démonstration, nous avons placé les différentes étapes de modification des données sous la forme d’un fichier “.ods”, et chaque étape est présente dans une “feuille” différente (les fichiers .csv ne permettent pas de faire différents onglets).

Pour en savoir plus