Que peuvent nous raconter les milliers de signalements d'espèces que professionnels et amateurs transmettent tous les jours au Muséum ? Selon une récente publication, plus que de simples inventaires, les données opportunistes peuvent dévoiler des phénomènes écologiques.
Les données naturalistes s’accumulent. Avec la multiplication des programmes d’inventaires participatifs de la biodiversité, de signalements professionnels ou amateurs, les bases de données atteignent des volumes gigantesques. La principale en France, l’INPN, l’Inventaire National du Patrimoine naturel, renferme plus de 49 millions de données sur 182 000 espèces de France métropolitaine et d’Outre-Mer. Autant d’informations susceptibles de documenter précisément l’état de la biodiversité française.
Ces données, provenant de sources variées, restent cependant difficiles à exploiter pour faire des comparaisons dans le temps ou dans l’espace. Une difficulté provenant de leur hétérogénéité, notamment vis-à-vis de leur mode de collecte. En effet, si un observateur signale 12 mésanges charbonnières et qu’un autre n’en signale que 6, comment être sûr qu’il y a deux fois plus d’oiseaux dans la première situation sans connaître le temps passé sur le terrain pour chaque observateur, la zone couverte ou la méthode de comptage (capture pour le baguage, observation à la mangeoire, enregistrements des chants…) ?
Si l’objectif de la collecte de données est de faire ce type de comparaisons – pour connaître notamment l’évolution des populations d’une espèce -, les données utilisées doivent toutes être collectées de la même façon, avec la même intensité. Ce qui implique le suivi d’un protocole. La production de telles données dites « standardisées » est au cœur des observatoires de Vigie-Nature depuis 30 ans, avec le succès qu’on connaît.
Des données standardisées, incluant celles de Vigie-Nature, se retrouvent dans la base de l’INPN. Mais il faut y ajouter toutes les données dites « opportunistes », collectées par des naturalistes au cours de leurs promenades, au gré de leurs envies. Avec la multiplication des smartphones et l’insolente facilité avec laquelle on peut capturer et envoyer l’image d’un spécimen rencontré, les données opportunistes affluent en masse. Ainsi le nombre de données, malgré leur hétérogénéité, devient la grande force de l’INPN. La question qui anime dès lors les écologues : comment exploiter pour leur recherche cette considérable manne d’informations naturalistes ?
Le pouvoir des grands nombres
Des chercheurs du Muséum ont récemment apporté un début de réponse en analysant les données INPN. Ils se sont penchés sur les papillons, taxon très observé, pour répondre à une question de phénologie assez simple : quelle est la période de vol annuelle des différentes espèces ? Rien de plus facile a priori… Mais c’est sans compter le principal défaut des données opportunistes : les biais. Pour Benoît Fontaine, responsable du STERF (Suivi Temporel des Rhopalocères de France) à Vigie-Nature et un des co-auteurs de l’étude, « si les données d’observation opportunistes d’une espèce de papillon sur un lieu donné augmentent à certaines périodes de l’année, on ne sait pas a priori si ce sont les papillons qui sont plus nombreux, ou les observateurs. »
Afin de corriger ces biais, les scientifiques ont procédé à des traitements mathématiques sur les données. Par exemple, pour chaque semaine, ils ont divisé le nombre de papillons observés par le nombre de sorties ayant donné lieu à des observations, de manière à obtenir un nombre moyen de papillon par sortie par semaine. Ils ont aussi divisé le nombre de sites où l’espèce a été observée par le nombre total de sites visités pendant la semaine : en ressort la proportion de sites où l’espèce est présente pour chaque semaine. Ainsi six corrections différentes ont été appliquées.
Première surprise : quelle que soit la correction, on obtient des signaux de phénologie assez similaires. Pour le papillon collier de corail (Aricia agestis), par exemple, les pics d’abondance se situent à chaque fois aux alentours de mai et de juillet. Afin de vérifier si ces résultats correspondent à la réalité, les chercheurs les ont comparés à ceux obtenus avec le STERF, observatoire « papillons » de Vigie-Nature. Ses données standardisées offrent des signaux considérés comme reflétant bien la réalité. Et là, deuxième surprise : la phénologie issue des données de l’INPN et des données structurées du STERF se confondent.
« Cela montre toute la potentialité des données opportunistes de l’INPN, pourvu qu’elles soient disponibles en grand nombre » en conclut Benoît. Les données opportunistes peuvent ainsi décrire la phénologie des espèces, en plus de les inventorier. Cela ouvre de nouvelles perspectives. Répondre à des questions plus complexes devient envisageable : comment mesurer l’impact du réchauffement climatique sur cette phénologie ? Quelles espèces sont concernées ? Le réchauffement va-t-il avancer ou reculer la phénologie ? La situation est-elle la même dans toutes les régions de France ?
Pour autant, prévient le chercheur, cela ne veut pas dire que les protocoles de Vigie-Nature sont caducs, bien au contraire. « Ils sont là pour contrôler la validité des données opportunistes, ils les renforcent, les valident. » Les résultats des suivis standardisés restent la référence. Des travaux similaires sont en cours pour valoriser d’autres données opportunistes, comme celles de la LPO collectées par les amoureux des oiseaux dans toute la France. Dans ce cas-là, nos données du STOC serviront de référence. Et peut-être qu’un jour les données opportunistes, étalonnées par des données standardisées, pourront révéler des variations d’abondance à des échelles spatiales et temporelles aujourd’hui inaccessibles.
Quoi qu’il en soit ces résultats encouragent à poursuivre la collecte de données naturalistes, peu importe le moyen. Le pouvoir des grands nombres n’a pas fini de nous surprendre.