Alors que le nombre de données récoltées grâce aux applications naturalistes explose, faisons le point sur la nature de différentes données, leurs apports et limites pour caractériser l’état de la biodiversité.
La connaissance de l’état de la biodiversité commence par des observations. Ces observations constituent des données qui nous informent. Oui mais l’art de la récolte de donnée est délicat, et selon la manière dont celles-ci sont faites, nous n’apprenons pas la même chose !
Qui ou comment, telle est la question !
Imaginez que vous êtes dans un parc de votre ville, dans votre jardin, dans une forêt que vous fréquentez, sur un sentier que vous empruntez régulièrement. Et vous souhaitez en savoir plus sur la biodiversité de cet espace. En réalité, on peut développer cette interrogation et ce désir d’en savoir plus en deux questions fondamentales 1) quelles espèces sont là ? et 2) comment vont-elles ? Bien sûr, il serait possible d’aller plus loin et de se poser de nombreuses autres questions telles que « Qu’est-ce qu’elles font ? », « Comment interagissent-elles les unes avec les autres ? », « Comment structurent-elles cet espace ? », etc.
Mais « Qui est là ? » et « Comment ça va ? » sont deux préalables à la connaissance de base sur la biodiversité. Or les réponses à ces deux questions mobilisent deux types de données radicalement différentes !
Pour répondre à la première question, « Qui est là ? » vous pouvez faire un inventaire : prospecter cet espace pour relever et identifier toutes les espèces présentes au moment de votre inventaire. Vous pourrez alors établir une cartographie de présence pour chaque espèce rencontrée. À grande échelle et au sein du MNHN, répondre à la question « qui est là ? » est la tâche de l'Inventaire National du Patrimoine Naturel (INPN). Les observations permettent de localiser la biodiversité, qu’elle soit remarquable ou ordinaire, et de produire des cartes de répartition des espèces. L’objectif est de pouvoir planifier l’aménagement du territoire (zones de protection, infrastructures de transport, …) en tenant compte de la biodiversité, notamment de la présence d’espèces rares.
Pour répondre à la seconde, à savoir « Comment ça va ? » vous pouvez faire un ou plusieurs suivis : leur abondance d’espèces parmi les plus régulières et les plus détectables (les compter ou évaluer leur volume pour les végétaux) à intervalles réguliers. Vous saurez alors si elles se maintiennent, se développent ou déclinent dans cet environnement ; et si c’est votre jardin, vous pourrez évaluer s’il faut agir pour favoriser la présence de l’une ou une autre espèce. À grande échelle, c’est la manière de récolter les données de programmes de sciences participatives portés par Vigie-Nature et ses partenaires, qui permet de produire des indicateurs d’abondance de populations. L’objectif est d’évaluer les dynamiques de la biodiversité dans les territoires au fil du temps, et de mettre en relation les résultats avec les changements globaux, les politiques agricoles et d’urbanisation, la mise en protection de territoires ou d’autres phénomènes à grande échelle…
Les données utilisées pour caractériser l’état de la biodiversité sont le plus souvent des données d’occurrence
Lorsque l’on établit qu’une espèce est présente sur un site et à un moment donné, il s’agit d’une donnée d’occurrence. Ces données proviennent de différentes sources qui évoluent avec les pratiques : il y a eu la constitution de collections des museum par des scientifiques et amateurs, les observations de groupes naturalistes, la mise en place d’inventaires portés par des structures spécialisées comme l’INPN. Les méthodes de récolte de données d’occurrence évoluent aussi au gré de la technologie, avec le développement de la télédétection, puis de l’ADN environnemental ciblé à l’espèce et plus récemment avec l’utilisation du Séquençage Nouvelle Génération (NGS) permettant en aveugle et en une fois, une identification de toutes les espèces présentes dans un échantillon. De même, l’identification automatique à partir d’images ou de sons a permis de multiplier de manière colossale les observations par tout un chacun avec la banalisation d’utilisation d’applications (plantnet, Inaturalist, naturaListe…). Toutes ces données sont compilées dans de grandes bases, notamment le Global Biodiversity Information Facility (GBIF) destiné à les rendre disponibles.
L’analyse de données d’occurrence a permis de mettre en évidence que de nombreuses espèces animales ont disparu. Grâce aux données centralisées dans les listes rouges de l’IUCN, les pourcentages de disparitions par groupe de vertébrés depuis 1500 ont été calculés et publiés en 2019 par l’IPBES.
Les données d’occurrence ont permis d’établir que le taux d’extinction augmente. Des espèces apparaissent et disparaissent naturellement, et le taux de base est la disparition d’une espèce tous les millions ou 2 millions d’années. Le taux d’extinction actuel 10 à 100 fois plus rapide que le taux d’extinction de base, et il augmente.
Les données d’occurrence permettent aussi de détecter des extinctions locales sous réserve de retourner régulièrement sur les sites connus de présence. Une étude a été menée sur 177 mammifères (ceux pour lesquelles les données étaient suffisamment détaillées localement) : tous ont perdu au moins 30 % de leur aire de répartition géographique depuis 1900. Pour plus de 40 % des espèces l’aire de répartition a été réduite de plus de 80%, ce qui indique forcément un déclin démographique important.
Cependant, la principale limite des données d’occurrence pour rendre compte de la biodiversité repose sur leur nature : on peut bien sûr conclure qu’une espèce est présente mais il est très rare de disposer d’information relative à l’absence d’une espèce. Quelque chose comme : « nous avons cherché activement cette espèce mais nous ne l’avons pas contacté ». Cette limite conduit à formuler l’hypothèse que les zones ou l’espèce n’est pas mentionnée sont des zones dont elle est absente. Ne connaissant pas l’effort de prospection, c’est une hypothèse qui peut se révéler raisonnable dans les zones ou la prospection est intense mais très peu vraisemblable lorsque l’effort de prospection est faible ou pire, inconnu !
Une étude menée en 2023 par Boyd et al. illustre ce biais qui est d’autant plus important lorsque les données sont récoltées de manière opportuniste, sans plan d’échantillonnage. Calluna vulgaris est une plante que l’on trouve dans les landes, facile à reconnaître lorsqu’elle fleurit : les gros tapis de fleurs roses permettent de reconstituer sa distribution réelle grâce à des photos aériennes. Si l’on compare cette distribution à celle obtenue grâce aux données opportunistes collectées par des botanistes, on constate qu’elles sont très différentes : la callune n’est pas dans les lieux fréquentés par les personnes et celles-ci ne vont pas dans les lieux où elle est, bref, ils ne se rencontrent pas ! L’estimation de sa distribution obtenue grâce aux données opportuniste est valide statistiquement mais ne reflète pas la distribution réelle. Des méthodes statistiques sont développées pour corriger ce type de biais. Cependant l’analyse de données opportunistes est bien plus délicate que celles faite avec des données récoltées selon des protocoles d’observation intégrant un plan d’échantillonnage.
Les suivis d'abondance pour détecter les changements de biodiversité de manière plus sensible
Basées sur des observations de présence, les données d’occurrence n’informent pas de manière précise sur les dynamiques démographiques. Par exemple, le Martinet noir, largement réparti en France, bien connu, bruyant et voyant, est présent dans la quasi-totalité des mailles de l’atlas national des oiseaux de France.
En se basant sur la carte, le Martinet semble bien se porter… Pourtant, sa population a chuté d’entre 60% et 70% entre 2001 et 2023 !
Les données basées sur des comptages, obtenues par des suivis avec des plans d’échantillonnage, sont plus pertinentes pour caractériser des changements d’abondance des populations. Elles permettent de détecter plus finement les changements au sein des populations.
De plus, les données issues des suivis permettent d’identifier les causes de déclin en permettant de faire des analyses mettant en relation les dynamiques de population et des activités ou pratiques humaines, les changements globaux ou d’autres facteurs environnementaux. Par exemple, grâce à ce type de données, Rigal et al (2023) ont mis en évidence que l’agriculture intensive est la principale pression associée au déclin des oiseaux en Europe.
Les limites posées par les données de suivi sont propres à l’utilisation qu’on en fait : il faut des volumes de données conséquents pour pouvoir leur appliquer des traitements statistiques et inférer les résultats obtenus à l’ensemble de la population. C’est le point critique de la taille de l’échantillon, bien connu des instituts de sondage. Or les gros volumes de données concernent surtout les espèces abondantes et détectables. Les suivis, à moins d’être spécifiquement conçus, ne concernent que rarement les espèces rares ou localisées.
HD
Pour approfondir le sujet : cours d’Emmanuelle Porcher au Collège de France
Références :
Rapport de l’Évaluation mondiale de la biodiversité et des services écosystémiques (IPBES)
Rapport Ecosystems and human well-being, Biodiversity Synthesis (MEA)
Ceballos et al (2017) Biological annihilation via the ongoing sixth mass extinction signaled by vertebrate population losses and declines, PNAS
Boyd et al. 2023, We need to talk about nonprobability samples, Trends in Ecology & Evolution