Le projet Biodiv
Des sites contributifs pour connaître la biodiversité qui nous entoure

Accueil du site > Utiliser > 3. Etre administrateur > Gérer les références à une classification

Gérer les références à une classification

Utiliser TAXREF

dimanche 29 mai 2016, par Webmestre

Les limites de la classification Biodiv

Quand un rédacteur produit une fiche décrivant une espèce, il crée en réalité un article portant un numéro dans la base Biodiv, et ce numéro devient de fait la référence interne de l’espèce dans la base.

Si ce système a l’avantage de la simplicité, il a aussi un inconvénient majeur : celui de générer des identifiants d’espèces qui ne sont pas partageable avec un autre site biodiv ou avec une autre structure naturaliste. Que veut dire par exemple l’espèce 123 de Biodiv.Balma pour le Muséum national d’histoire naturel, ou même pour Biodiv.Sone ?

Utiliser une classification standardisée

Afin de remédier à ce problème, la version 2.0041 introduit la possibilité d’associer une référence d’article (c’est à dire son numéro unique) à un la référence d’un taxon dans une classification externe, la classification TAXREF utilisée par l’inventaire national du patrimoine naturel (INPN).

Par exemple, l’ophrys abeille (Ophrys apifera) est référencée dans Biodiv.Balma comme le taxon numéro 412. Cette même orchidée est connue de l’INPN sous la référence 110335, au sein de la classification "TAXREF" dans sa version 8.

Ce que propose Biodiv 2.0041, c’est de faire le lien entre la référence interne (412), la référence externe (110335) venant de TAXREF.

Mécanisme de référence croisée

Pour effectuer la correspondance, Biodiv 2.0041 utilise deux sources :

  • les fiches espèces (articles dont la composition est "espece")
  • le référentiel TAXREF

TAXREF peut être obtenu après inscription sur le site de l’INPN. Il se présente sous la forme d’un très gros fichier CSV (170 Mo pour TAXREF v8.0), qu’il faudra découper en tronçons à télécharger sur le site.

Un processus batch, livré dans la 2.0041, extrait les noms latins binomiaux des fiches espèces et les compare au champ correspondant dans les différents fichiers CSV. Si une correspondance est détectée, une entrée est créée ou mise à jour dans la nouvelle table spip_taxons. Cette entrée contient le nom binomial, les CD_NOM et CD_REF du taxon, ainsi que le numéro de l’article décrivant l’espèce. Grâce à cette information, chaque fiche ainsi indexée verra apparaître le numéro de taxon sous le sous-titre dans la fiche espèce.

Préparation des fichiers TAXREF

Pour pouvoir disposer de l’indexation, il est nécessaire de charger le référentiel TAXREF sur le site. Nous prendrons comme hypothèse que le référentiel sera découpé en fragments de 18000 lignes environ. Comment les obtenir ?

Une fois TAXREF chargé sur votre ordinateur, il faudra le découper, en préservant la structure de lignes présente dans le CSV et en répétant la ligne d’entête dans chaque fragment.

On pourra pour cela utiliser le programme TextFileSplitter, disponible en document joint. Les paramètres sont à sélectionner selon l’illustration ci-dessous en fonction du nom de fichier et du répertoire de destination.

PNG - 137.5 ko
Utiliser TextFileSplitter pour découper en fragments le fichier TAXREF au format CSV

Chargement des fragments

Une fois les fragments générés, il faut les charger dans un répertoire du site, au moyen d’un client FTP. Pour l’exemple, on choisira ici config/taxref (Ne pas utiliser tmp ou local)

Indexation

L’indexation de la base s’effectue grâce à un processus tournant en tâche de fond sur le site. Plus précisément, la présence de la balise #SPIP_CRON dans les pieds de page déclenche des traitements, dont la recherche de taxons.

Le temps de traitement devant être bien inférieur à 30 secondes, chaque passage sur la balise ne traite qu’une partie du référentiel. Les paramètres de ce traitement sont accessibles dans ecrire/?exec=configurer_taxref. Ce lien donne accès à la fenêtre ci dessous :

PNG - 11.5 ko
Configuration de l’indexation TAXREF

Le valeurs typiques à renseigner sont indiquées. On poura toutefois être amenée à les ajuster dans un des cas suivants :

  • changement de la structure du fichier TAXREF
  • nombre de fragments générés lors de la préparation
  • localisation des fichiers TAXREF sur le site Biodiv (si vous choisissez un emplacement différent)

Une fois le système paramétré, l’indexation s’enclenche et peut être suivie sur la page spip.php?page=taxrefstats accessible aux administrateurs depuis l’espace perso.

PNG - 55.1 ko
Accéder au suivi de l’indexation depuis l’espace perso

Cette page indique la progression de l’indexation en cours. En effet, une fois le référentiel TAXREF entièrement balayé, l’indexation reprend afin de tenir compte des nouvelles fiches espèce qui pourraient avoir été créées entre temps.

PNG - 10.3 ko
Suivi de la progression de l’indexation TAXREF depuis le site public

Le bas de cette page liste toutes les espèces pour lesquelles aucune correspondance n’a été trouvée dans TAXREF.

Limitations

L’indexation TAXREF pourra ne pas fonctionner pour une fiche espèce dans un des cas suivants :

  • Espèce absente du référentiel : ceci se produit pour des espèces importées qui ne figurent pas au catalogue national (TAXREF ne s’intéresse qu’aux espèces connues en France)
  • Nom binomial incorrect : il fait en particulier suivre les règles suivantes :
    • Le premier terme doit comprendre une majuscule, pas le second.
    • Un seul espace entre les deux noms.
    • Pas d’espace avant ni après, ni de caractère particulier.
    • Quand plusieurs noms binomiaux existent, n’en mentionner qu’un dans le champ sous-titre ; le deuxième pourra être indiqué dans un autre champ avec les autres noms de l’espèce.
    • Quand aucun nom vernaculaire n’existe, on placera le nom latin binomial dans le champ titre ET dans le champ sous-titre.
  • Le nom ne caractérise pas une espèce mais une famille. Par exemple "Agaricus sp." de donnera pas lieu à une indexation.

Documents joints

Répondre à cet article

SPIP | | Plan du site | Suivre la vie du site RSS 2.0

Habillage visuel © styleshout sous Licence Creative Commons Attribution 2.5 License, adapté par l'APCVEB.