Logo Foire aux questions

En français, In English

Je viens de télécharger des données de la base de données Epiphyt. Pourquoi y-a-t’il des doublons dans les données de cette base ?

Initialement, la base de données Epiphyt recense une grande quantité d’observations de maladies sur les cultures agricoles. Les données d’observation originales correspondent à l’observation d’une culture, dans un lieu donné et un jour donné, pour laquelle l’état sanitaire d’une plante est décrit en regardant la présence/absence et intensité de plusieurs pathogènes (champignons, insectes…), et son stade phénologique. Le portail TEMPO diffuse les observations telles que présentes dans la base de données d’origine, et l’information sur le pathogène (présence, absence, intensité, etc.) n’étant pas redistribuée, la donnée phénologique se retrouve en doublon. Le choix est ainsi laissé pour réaliser le traitement des données et éliminer les doublons.

Peut-on savoir si l’on parle de blé d’hiver (ou orge d’hiver) ou de printemps dans les données mis à disposition dans TEMPO ?

Cette information n’est pas disponible dans les données diffusées par le portail TEMPO, sauf si elle est explicitement décrite par le fournisseur des données. L’autre possibilité est de vérifier si la date de semis de la même série est aussi disponible dans la base de données.

Dois-je citer les jeux des données qui sont disponibles dans TEMPO ?

Oui, lors de la publication d’articles scientifiques, il faut respecter les licences et de citer l’origine des données utilisées. L’ensemble des licences des jeux des données sont disponibles ici et dans le dossier téléchargé.

PMP

Qu'est-ce que le format PMP disponible au téléchargement ?

PMP (Phenology Modelling Platform) est un logiciel de modélisation biophysique de la phénologie des plantes qui permet :

Voir http://www.cefe.cnrs.fr/fr/recherche/ef/forecast/phenology-modelling-platform.

Les fichiers pheno-pmp.txt, pheno-pmp-drias.txt et pheno-pmp-safran.txt sont des fichiers d’entrée pour le logiciel PMP.

Le fichier pheno-pmp.txt concerne toutes les données alors que les fichiers pheno-pmp-drias.txt et pheno-pmp-safran.txt ne contiennent les données que pour les sites que l’on a pu associer à des mailles DRIAS ou SAFRAN.

À quoi correspondent les entêtes du fichier PMP à partir de la 4ème colonne ?

Ce sont les codes des stades préfixés des codes des échelles phénologiques, identifiés tels que présents dans la base de données TEMPO et repris dans le fichier stade.csv.

Comment sont construits les fichiers au format PMP ?

Puisqu’un fichier PMP ne peut contenir qu’une valeur par lieu, année et stade, lorsque plusieurs dates sont présentes dans les données sélectionnées (et présentes dans le fichier variables_communes.csv) une agréation est réalisée : la moyenne pour 2 dates ou la médiane pour 3 dates et plus.

Vous pouvez recréer les fichiers pheno-pmp-drias.txt et pheno-pmp-safran.txt à partir du fichier variables_communes.csv (par exemple si vous filtrez ses données) en utilisant le script Python 3 common_variables2pmp.py présent dans l’archive :

./common_variables2pmp.py --help\
./common_variables2pmp.py --sites sites.csv --data variables_communes.csv
./common_variables2pmp.py --sites sites.csv --data variables_communes.csv --drias
./common_variables2pmp.py --sites sites.csv --data variables_communes.csv --no-drias

← TEMPO