Modèles d’apprentissage machine pour l’identification de la maladie du swollen shoot en Côte d’Ivoire.
Mots-clefs: Machine Learning, Classification d’image, swollen-shoot, deep-learning.
Description du projet
La culture du cacao joue un rôle important dans l’économie ivoirienne. Importé en Côte d’Ivoire au cours de la colonisation, la culture du cacao occupe encore aujourd’hui une place de choix dans l’économie ivoirienne avec près de 15% du PIB et 50% des recettes d’exportation (BAD, 2019). Bien que la culture de cacao occupe une place importante au sein de l’économie ivoirienne, les producteurs de cacao ne percevraient pas une part importante de la valeur que représente cette spéculation. En effet, selon des estimations des autorités ivoiriennes, les producteurs de cacao ne recevraient que 6% de la valeur global que représente le cacao. En plus de recevoir une faible part des produits du cacao, les producteurs font également face à des pertes de récolte dues quelque fois à des maladies du cacao notamment le swollen shoot.
Le swollen shoot, en plus de menacer le revenu des producteurs, représente une menace de la durabilité de la culture du cacao. La maladie du swollen shoot du cacaoyer est une maladie virale dont la présence en Côte d’ivoire remonte à l’année 1943. En plus d’être endémique, des formes virulentes de la maladie ont été confirmées en 2003 par le CNRA dans de grandes zones de production. Elle entraîne des pertes de récole pouvant varier de 25% à 50% sur les deux premières années et pouvant atteindre 100% à partir de la troisième année. La prévalence de la maladie est estimée à environ 9% à 10%.
La recherche sur le swollen shoot identifie cette maladie via plusieurs canaux que sont : les gonflements des tiges et des racines, les tâches rougeâtre ou jaunâtre sur les feuilles et la forme de la cabosse. L’une des méthodes les plus efficace de lutte contre cette maladie est le développement de souche résistante par le croissement des souches (Andres, C., 2017). Au vu de la menace que représente le swollen shoot, le gouvernement ivoirien, à travers le conseil du café cacao (CCC) a initié un programme national de lutte contre le swollen shoot. Ce programme vise à identifier les vergers infectés, à les arracher puis replanter de nouveaux pieds de cacao.
Ce projet de recherche s’inscrire dans l’objectif d’identification de la maladie du swollen shoot par des modèles. En effet, en se basant sur les symptômes connus de la maladie du swollen shoot, ce projet vise d’une part à développer des modèles mathématiques puis à les implémenter en vue d’aider les producteurs à l’identification précoce de cette maladie.
L’objectif principal de cette étude est de mettre en place un modèle d’identification de la présence de swollen shoot sur une plantation. Plus spécifiquement, ce projet consiste à :
1. Collecter des informations sous forme d’image et de coordonnées GPS sur les vergers de cacao ;
2. Élaborer puis entrainer un modèle afin d’identifier la maladie du swollen shoot ;
3. Réaliser des prévisions de ladite maladie.
La mission consistera à :
- Effectuer l’inventaire des données existantes ;
- Collecter des données complémentaires ;
- Construire des modèles (statistique, probabiliste, mathématiques) de reconnaissance de la maladie ;
- Développer un prof of concept (POC) pour une mise en application des modèles.
- Les étapes de l’étudeLes grandes étapes de la mise en œuvre de cette étude comprend trois grandes phases que sont :o L’inventaire des données disponibles sur le cacao auprès de l’INS, le CCC, l’ANADER et le CNRA.o Collecte d’informations manquantes ;o Modélisation puis prévisions ; · Inventaire des données & recherche bibliographiqueCette première phase comprend deux activités que la recherche documentaire et l’inventaire des données. La recherche bibliographique consiste à effectuer une revue de littérature sur les symptômes apparent de la maladie du swollen shoot. Cette étape permettra d’identifier en partie les besoins d’informations. La seconde activité consiste à identifier les informations disponibles sur les vergers de cacao auprès de différentes structures comme l’INS, l’ANADER, le CNRA et le CCC.
· Collecte des données
Une fois les besoins d’information connues, une collecte de données sera réalisée dans les grandes zones de production du cacao et avec une forte prévalence de la maladie. La collecte portera, à priori, sur les images des tiges, des feuilles et cabosses. Aussi, les coordonnées GPS de l’emplacement du pieds de cacao seront collectées.
· Modélisation
Une fois les données disponibles, un traitement sera réalisé en vue d’étiqueter les images avant l’entrainement des modèles. Plusieurs modèles concurrent seront entraînés en vue d’identifier un modèle avec une prévision satisfaisante.
Approche Méthodologie
· Champs de l’étude
La collecte d’information se fera dans les zones productrices de cacao. L’INS identifie 51 départements producteurs de Cacao qui ont classé en trois zones : (i) zone à faible production (l’ouest et le centre-est),(ii) zone à production moyenne (sud-est) et une zone à forte production (centre -ouest et sud-ouest).
Encadrants
MOUSSA K. Richard, PR à l’École Nationale Supérieure de Statistique et d’Économie Appliquée (Côte d’Ivoire)
Beatrice Akissi Boutin, Chercheure au Département des Etudes européennes, américaines et interculturelles de l’Université La Sapienza, Rome, Italie (Poste « Le français sur le continent africain ») et à l’Institut de Linguistique Appliquée de l’Université Félix Houphouët Boigny, Abidjan. HDR en Sciences du Langage (Université Paris Ouest Nanterre La Défense, France).
Anne-Françoise Yao, PR à l’Université Clermont Auvergne (France) et Professeur Chargé de Cours à l’Ecole Polytechnique Paris (France)
Dossier de candidature
- Une lettre de motivation adressée au Directeur de l’ENSEA ;
- Un curriculum vitae (CV) détaillé récent ;
- Une copie légalisée du diplôme du BAC ;
- Une copie légalisée des diplômes obtenus après le BAC et des relevés de notes, et tout autre justificatif pouvant appuyer la candidature ;
- Un projet de recherche de thèse de cinq (5) pages maximums indiquant clairement le titre, le problème, les objectifs, la démarche d’analyse, une revue de la littérature, les hypothèses et les résultats attendus ainsi que les références bibliographiques correspondantes. Une attention particulière sera accordée à la qualité de rédaction du sujet de recherche proposé et sa pertinence par rapport aux intérêts de recherche des chercheurs du CEA ou des problématiques de développement économique ;
- Deux (2) lettres de recommandation pouvant justifier la capacité de recherche de l’étudiant (de préférence deux lettres d’enseignants-chercheurs habilités à diriger une thèse) ;
Les candidatures comprenant toutes les pièces certifiées conformes sont reçues exclusivement par voie électronique à l’adresse ecoledoctorale@ensea.edu.ci
Veuillez mentionner en objet : « Projet de thèse : Statistique, Machine Learning et Linguistique ».
La date limite de réception des dossiers de candidature est fixée au 12 Août 2022
Pour toutes informations complémentaires prière vous rendre à l’ENSEA au Bureau 802 ou contacter les numéros suivants :
Tél : (+225) 27 22 44 08 42
Livrables
· Des articles sur les méthodes qui seront développées.
· Un logiciel de reconnaissance d’image spécifique au contexte.
Quelques exemples de retombées des résultats des travaux de thèse
· Collecte d’identification en vue de la mise en place d’un système d’alerte.
· Mise en place d’une I.A (Intelligence Artificiel) permettant l’identification de la maladie.
Profil recherché
· Titulaire d’un master de statistique, data science et équivalent.
· Bonne maitrise des logiciels R et Python.
· Être capable de s’intégrer dans un contexte pluridisciplinaire
Encadrants
- (A completer).
- Anne-Françoise Yao, PR à l’Université Clermont Auvergne (France) et Professeur Chargé de Cours à l’École Polytechnique Paris (France)
- MOUSSA K. Richard, PR à l’École Nationale Supérieure de Statistique et d’Économie Appliquée (Côte d’Ivoire)
Quelques références
Abrokwah, F., Dzahini-Obiatey, H., Galyuon, I., Osae-Awuku, F., & Muller, E. (2016). Geographical distribution of cacao swollen shoot virus molecular variability in Ghana. Plant Disease, 100(10), 2011-2017.
Andres, C., Gattinger, A., Dzahini-Obiatey, H. K., Blaser, W. J., Offei, S. K., & Six, J. (2017). Combatting cocoa swollen shoot virus disease: what do we know?. Crop protection, 98, 76-84.
Coulibaly, M., Kouassi, K. H., Kolo, S., & Asseu, O. (2020). Detection of “Swollen Shoot” Disease in Ivorian Cocoa Trees via Convolutional Neural Networks. Engineering, 12(03), 166.