
Chemomics 2022
FloodCRM
La 3ème édition de l'école mixte de chimiométrie et métabolomique CHEMOMICS se déroulera du 17 au 20 octobre 2022 à Sète. Cette école est organisée par des personnes venues des communautés scientifiques Metabohub (W4M) et Chemoocs /Chemhouse (Chemflow) avec le service formation permanente d'INRAE Montpellier.
La métabolomique et la chimiométrie forment deux communautés différentes présentant beaucoup de points communs.
Les objectifs de cette troisième édition sont toujours d’améliorer son niveau de compréhension des méthodes statistiques utilisées en chimiométrie et en métabolomique, et d'être capable de les appliquer. Les discussions autour de questions méthodologiques, seront favorisées afin de continuer à rapprocher ces deux communautés, et d’initier des axes de travail en commun qui se poursuivront au-delà de l’école.
Ainsi, les aspects “découverte”, “discussion” et “participation de tous” seront au cœur de cette école, où une partie est organisée sur le principe pédagogique du barcamp, ou nonconférence, et des ateliers-événements participatifs dont le contenu et les livrables sont fournis par les participants.
Sur 30 inscrits, 25 personnes étaient présentes à cette école et celles ne pouvant se déplacer ont pu la suivre en visio.
Le programme s'organisera en alternant une demi-journée cours et pratique suivi d'une demi-journée de travail sur vos données sous forme de barcamp. Les horaires de l'école sont de 9h à 12h30 et 14h à 18h. L'école se déroule de préférence en présentiel mais quelques personnes sont en visio : https://inrae-fr.zoom.us/j/9019024855?pwd=RUh1aFVwemYrNnlhZkxLdFFLMEZGQT09
ID de réunion : 901 902 4855
Code secret : Chemomics3
Programme
Chaque atelier et barcamp sera axé sur une question particulière, remontée par les participants lors de leur inscription, et non résolue de manière satisfaisante.La partie pratique consistera en l’application de méthodes chimiométriques à des données de métabolomique.
Ce programme présentera la normalisation, les régressions et les méthodes multiblocs en 3 jours.
lundi 17 octobre 14h-18h
NormalisationAnimateurs: Mélanie Petera, Jean-Claude Boulet, Yann Guitton (en visio), Jean-Michel Roger
Données: A.Mejait, B.Habchi
Présentations :
mardi 18 octobre 9h-12h30
barcamp : échange sur les verrous et manquesLes sujets identifiés sont :
- * sous groupe cadre d'application des methodes : lien vers de code VSN : https://framagit.org/chemhouse_repository/chemometrics_toolbox/-/blob/master/chemhouse_toolbox.zip
- * sous groupe validation du pipeline : + BarCamp181022
- * sous groupe outils disponibles sous Galaxy + BarcampWorkflow2022
mardi 18 octobre 14h-18h
Régressions, méthodes linéaires et alternatives non linéairesChemoocs, cours en ligne de chimiométrie : https://www.fun-mooc.fr/fr/cours/chimiometrie-chapitre-22-les-methodes-supervisees : Semaine 2 grain 8 et 9
Animateurs : Eric Latrille, Virginie Rossard, Jean-Michel Roger
Présentation : 2022-10-18_chemomics3_regressions_final3.pdf
Données: C. Le Signor
Pratique : 2022-10-18_chemomics3_regressions_pratique.pdf
Historique Chemflow des traitements de données et modèles PLS : https://vm-chemflow-francegrille.eu/u/latr/h/chemomics3-nirs2022
mercredi 19 octobre 9h-12h30
9h-10h45. Construction de modèles de régressions avec PLSR et/ou covselDonnées du TP :
Construction de modèles
- sous chemflow : Data Libraries/Chemomics-3/1-normalisation/biopesticides2022
- fichiers : biopesticides_metadonnees_observations_v2.csv (2.2kB)
- données de métabolomique du pétoncle (P.E. Bodet)
11h15-12h30 barcamp : échange sur les verrous et manques autour des modèles de régression
Résumé des questions soulevées et actions à conduire :
- Comment améliorer la pratique de covsel ? En organisant une 1/2 journée de pratique sur covsel en visio : Jean-Michel ROGER
- Comment clarifier les usages de la PLS-DA pour faire de l'analyse discriminante ? Soit en faisant une étude bibliographique critique, soit en publiant un article sur les différentes méthodes pour effectuer les analyses discriminantes : Jean-Michel ROGER, Marion BRANDOLINI-BUNLON, Jean-Claude BOULET et Eric LATRILLE
- Utlisation des méthodes sparse et pour quels usages. A voir avec Rémi SERVIEN
- Utilisation de méthodes de prédiction non-linéaires. A voir avec Rémi SERVIEN et Eric LATRILLE pour une prochaine session de Chemomics
- Les différents critères de dimensionnement d'un modèle : ils sont disponibles sur chemflow au menu "regressions / tunings the dimension"
- Les cours sur les critères de chemomics 2 en 2021 sont accessibles ci-contre : 2021_chemomics_atelier4_criteres_presentation.pdf
- La robustesse d'un modèle : Chemoocs, cours en ligne de chimiométrie : https://www.fun-mooc.fr/fr/cours/chimiometrie-chapitre-22-les-methodes-supervisees : Semaine 6 grain 16
- Les transferts d'appareils : des méthodes de transfert sont disponibles sur chemflow menu calibration transfert comme PDS mais des méthodes particulières doivent être développées pour les données de spectrométrie de masse ( Jean-Michel ROGER)
- https://entrepot.recherche.data.gouv.fr/dataset.xhtml?persistentId=doi:10.15454/LXKFAS
- https://entrepot.recherche.data.gouv.fr/dataset.xhtml?persistentId=doi:10.15454/Z9RW2M
- https://entrepot.recherche.data.gouv.fr/dataset.xhtml?persistentId=doi:10.15454/9RDHIN
- Questions pratiques :
- + est ce problématique d'avoir des valeurs négatives quand on applique un pré-traitement ? A priori, non, ce n'est pas un problème sauf si on envisage de faire ensuite un pré-traitement qui n'est pas compatible avec des valeurs négatives.
mercredi 19 octobre 14h-18h
Multiblocs exploratoire et discriminante / analyse des données / Multi-voiesAnimateurs : Benoit Jaillais, Marion Brandolini-Bunlon, Jean-Michel Roger, Julien Boccard (en visio), Mohamed Hanafi (en visio)
Données: E.Venot, A.Meijat, ML Goddard
Multi blocs exploratoire par Benoit Jaillais : 2022_chemomics_multiblocs.pdf
Méthodes discriminantes par Marion Brandolini-Bunlon : Chemomics3_Les_methodes_discriminantes_20221020.pdf
- outil jvenn : http://jvenn.toulouse.inra.fr/app/example.html
jeudi 20 octobre 8h30-12h30
Multi blocs exploratoire cas d'étude par Mohamed Hanafi :Sous chemflow, les données sur ACOM sont accessible depuis : Libraries/Chemoocs-1/grain 19 - grain 20
et l'outil se trouve dans le menu Multiblocks : MB_method -> CCSWA et MCoA
barcamp : échange sur les verrous et manques
1. multi-techniques, multi-omiques, séries temporelles : choix des méthodes MB
2. selon les questions des participants
Comparaison de méthodes multiblocs par Benoit Jaillais : 2022_Chemomics comparaison_de_methodes_multiblocs.pdf

Comité d'organisation
Nous sommes 19 personnes mais cette édition de cette école a impliqué les intervenants suivants :- jean-claude.boulet, INRAE, Montpellier, chimiométrie, présentiel
- julien.boccard, université, Suisse, métabolomique & chimiométrie, visio
- marion.brandolini-bunlon, INRAE, Clermont, métabolomique, présentiel
- binta.dieme, INRAE, Clermont, métabolomique, absente
- yann.guitton, ONIRIS, Nantes, métabolomique, visio
- mohamed.hanafi, ONIRIS, Nantes, chimiométrie, visio
- benoit.jaillais, INRAE, Nantes, chimiométrie, présentiel
- eric.latrille, INRAE, Narbonne, chimiométrie, présentiel
- melanie.petera, INRAE, Clermont, métabolomique, présentiel
- jean-michel.roger, INRAE, Montpellier, chimiométrie, présentiel
- virginie.rossard, INRAE, Narbonne, chimiométrie, présentiel
- remi.servien, INRAE, Narbonne, métabolomique & chimiométrie, absent
Avec l'aide de Christophe Lebegue de la formation permanente de Montpellier.
Prochaines dates
Mercredi 30 novembre 2022 - 09h-12h (en visio) : pratiques de covsel (Jean-MIchel ROGER)
Mercredi 30 novembre 9h00-11h00
Utilisation des méthodes basées sur Covsel sur des jeux de données métabolomiques :La conférence a été enregistrée et est disponible sur la chaîne Youtube ChemHouse
Les documents présentés :
CAC2018_Halifax.pdf (4.3MB) Traitement_des_donnees_SACURINE.pdf (0.6MB) Traitement_des_donnees_PESTICIDES.pdf (0.5MB)
Chemomics 4 ?
On conserve des sessions avec questions/réponses.
On a bien maintenant tous les outils mais il manque un guide à suivre sur un exemple concret de traitement des données.
C'est difficile de suivre les exposés sur l'infra-rouge lorsque l'on connaît la spectro de masse : les méthodes de normalisation sont très différentes. Il manque peut-être une description du contexte et des contraintes.
Une proposition serait de traiter entièrement un exemple de problème multi-blocs avec de la spectrométrie infrarouge et de la spectrométrie de masse, ou un problème d'omics. Une réunion préparatoire sera programmée pour le choix de cet exemple.
Take home message : il faut bien connaître ses données et les explorer largement.
Photos

