Réunion Chemhouse 11/09/2018 14h, ITAP : PARAFAC


Présents : Virginie R., Jean-Michel R., Jean-Claude B., Alexandre M., Matthieu Lesnoff

PARAFAC (PARAllel FACtor analysis) for multi-way arrays
de rasmus Bro 1997 : https://www.cs.cmu.edu/~pmuthuku/mlsp_page/lectures/Parafac.pdf
https://www.youtube.com/watch?v=vyjUotbPfHY

Combinaison de signatures pures, de composés chimiques purs ; cadre de la loi Beer Lamber
De la matrice X parafac trouve une base commune.
Avec Parafac pas d'ambiguite rotationel pas comme avec l'ACP
Loadings d'une ACP est basé sur la variance donc non spectres chimiques en relatif interprétable.
N'importe quelle méthode de démélange comme ACP
PARAFAC déconvulution linéaire
Paramètre de Parafac (ressemble à MCR, multivariate curve resolution, acp avec respect de plusieurs contraintes ; si tu mets la contrainte loadings ortogonaux donc égale à l'ACP)
Le champ d' options init est utilisé pour définir la façon dont est obtenue l'estimation initiale des chargements. Si entrée facultative initval est entrée alors options.init n'est pas utilisé. Les choix suivants pour init sont disponibles.
En général, options.init = 0, pour des données bien comportées, alors que options.init = 10 conviendra aux modèles difficiles. Les modèles difficiles sont généralement ceux qui comportent de nombreux composants, avec des chargements très corrélés, ou des modèles présentant des indications de présence de minimums locaux.
  • init = 0, PARAFAC choisit l'initialisation {default},
  • init = 1, utilise TLD (sauf s'il y a des valeurs manquantes, alors aléatoire est utilisé),
  • init = 2, basé sur la décomposition en valeurs singulières (bonne alternative à 1),
  • init = 3, basé sur l'orthogonalisation des valeurs aléatoires (bon pour vérifier les minima locaux),
  • init = 4, basé sur un modèle PARAFAC approximatif (ajusté séquentiellement),
  • init = 5, basé sur la compression qui peut être utile pour les données volumineuses et
  • init > 5, basé sur le meilleur ajustement de nombreuses petites exécutions (la valeur options.init).

Sorties de parafac :
  • F1 T : tableau des scores
  • F2 P et F3 Q : loadings exitation et émission
  • charges : tableau de cellules 1 par K avec des chargements de modèles pour chaque mode / dimension,
  • pred : tableau de cellules avec des prédictions de modèle pour chaque bloc de données d'entrée,
  • tsqs : tableau de cellules avec des valeurs T 2 pour chaque mode,
  • ssqresiduals : tableau de cellules avec la somme des carrés des résidus pour chaque mode,
  • description : tableau de cellules avec description textuelle du modèle, et
  • detail : sous-structure avec détails et résultats supplémentaires du modèle.

Test sur données de mélange amino-acide : http://www.models.life.ku.dk/amino_acid_fluo
sciilab surf()

acp 3d : afm Analyse Factorielle Multiple brigitte escofier et jérome pages de Rennes : http://www.numdam.org/article/RSA_1983__31_2_43_0.pdf
Ce livre prolonge les travaux réalisés par Brigitte Escofier et Jérôme Pagès. On y trouvera toute la théorie de l’AFM, de nombreux exemples et la mise en œuvre à l’aide du package R Factominer

loadings : signal commun à tous les individus qui explique la variance ; allure d'un spectre mais en relatif et n'explique pas que la chimie.

Parafac tourne en galaxy sous le PC de Jean-Claude (localhost:8080).

nway pls : scores loadings loadings : https://perso.univ-rennes1.fr/laurent.albera/alberasiteweb/pdf/gdrisis13hanafi.pdf
Autres pls : so-pls, nb-pls (multi-bloc par la pls), parallèle pls

13 substrats * 19 humidité pourcentage d'eau différents et 3751 longueurs d'onde ; traiter de façon symétrique
scores = expériences = individus = 1 mesure = 1 réalité =13
variables qui décrivent l'expérience : 3751 * 19
PARAFAC sous python tensorly
factors (scores T, loadings1 P, loadings2 Q)
objectif : comprendre comment le spectre se modifie avec l'humidité ; comment évolue les loadings.
Parafac loadings longueur d'onde : spectre de l'eau
parafac loadings matière seche DM : jusqu'a 90% droite puis après ca bouge

comdim (https://www.sciencedirect.com/science/article/pii/S0950329317300526)