Analisi discriminante lineare

L'analisi discriminante lineare (ADL) o analisi discriminante normale o analisi della funzione discriminante è una generalizzazione della discriminante lineare di Fisher, un metodo usato in statistica, nel riconoscimento di pattern, nell'apprendimento automatico per trovare una combinazione lineare di caratteristiche che raggruppano o separano 2 o più classi di oggetti o eventi. La combinazione risultante può essere usata come un classificatore lineare, o più comunemente per una riduzione dimensionale prima di una classificazione statistica.

L'ADL è strettamente correlata all'analisi della varianza (ANOVA) e all'analisi della regressione che anche tentano di esprimere la variabile dipendente come una combinazione lineare di altre caratteristiche o misure[1][2]. Tuttavia l'ANOVA usa variabili indipendenti qualitative per spiegare una variabile dipendente continua, invece l'analisi del discriminante usa variabili indipendenti continue per spiegare una variabile dipendente qualitativa (per esempio: l'etichetta della classe)[3]. La regressione logistica e il modello probit sono più simili all'ADL di quanto lo sia l'ANOVA in quanto spiegano una variabile qualitativa per mezzo di variabili indipendenti continue. Questi altri metodi sono preferibili in applicazioni dove non è ragionevole assumere che le variabili indipendenti siano normalmente distribuite, che è una ipotesi fondamentale del metodo ADL.

  1. ^ R. A. Fisher, The Use of Multiple Measurements in Taxonomic Problems (PDF), in Annals of Eugenics, vol. 7, n. 2, 1936, pp. 179–188, DOI:10.1111/j.1469-1809.1936.tb02137.x.
  2. ^ G. J. McLachlan, Discriminant Analysis and Statistical Pattern Recognition, Wiley Interscience, 2004, ISBN 978-0-471-69115-0, MR 1190469.
  3. ^ Analyzing Quantitative Data: An Introduction for Social Researchers, Debra Wetcher-Hendricks, p.288