El conjunt de dades de flors Iris, també conegut com a conjunt de dades de Fisher és un conjunt de dades multivariant introduït per Ronald Fisher en un article seu de 1936, The use of multiple measurements in taxonomic problems (L'ús de mesures múltiples en problemes taxonòmics) com un exemple d'anàlisi discriminant lineal.[1] També se l'ha conegut com a conjunt de dades d'Anderson perquè Edgar Anderson va col·leccionar les dades per quantificar la variació morfològica de les flors de tres espècies Iris relacionades.[2] Dos de les tres espècies es van recollir a la Península de Gaspé: «totes són de la mateixa pastura, i recol·lectades el mateix dia i mesurades al mateix temps per la mateixa persona amb el mateix aparell».[3]
El conjunt de dades conté 50 mostres de cadascuna de les tres espècies d'Iris (Iris setosa, Iris virginica i Iris versicolor). Es van mesurar quatre característiques de cada mostra: el llarg i l'ample del sèpal i del pètal, en centímetres. A partir de la combinació d'aquests quatre trets, Fisher va desenvolupar un model discriminant lineal per distingir entre una espècie de l'altra.