Maskinlæring.
-
Heisann Folkens.
Hvordan går dere frem når man skal teste ut maskinlærling og datasetts?
"Her er en korrelasjonsmatrise for variablene i "Vin kvalitet" datasettet. En korrelasjonsmatrise viser hvordan hver variabel er relatert til hver annen variabel. Verdier nær +1 indikerer en sterk positiv korrelasjon, verdier nær -1 indikerer en sterk negativ korrelasjon, og verdier nær 0 indikerer ingen korrelasjon".
Alkohol (alcohol): har en sterk positiv korrelasjon med kvalitet (0.48).
Sulfater (sulphates): har en moderat positiv korrelasjon med kvalitet (0.25).
Sitronsyre (citric acid): har en liten positiv korrelasjon med kvalitet (0.23).
Fast syre (fixed acidity): har en liten positiv korrelasjon med kvalitet (0.12).
Gjenværende sukker (residual sugar): har nesten ingen korrelasjon med kvalitet (0.01).
Fri svoveldioksid (free sulfur dioxide): har en liten negativ korrelasjon med kvalitet (-0.05).
pH: har en liten negativ korrelasjon med kvalitet (-0.06).
Klorider (chlorides): har en moderat negativ korrelasjon med kvalitet (-0.13).
Tetthet (density): har en moderat negativ korrelasjon med kvalitet (-0.17).
Ut i fra disse korrelasjonene, ser det ut til at 'alcohol', 'sulphates', og 'citric acid' er de mest korrelerte variablene med 'quality'. Dette betyr at disse variablene kan være de mest informative når vi skal forutsi vinkvaliteten.Er det noen andre som tester ut dette her i forumet ?
Kilder: Chatgpt med plugins.