%% ESERCIZIO I % Generare 100 osservazioni da una distribuzione normale trivariata con % vettore delle medie uguale a zero e matrice di covarianze (Sigma) % riportata di seguito % 1.00 0.87 0.92 % 0.87 1.00 0.90 % 0.92 0.90 1.00 % Per replicabilità dei risultati utilizzare rng(11). % Applicare a questa matrice l'analisi in componenti principali partendo % dalla matrice degli scostamenti dalla media Xtilde. % Motivare come mai in questo esempio non si parte dalla matrice degli % scostamenti standardizzati. % Mostrare la tabella della varianza spiegata (relativa e cumulate) dalle % diverse componenti principali. Discutere % 1) il numero di PC ottimo; % 2) l'interpretazione della prima PC nel caso in cui le tre variabili % originarie fossero state collegate a tre test di intelligenza; % 3) gli angoli tra le frecce nel biplot % % Calcolare la matrice di covarianze in maniera matriciale. % Denominare questa matrice S % Estrarre dalla matrice S gli autovalori (ordinati in senso non % decrescente) i rispettivi autovettori e i corrispondenti valori singolari. % Verificare che il primo valore singolare sia uguale a quello ottenuto % utilizzando la funzione pcaFS. % Inserire i valori singolari della matrice S in un vettore colonna di % lunghezza 3 denominato gamma. % % Calcolare la matrice che rappresenta la miglior rappresentazione di rango % 1 della matrice originaria in termini di scostamenti dalla media. % Denominare questa matrice Xhat. % Verificare tramite assert che la matrice Xhat abbia rango 1. % Qual è la sommma dei quadrati delle differenze tra la matrice Xtilde e la % matrice Xhat? % Calcolare la somma dei quadrati degli scostamenti in due modi diversi e % verificare che entrambi i modi producono gli stessi risultati. % % Chiudere tutte le finestre grafiche Costruire il diagramma di dispersione % 3D tra le 3 variabili originarie in termini di scostamenti dalla media. % Aggiungere a questo diagramma di dispersione la linea (retta) di massima % variabilità (linea associata alla prima componente principale). % Aggiungere al grafico 3D le etichette degli assi ed impostare l'opzione % di uguale scala tra i diversi assi cartesiani. % % Creare una nuova figura con le informazioni della figura precedente e % l'aggiunta delle proiezioni ortogonali lunga la retta principale % % Qual è la lughezza della proiezione ortogonale dell'unità 5 lungo la retta % principale? Calcolare la distanza euclidea dall'origine dell'unità 5 % proiettata lungo la retta principale. % % Calcolare la lunghezza dei semiassi principali dell'ellissoide % (x-xmedio)' S^-1 (x-xmedio) =1 % % Discutere la relazione tra lo scostamento quadratico medio della prima % componente principali e la lunghezza del primo semiasse principale. % % Rappresentare i dati originali tramite coordinate parallele utilizzando % la funzione parallelcoords. Che tipo di rappresentazione ci si attende? % % % Applicare alla matrice dei dati originaria, il metodo delle k medie % imponendo 3 gruppi. Utilizzare un numero di repliche pari a 50. % Visualizzare l'assegnazione delle unità ai diversi gruppi tramite la % funzione spmplot. Commentare i gruppi che sono stati ottenuti. Scegliere % automaticamente il numero ottimo dei gruppi tramite la funzione % evalclusters utilizzando come criterio l'indice di Calinski e Harabasz. % Utilizzare un numero di gruppi che varia da 1 a 6. Rappresentare % graficamente l'ouptut della funzione evalclusters. % Commentare i gruppi che vengono trovati con il valore di k ottimo. % % ESERCIZIO II % Caricare la tabella di contingenza presente dentro il file car.mat di % FSDA. Questa tabella di contingenza si riferisce alle tipologia di auto % (righe) e agli attributi che le contraddistinguono (colonne). Calcolare % il p-value dell'indice Chi2 e discutere la sua relazione con l'inerzia % totale della tabella di contingenza. Che caratteristiche presentano le % auto che si trovano nel primo quadrante nel grafico di analisi delle % corrispondenze? % % Utilizzando la funzione CorAnaplot costruire il grafico di analisi delle % corrispondenze in modo tale che il colore delle etichette dei punti riga % sia proporzionale alla comunalità (quota di inerzia spiegata) di ogni punto. % Suggerimento: utilizzare l'opzione plots.ColorMapLabelRows. % Commentare il grafico ottenuto. % Discutere la differenza in termini di inerzia spiegata tra la Ferrari e % la Porsche. % Calcolare la quota esatta dell'inerzia di Ferrari e Porsche spiegata % dalle due dimensioni latenti. %% ESERCIZIO III % Creare una nuova funzione (denominata erone.m) che dati come argomenti di % input la lunghezza dei 3 lati di un triangolo, applichi la formula di % Erone per calcolare l'area del triangolo. % https://it.wikipedia.org/wiki/Formula_di_Erone. % Ad esempio la chiamata a erone(3,4,5) deve produrre come risultato 6. % Inserire un controllo che fornisca un messaggio di errore se l'utente % fornisce un numero inferiore a 3 di argomenti di input. Fare in modo che % la funzione restituisca i due modi per calcolare la formula di Erone % descritta alla pagina di wikipedia.