%% Testo % 1) Caricare i dati presenti nel file di Excel conadR.xlsx sia con la % funzione xlsread sia tramite readtable. Controllare che i dati numerici % contenuti dentro il file di Excel vengano caricati nello stesso modo % nelle due implementazioni. % Costruire la matrice dei diagrammi di dispersione delle 4 variabili in % esame prima utilizzando la funzione gplotmatrix e poi la funzione spmplot % di FSDA toolbox. Inserire i boxplot lungo la diagonale principale nella % matrice dei diagrammi di dispersione. Commentare la scatter plot matrix. % % 2) Calcolare e commentare la matrice di correlazione ed i relativi pvalue % del test $H_0 :\rho =0$. Mostrare la matrice di correlazione e la matrice % dei p-values in formato table. % % 3) Calcolare manualmente la matrice dei p-values. % Interpretare il p-value tra le variabili "visite" ed "età". % % 4) In un campione bivariato di 12 pezzi da un processo produttivo il % coefficiente di correlazione è risultato pari a 0.54. % Verificare che il p-value teorico del test (nell'ipotesi di ipotesi % alternativa bilateale) è pari a 0.0699. % Se invece di un solo campione di 12 pezzi noi disponessimo di 100000 % campioni di 12 pezzi, se è vera l'ipotesi nulla di assenza di % correlazione tra le due variabili su quanti campioni ci aspettiamo di un % ottenere un valore del coefficiente di correlazione superiore a 0.54 in % modulo? % % 5) Verificare empiricamente la distribuzione T di student con n-2 gradi % di libertà del test sul coefficiente di correlazione lineare % confrontando i quantili empirici e quelli teorici. Utilizzare 100000 % simulazioni ed un valore di n a piacere. % % Utilizzare i quantili che seguono. % % quant=[0.01 0.05 0.10:0.1:0.9 0.95 0.99 0.999]; % % Costruire un grafico a dispersione che contiene sull'asse delle ascisse i % quantili empirici e sull'asse delle ordinate i quantili teorici. % % 6) Nel caso di n=12 sulle 100000 repliche % quanti sono le volte in cui il coefficiente di correlazione risulta % superiore a 0.54? Confrontare la frequenza relativa empirica del numero % di volte in cui |r|>0.54 con il p-value teorico calcolato al punto 4) % % 7) Rappresentare graficamente la soglia oltre il quale il valore di rxy è % ritenuto significativo al livello del 5% in funzione della numerosità % campionaria