Formule per R


Gentilmente Fornito & © by Marco S.

Nota: anche se i dati sono contenuti in un dataframe cosituito da un solo vettore, utilizzare il nome della colonna. Se non è stato impostato un nome specifico, il nome del vettore è V1.

Intervallo di confidenza per la media, nota la varianza

mean(dati) + c(qnorm(a/2), -qnorm(a/2))*sqrt(varianza/length(dati))

dove dati indica il vettore che contiene i dati, a è il livello di significatività prefissato, e la varianza è nota.

Intervallo di confidenza per la media

mean(dati) + c(qt(a/2, (length(dati) - 1)), -qt(a/2, (length(dati) - 1)))*sqrt(var(dati)/length(dati))

dove dati indica il vettore che contiene i dati e a è il livello di significatività prefissato.

Intervallo di confidenza per la varianza

(length(dati) - 1)*var(dati)/c(qchisq(1 - a/2, (length(dati) - 1)), qchisq(a/2, (length(dati) - 1)))

dove dati indica il vettore che contiene i dati e a è il livello di significatività prefissato.

Valore della statistica test per la media: normale

(mean(dati) - ipotesi)/sqrt(varianza/length(dati))

dove dati indica il vettore che contiene i dati, ipotesi è il valore che ho ipotizzato, e la varianza è nota.

Valore della statistica test per la media: t di Student

(mean(dati) - ipotesi)/sqrt(var(dati)/length(dati))

dove dati indica il vettore che contiene i dati, ipotesi è il valore che ho ipotizzato.

Livello di significatività: normale

2*pnorm(abs(test), lower.tail = FALSE)

dove test è il valore della statistica test.

Livello di significatività: t di Student

2*pt(abs(test), length(dati) - 1, lower.tail = FALSE)

dove test è il valore della statistica test e dati indica il vettore che contiene i dati.

Espressione t.test

library(ctest)
t.test(dati, mu = ipotesi, alternative = alternativa, conf.level = 1-a)

dove dati indica il vettore che contiene i dati, ipotesi è il valore che ho ipotizzato, 1-a è il livello di confidenza, e alternativa può essere scelta tra greater, less, two.sided.

Confronto tra più popolazioni

library(ctest)
oneway.test(dati~gruppi, var.equal = varianza)

dove dati indica il vettore che contiene i dati, gruppi è l'attributo che indica a quale gruppo appartiene ogni dato e varianza indica se tutti i gruppi hanno la stessa varianza (TRUE) o no (FALSE).

library(ctest)
t.test(gruppo1, gruppo2, alternative = alternativa, var.equal = varianza)

dove gruppo1 e gruppo2 sono i gruppi di dati, varianza indica se tutti i gruppi hanno la stessa varianza (TRUE) o no (FALSE) e alternativa può essere scelta tra greater, less, two.sided.
La differenza è che t.test regge al massimo due gruppi, mentre oneway.test non presenta problemi in questo senso.