Salta gli elementi di navigazione
banner
logo ridotto
logo-salomone
DISIA Dipartimento di Statistica, Informatica, Applicazioni 'Giuseppe Parenti'
Home page > Ricerca > Dottorati di ricerca > Programma per l'esame di ammissione al Dottorato in Statistica

Programma per l'esame di ammissione al Dottorato in Statistica

L'esame scritto è composto da 10 domande su temi specifici del programma di statistica. Al candidato è richiesto di discuterne sinteticamente almeno 5. Il programma è riportato qui di seguito.

 

Analisi dei dati

  • Tipi di indagini statistiche
  • Unità e variabili
  • Classificazioni delle variabili
  • Diagrammi a barre e istogrammi
  • Funzione di ripartizione empirica
  • Mediana e quantili
  • Media e proprietà
  • Varianza e proprietà
  • Outlier e robustezza

 

Analisi elementare delle serie temporali

  • Misure del mutamento di una serie temporale
  • Numeri indici semplici
  • Numeri indici complessi

 

Analisi multivariata dei dati

  • Scatter e matrice di scatter
  • Covarianza, correlazione e proprietà
  • Matrice di covarianza e di correlazione e proprietà
  • Retta dei minimi quadrati
  • Dati mancanti
  • Componenti principali
  • Tavole di contingenza doppie e multiple
  • Distribuzioni condizionate
  • Indici di associazione per le tavole 2x2
  • Zeri campionari e strutturali

 

Distribuzioni di probabilità

  • Spazi di probabilità
  • Variabili aleatorie (Binomiale, Ipergeometrica, Poisson, Uniforme, Esponenziale, Normale)
  • Valore atteso e momenti dall'origine
  • Varianza e momenti centrali
  • Indici di posizione, di variabilità, di asimmetria e kurtosi
  • Disuguaglianza di Chebyshev
  • Legge dei grandi numeri
  • Teorema centrale del limite
  • Distribuzioni multivariate
  • Normale mutivariata
  • Multinomiale

 

Campionamento da popolazioni finite

  • Terminologia: unità di osservazione, popolazione obiettivo, unità di campionamento, sampling frame
  • Distorsione da selezione
  • Errori di misura
  • Errori campionari e non campionari
  • Campioni casuali
  • Campionamento casuale semplice
  • Campionamento stratificato
  • Campionamento a grappoli

 

Piano degli esperimenti

  • Terminologia del piano degli esperimenti: combinazione sperimentale, replicazione, randomizzazione, fonte di variabilità
  • Ruolo dei fattori
  • Disegno fattoriale completo
  • Concetto di interazione

 

Modelli statistici

  • Modelli parametrici e non parametrici
  • Osservazioni indipendenti e identicamente distribuite
  • Il modello normale
  • Il modello Bernoulli
  • Osservazioni indipendenti ma non identicamente distribuite
  • Il modello di analisi della varianza
  • Il modello di regressione lineare semplice

 

Metodi di stima

  • Funzione di ripartizione empirica
  • Grafici quantile-quantile
  • Metodo dei momenti
  • Metodo dei minimi quadrati
  • Metodo di massima verosimiglianza

 

Inferenza frequentista

  • Statistiche e stimatori
  • Distribuzioni campionarie nel modello normale
  • Non distorsione
  • Errore quadratico medio e sua scomposizione
  • Efficienza e precisione

 

Teoria asintotica elementare

  • Consistenza
  • Normalità asintotica
  • Proprietà asintotiche degli stimatori di massima verosimiglianza e le rapporto di verosimiglianza

 

Intervalli di confidenza

  • Intervalli di stima e probabilità di copertura
  • Metodo della quantità pivot
  • Intervalli di verosimiglianza

 

Inferenza Bayesiana

  • Probabilità condizionata
  • La formula di Bayes generalizzata
  • Distribuzioni a priori sui parametri
  • Distribuzione a posteriori
  • Intervalli di credibilità
  • Confronto tra intervalli di confidenza e intervalli di credibilità

 

Test delle ipotesi

  • Impostazione di Neyman-Pearson
  • Livello del test
  • Statistiche test e livello di significatività dei dati (p-value)
  • Test uniformemente più potenti
  • Test e intervalli di confidenza
  • Test chi quadro di indipendenza

 

Modelli di regressione

  • Regressione lineare multipla
  • Stimatori dei coefficienti di regressione e degli errori standard
  • Analisi della devianza
  • Previsione di un valore futuro
  • Diagnostica sui residui
  • Minimi quadrati ponderati
  • Selezione delle variabili
  • Modello di regressione logistica lineare
  • Bontà di adattamento nei modelli con dati binomiali

 

Applicazioni

  • Studi sperimentali e osservazionali
  • Studi di coorte e caso-controllo
  • Prevalenza e incidenza
  • Misure del rischio
  • Misure di effetto
  • Analisi dei dati di durata
  • Dati censurati
  • Funzione di sopravvivenza e sua stima
  • Tavole di mortalità
  • Funzione di rischio (forza di mortalità, tasso di guasto)
  • Test diagnostici
  • Sensibilità e specificità

 

Bibliografia

Baldi, P. (2007). Calcolo delle probabilità, McGraw-Hill

Chiandotto, B. (2014). Inferenza statistica. Dispense, DISIA

Cicchitelli (2015). Statistica: principi e metodi. Pearson

Conti, P. L. & Marella, A. (2012). Campionamento da popolazione finite. Milano: Springer-Verlag Italia

Di Ciaccio, A. & Borra S. (2008) Statistica - metodologie per le scienze economiche e sociali, 2/ed. McGraw-Hill

Di Fonzo, T. Lisi, F. (2005). Serie storiche economiche, Carocci

Härdle, W. & Simar A. (2007). Applied Multivariate Statistical Analysis, Berlin: Springer

Liseo, B. (2008). Introduzione alla statistica bayesiana. Dispense

Montgomery, D. C. (2005). Progettazione e analisi degli esperimenti. McGraw-Hill

Pace, L. & Salvan, A. (2001). Introduzione alla statistica-II. Inferenza, verosimiglianza, modelli. Padova: CEDAM.

Pagano, M. & Gavreau, K. (2003). Biostatistica. Idelson Gnocchi

Santini, A. (2005). Appunti di analisi demografica, Dispense, DISIA.

 

Esempio di tema d'esame

  1. Definite la mediana di una variabile aleatoria continua. Illustrate l'algoritmo per calcolare la mediana di un campione casuale.

  2. Quando si hanno delle osservazioni quantitative continue \(Y\) ottenute in \(k\) condizioni diverse corrispondenti ad altrettanti trattamenti una tecnica molto usata è l'analisi della varianza. Descrivete tale modello e le sue assunzioni.

  3. La variabilità è un concetto fondamentale in Statistica. Spiegarne il significato e introdurre alcuni indici fondamentali.

  4. Nell'analisi della regressione lineare si distinguono i coefficienti di regressione semplice o "lordi" dai coefficienti di regressione multipla detti "parziali" o "netti". Spiegate perché questa distinzione è necessaria e come cambiano le interpretazioni.

  5. Il rischio relativo e il rapporto delle quote (odds-ratio) sono misure fondamentali per valutare l'associazione tra una risposta binaria e una esposizione. Discutere le differenze e le somiglianze fra questi indici.

  6. Qual è la differenza tra schema di campionamento stratificato e schema di campionamento a grappoli?

  7. Quando si effettua un test sull'uguaglianza di due medie di due popolazioni normali è importante distinguere se si hanno campioni indipendenti o campioni appaiati. Spiegare perché e quali sono le procedure corrette da usare.

  8. Dimostrare che il coefficiente di correlazione lineare è sempre compreso tra \(-1\) e \(1\).

  9. Nello studio delle popolazioni è fondamentale la distinzione tra biografie, coorti e popolazione. Illustrate questi concetti.

  10. Supponiamo di avere un campione casuale di dimensione \(100\) da una Bernoulli di parametro \(p\) e di avere una distribuzione a priori su \(p\) uniforme. Se osserviamo \(s = 80\) successi, qual è la verosimiglianza e qual è la distribuzione a posteriori?

 
ultimo aggiornamento: 10-Lug-2015
Unifi Home Page

Inizio pagina