Vai al contenuto principale
Oggetto:
Oggetto:

Modelli per dati longitudinali

Oggetto:

Longitudinal data models

Oggetto:

Anno accademico 2023/2024

Codice attività didattica
SCP0082
Docente
Dalit Contini (Titolare del corso)
Corso di studio
Laurea magistrale in Metodi statistici ed economici per le decisioni - a Torino [0402M21]
Anno
2° anno
Periodo
Primo semestre
Tipologia
Affine o integrativo
Crediti/Valenza
6
SSD attività didattica
SECS-S/05 - statistica sociale
Erogazione
Tradizionale
Lingua
Italiano
Frequenza
Fortemente consigliata/Recommended
Tipologia esame
Scritto
Prerequisiti

Per la frequenza, studenti e studentesse dovrebbero possedere conoscenze di livello intermedio di statistica inferenziale e di econometria.
Per sostenere l'esame, è necessario aver superato gli esami del primo anno: matematica, probabilità e inferenza statistica ed econometria.


Students should have good knowledge of the contents of intermediate level courses on inferential statistics and econometrics.
Mathematics, Probability and Inferential Statistics and Econometrics are propaepedutic courses.
Propedeutico a
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

In questo insegnamento si imparano i fondamenti metodologici e gli aspetti applicativi più rilevanti dei modelli per dati di durata (anche detti modelli di sopravvivenza) e dei modelli per dati panel.

I dati longitudinali sono informazioni che si riferiscono ad un insieme di individui, famiglie, imprese… che vengono seguiti nel corso del tempo e per i quali si dispone di più informazioni ripetute.

-> I dati longitudinali relativi a variabili qualitative consentono di tracciare “le storie” degli individui rispetto a uno o più aspetti, e quindi di studiare i cambiamenti di stato e la durata di permanenza in un certa condizione.
Esempi: individui
i) la durata della condizione di disoccupazione (prima di un passaggio allo stato di occupato)
ii) il tempo intercorso tra formazione della coppie  e primo figlio   
iii) la durata di una malattia (prima della guarigione o del decesso)
Esempi: aziende
i) la durata dell'attività dell'azienda (prima della cessazione)
Esempi: prodotti
i) la durata di vita di un prodotto (prima del guasto)

-> I dati longitudinali di tipo quantitativo, spesso indicati come dati panel, costituiscono la base informativa per studiare fenomeni di varia natura in un’ottica dinamica e consentono spesso di risolvere in modo robusto problemi di endogeneità e problemi di variabili omesse.

Qual è la differenza tra modelli di analisi delle serie storiche (time series analysis) e i modelli per dati longitudinali?
La differenza principale è che le analisi delle serie storiche si riferiscono tipicamente a una singola entità (es: il fatturato di una azienda, il numero di clienti, indicatori economici a livello di paese...), mentre i dati longitudinali si riferiscono a dati di molti individui (micro) seguiti nel corso del tempo. Obiettivo dell'analisi delle serie storiche è la previsione, mentre le analisi di dati longitudinali generalmente hanno l'obiettivo di "spiegare" la variabilità della variabile dipendente di interesse in un contesto dinamico, e talvolta di individuare effetti causali.

Funzioni in un contesto professionale e sbocchi occupazionali
Il corso consente di acquisire competenze fondamentali per analizzare dati di durata e dei dati panel in tutti i contesti professionali: centri di ricerca epidemiologica, demografica, sociale ed economica, nonché nelle assicurazioni e nelle aziende dove si effettua il controllo statistico della qualità dei prodotti. 

In this course students learn the methodologic foundations and the main practical issues of longitudinal data models: duration models (also called survival models) and panel data models in a variety of different contexts.

Longitudinal data provide repeated information over time on a set of individuals, households, firms...                   

-> Longitudinal data relative to qualitative variables allow to trace individual careers on one
or more domains, and study transitions between states and the duration of episodes:
Examples: individuals
i) the duration in the state of unemployment (before a transition to the employment state)  
ii) time elapsed between the union formation and first child
iii) the duration in an illness condition (before recovery or death)
Examples: firms
i) the duration of the firms' activity (before cessation of activity)
Examples: products
i) the duration of the product's operation (before failure)

-> Quantitative longitudinal data, often referred as panel data, are necessary to study different phenomena in a dynamic perspective. Moreover, thay are used to solve endogeneity problems and omitted variable issues. 

What is the difference between time series analysis and longitudinal data analysis?
The key difference between time series and longitudinal data is that time series focuses on a single entity (typically firms' sales, the number of custumers, country level economic indicators...) at multiple time intervals, while longitudinal data focuses on multiple individuals at multiple time intervals. The goal of time series analysis is forecasting, while usually the goal of longitudinal data analysis is to explain variability in the dependent variable in a dynamic context, and sometimes to identify causal effects. 

Functions in a professional context and employment opportunities:
Students will acquire the fundamental competencies to analyse duration and panel data in all professional contexts (epidemiologic, demographic, social and economic research centers, insurance companies, firms carrying out statistical quality control of products). 


Oggetto:

Risultati dell'apprendimento attesi


Lo studente dovrà possedere una buona conoscenza degli argomenti trattati ed essere in grado di utilizzare consapevolmente gli strumenti acquisiti. In particolare, dovrà dimostrare di padroneggiare i fondamenti logici dei modelli per dati di durata (anche detti modelli di sopravvivenza), dei metodi di stima parametrici e semi-parametrici, dell’inclusioni di covariate che variano nel tempo, dei modelli con destinazioni multiple. Dovrà inoltre essere in grado di scrivere la verosimiglianza completa e parziale in svariati casi applicativi, per modelli in tempo continuo e discreto. Dovrà aver compreso i fondamenti logici dei modelli (statici) per dati panel quantitativi e binari, con particolare rifermento ai modelli a effetti fissi e random, e dei relativi stimatori. Lo studente dovrà inoltre aver acquisito la capacità di interpretare i risultati delle stime dei modelli trattati e di comunicarli efficacemente a un pubblico esperto e non esperto.



We expect students to acquire good knowledge of the topics covered in the course. Students should be aware of the rationale of duration models, parametric and semi-parametric estimation methods, of the inclusion of time-varying covariates, and multiple destination models. Students should be able to write full and partial likelihood functions in many applied contexts, for continuous and discrete time models. They should understand the rationale of static panel data models for quantitative and binary data, and of the fixed and random model estimators. Students should also have to competence to interpret the basic output of standard statistical packages and to communicate the results to an expert and non-expert audience.


Oggetto:

Programma

1) Modelli di sopravvivenza: 
Metodi parametrici e non-parametrici. 
Modello semi-parametrico di Cox e piecewise constant. 
Covariate variabili nel tempo.
Modello a rischi competitivi.
Modelli di durata per tempo discreto.

2) Modelli statici per l'analisi di dati panel  
Effetti fissi e effetti random e relativi stimatori
Modelli per dati panel binari

Non ci sono differenze di programma tra frequentanti e non frequentanti.

 

1) Survival analysis: 
Parametric and non-parametric methods 
Cox and piecewise constant models.
Time varying covariates.
Competiting risks model.
Duration models for discrete time data.

2) Static models for panel data  
Fixed and random effects
Panel data models for binary data

There are no differences in the course syllabus between students attending and not attending the lessons.



Oggetto:

Modalità di insegnamento


Lezioni in presenza, esercitazioni in aula, esercitazioni in aula informatica con dati reali e simulati. Utilizzo del software STATA. Saranno resi disponibili alcuni codici in R

 


Lectures, exercise sessions and lab sessions on real and simulated data. We will use software STATA, but some R codes will be available as well.


Oggetto:

Modalità di verifica dell'apprendimento

Verifica scritta al termine dell'insegnamento con 3 esercizi semi-strutturati, comprendenti quesiti di carattere teorico, definizione della funzione di verosimiglianza in uno specifico contesto applicativo, interpretazione di risultati di analisi svolte. La parte di interpretazione dei risultati delle analisi avrà un peso sulla valutazione finale pari a circa il 60%, mentre gli aspetti teorico-metodologici pari a circa il 40%.

Gli studenti frequentanti che presenteranno una relazione assegnata a fine corso, valuata in modo soddisfacente ed entro le scadenze indicate avranno diritto a 1 punto aggiuntivo.

Non ci sono ulteriori differenze tra frequentanti e non frequentanti.

 


Written test at the end of the course with three semi-structured exercises.
Students will be asked questions on  the theoretical background, the  likelihood function for specific models and data, the intepretation of the results of statistical analyses. The evaluation of the examination will be approximately as follows: 60% interpretation of the results; 40% theoretical and methodological issues.

The students attending the lessons and perparing a presentation assignet towrds the end pf the course in a satisfactory way and within the deadline, will be assigned 1 additional point to the written exam.

There are no further differences in the examination between students attending and not attending the lessons.

 

Oggetto:

Attività di supporto

Testi consigliati e bibliografia

Oggetto:

Box-Steffensmeier, Jones "Event history modeling. A guide for social scientists", Cambridge University Press (ordinabile su Amazon)

Jenkins "Survival analysis", pdf scaricabile da 
https://docplayer.net/33839993-Survival-analysis-stephen-p-jenkins.html

Materiali preparati dalla docente (disponibili online)

Box-Steffensmeier, Jones "Event history modeling. A guide for social scientists", Cambridge University Press 

Jenkins "Survival analysis", downloadable pdf on
https://docplayer.net/33839993-Survival-analysis-stephen-p-jenkins.html

Materials prepared by the teacher (available online)



Oggetto:

Note

L’erogazione dell’insegnamento è in presenza, per un totale di 36  ore di didattica frontale. 

Le lezioni si terranno a partire dal 18 settembre 2023 il lunedì, martedì, mercoledì ore 12-14 in presenza (Aula B3, Campus Luigi Einaudi - Lungo Dora Siena 100).

 

STUDENTI DSA

Gli studenti DSA o con disabilità sono invitati a contattare tempestivamente l'ufficio "Studenti con disabilità" ufficio.disabili@unito.it per essere appropriatamente presi in carico. Successivamente sono invitata a contattare i docenti, mettendo sempre il cc nelle comunicazioni l'ufficio "Studenti con disabilità". 

Per la tutela della privacy, si invitano gli studenti DSA e con disabilità a NON inviare per nessun motivo ai docenti i certificati medici attestanti la disabilità. 

Gli studenti DSA e con disabilità possono fare richiesta per sostenere gli esami con il supporto degli strumenti compensativi e/o delle misure dispensative consultando la seguente pagina Studenti DSA e con disabilità e compilando il Modulo. 

Le richieste di strumenti compensativi e/o delle misure dispensative per l'esame devono pervenire ai docenti non oltre 30 giorni dalla data dell'appello.

 

Oggetto:

Altre informazioni

http://www.didattica-est.unito.it/do/home.pl/View?doc=home_appelli.html
Registrazione
  • Aperta
    Oggetto:
    Ultimo aggiornamento: 27/09/2023 14:22
    Non cliccare qui!