Vai al contenuto principale
Oggetto:

Simulazione e coding per la statistica

Oggetto:

Simulation and coding for Statistics

Oggetto:

Anno accademico 2023/2024

Codice attività didattica
ECM0324
Docenti
Andrea Scagni (Titolare del corso)
Luigi Di Caro (Titolare del corso)
Corso di studio
Laurea magistrale in Metodi statistici ed economici per le decisioni - a Torino [0402M21]
Anno
1° anno
Periodo
Annualità singola (A1)
Tipologia
Caratterizzante, Affine o integrativo
Crediti/Valenza
12
SSD attività didattica
INF/01 - informatica
SECS-S/01 - statistica
Erogazione
Tradizionale
Lingua
Italiano
Frequenza
Fortemente consigliata/Recommended
Tipologia esame
Prova pratica
Prerequisiti

MODULO DI SIMULAZIONE
Conoscenze di medio livello di inferenza statistica e calcolo delle probabilità


SIMULATION MODULE
Intermediate level knowledge of statistical inference and probability
Propedeutico a
Oggetto:

Sommario insegnamento

Oggetto:

Obiettivi formativi

MODULO DI SIMULAZIONE

Il corso si pone obiettivi di formazione delle competenze, legati dal riferimento all'impiego di strumenti informatici in ambito statistico, relativi alle procedure di simulazione come strumento per la verifica empirica delle proprietà delle variabili aleatorie e delle procedure di inferenza statistica, nonché come strumenti per l'approssimazione del loro comportamento quando non sono disponibili al ricercatore risultati analitici.

Funzioni in un contesto professionale e sbocchi occupazionali: l'insegnamento è di natura metodologica ed è propedeutico agli insegnamenti successivi. Esso quindi non configura direttamente specifiche funzioni professionali, ma fornisce strumenti che permettono di affrontare in modo flessibile e innovativo i più complessi problemi analitici dei casi trattati nei centri studi pubblici, di banche e grandi aziende.

MODULO DI CODING

L’insegnamento ha come obiettivi formativi principali l'acquisizione delle competenze necessarie nell’ambito della Data Science e dell'Analisi dei Dati. In particolare, l’insegnamento si propone di fornire una solida base di conoscenze sui fondamenti della Data Science, comprese le tecniche di esplorazione e comunicazione dei risultati. Inoltre, l’insegnamento mira a fornire una formazione avanzata sul coding con R, inclusi i fondamenti di programmazione e l'utilizzo dei pacchetti R per l'analisi dei dati. Al termine del corso, gli studenti e le studentesse dovrebbero essere in grado di applicare queste competenze in progetti di data science reali e di contribuire in modo significativo allo sviluppo di soluzioni di data science in diversi settori.

SIMULATION MODULE

The course aims at the acquisition of skills linked to the use of computing tools in the field of statistics, to correctly use simulation methods as a tool for empirical evaluation of the properties of random variables and procedures of statistical inference.

Functions in a professional context and career opportunities: the course is of a methodological nature and is preparatory to further studies. Therefore, it does not directly configure specific professional functions, but provides tools that allow the more complex analytical problems of the cases dealt with in public study centers, banks and large companies to be faced in a flexible and innovative way.

CODING MODULE

The main educational objectives of this teaching are the acquisition of the necessary skills in the field of Data Science and Data Analysis. In particular, the course aims to provide a solid knowledge base on the fundamentals of Data Science, including techniques for exploring and communicating results. Additionally, the teaching aims to provide advanced training on coding with R, including programming fundamentals and the use of R packages for data analysis. At the end of the course, students should be able to apply these skills in real data science projects and make significant contributions to the development of data science solutions in various sectors.

Oggetto:

Risultati dell'apprendimento attesi

MODULO DI SIMULAZIONE

Conoscenza e capacità di comprensione: acquisizione dei concetti di casualità, di casualità simulata e della logica degli algoritmi di simulazione su computer

Conoscenza e capacità di comprensione applicate: capacità di implementare e svolgere su personal computer procedure di simulazione di esperimenti casuali, di valutazione empirica del comportamento di statistiche campionarie mediante simulazione approssimata dello spazio campionario, di definizione e studio della verosimiglianza, nonchè dell'uso di semplici metodi di ricampionamento

Autonomia di giudizio: il corso permette di comprendere come lo studio di simulazione fornisca strumenti critici per la valutazione ed eventuale validazione empirica di metodi di inferenza statistica le cui proprietà risultano difficili o impossibili da individuare analiticamente.

Abilità comunicative: sollecitate attraverso il dialogo a lezione.

Capacità di apprendere: studenti e studentesse saranno in grado di comprendere tanto situazioni concrete quanto contributi tecnici e scientifici sul tema.

MODULO DI CODING

Si prevede l'apprendimento della terminologia scientifica e la capacità di comprensione degli aspetti teorici ed applicativi relativi alla Data Science, all’utilizzo di R per la manipolazione e analisi dei dati.
Gli studenti e le studentesse dovranno essere in grado di applicare i metodi e gli strumenti acquisiti per aggiornare ed approfondire i contenuti studiati, anche in contesti professionali, e per intraprendere studi successivi.

SIMULATION MODULE

Knowledge and ability to understand: acquisition of the concepts of randomness, simulated randomness and the logic of computer simulation algorithms

Applied knowledge and ability to understand: ability to implement and carry out on personal computers simulation procedures of random experiments, empirical evaluation of the behavior of sample statistics through approximate simulation of the sample space, definition and study of the likelihood, as well as the use of simple resampling methods

Autonomy of judgment: the course allows to understand how simulation studies provides critical tools for the evaluation and possible empirical validation of statistical inference methods whose properties are difficult or impossible to identify analytically.

Communication skills: solicited through dialogue in class.

Ability to learn: students will be able to understand both concrete situations and technical and scientific contributions on the topic.

CODING MODULE

The course aims to develop students' understanding of scientific terminology and theoretical and practical aspects related to Data Science, the use of R for data manipulation and analysis. Students will be expected to apply the methods and tools they acquire to update and deepen their knowledge, even in professional contexts, and to undertake further studies.

Oggetto:

Programma

MODULO DI SIMULAZIONE

Il concetto di aleatorietà, numeri casuali e pseudo-casuali. Algoritimi di generazione di numeri pseudo casuali: evoluzione ed esempi, test di casualità. Simulazione di estrazioni da distribuzioni arbitrarie, discrete e continue. Verifica empirica dei principali teoremi del calcolo delle probabilità. L'approssimazione simulata dello spazio campionario: studio empirico delle proprietà delle statistiche campionarie. Procedure di verifica di ipotesi: analisi della significatività e potenza di un test tramite simulazione. La simulazione su modelli di regressione. Introduzione ai metodi di ricampionamento; jacknife e bootstrap. Esempi e casi particolari.

MODULO DI CODING

- Recap sul linguaggio di programmazione R e al suo ambiente di sviluppo RStudio
- Fondamenti di programmazione con R: import/export, variabili, funzioni, cicli e condizioni
- Utilizzo dei pacchetti R per la visualizzazione e l'analisi dei dati, tra cui ggplot2, dplyr e tidyverse
- Rmarkdown per la produzione di report di analisi dei dati
- Applicazione su esempi ed esercitazioni anche relative a metodi di simulazione per la statistica

SIMULATION MODULE

The concept of randomness, random numbers and pseudo-random numbers. Algorithms for generating pseudo-random numbers: evolution and examples, tests of randomness. Simulation of extractions from arbitrary discrete and continuous distributions,. Empirical test of the main theorems of probability theory. The simulated approximation of a sample space: an empirical study of the properties of the sample statistics. Hypothesis testing procedures: analysis of the significance and power of a test through simulation. Simulation in linear regression models. Introduction to resampling methods; jacknife and bootstrap. Examples and special cases.

CODING MODULE

- Recap on the R programming language and its development environment RStudio
- Fundamentals of programming with R: import/export, variables, functions, loops, and conditions
- Use of R packages for data visualization and analysis, including ggplot2, dplyr, and tidyverse
- Rmarkdown for producing data analysis reports
- Application to examples and exercises including simulation methods for statistics

Oggetto:

Modalità di insegnamento

MODULO DI SIMULAZIONE

L'intero corso si svolgerà in modo interattivo e in presenza, attraverso lavoro costante in laboratorio in cui i concetti introdotti verranno valutati e poi applicati e verificati in esempi concreti di simulazione e utilizzo di algoritmi.

MODULO DI CODING

L’insegnamento è strutturato in 36 ore di didattica (6 CFU), suddivise in lezioni da 2 ore in base al calendario accademico. La didattica si costituisce di lezioni teoriche e pratiche ed è erogata in presenza. I materiali dell’insegnamento saranno fruibili sulla pagina Moodle dell'insegnamento.

SIMULATION MODULE

The whole course will involve practical laboratory activities. Concepts will be introduced, discussed, applied and tested through simulation and algorithmic work.

CODING MODULE

"The course is structured in 36 hours of teaching (6 CFU), divided into 2-hour lessons according to the academic calendar. The teaching consists of theoretical and practical lessons and is delivered in person. The course materials will be available on the Moodle page of the course.

Oggetto:

Modalità di verifica dell'apprendimento

MODULO DI SIMULAZIONE

La verifica dell'apprendimento verrà svolta con una prova pratica al Computer, nella quale si sarà chiamati a progettare, produrre e utilizzare dati statistici simulati a fini di inferenza statistica e calcolo delle probabilità. Gli esami si svolgeranno in aula informatica.

MODULO DI CODING

L'apprendimento verrà valutato attraverso un esame scritto. La prova scritta, della durata di 45 minuti, propone esercizi semi-strutturati volti a verificare il grado di acquisizione dei concetti e delle metodologie di progettazione e realizzazione di soluzioni per problemi di Data Science, usando costrutti del linguaggio R. Il punteggio della valutazione finale è espresso con un numero compreso tra 1 e 30 e lode (dove 18 è il valore minimo per considerare l'esame come superato).

SIMULATION MODULE

The exam, as well as the course, will take place on a personal computer, where the student will be asked to plan, produce and analyse simulated statstical data in probabilistic and inference practical contexts. The exams will take place in a computer equipped classroom.

CODING MODULE

Learning will be evaluated through a written exam. The written test, lasting 45 minutes, consists of semi-structured exercises aimed at verifying the degree of acquisition of concepts and methodologies for designing and implementing solutions for Data Science problems, using constructs of the R language. The final score is expressed as a number between 1 and 30 cum laude (where 18 is the minimum value to consider the exam passed).

Oggetto:

Attività di supporto

MODULO DI CODING

Esercitazione di autovalutazione in corso di apprendimento saranno somministrate attraverso la piattaforma Moodle.

CODING MODULE

Self-assessment exercises during the learning process will be administered through the Moodle platform.

Testi consigliati e bibliografia

Oggetto:

MODULO DI SIMULAZIONE: Il materiale didattico consisterà principalmente nei video multimediali delle lezioni svolte in aula, disponibili per il download agli studenti e alle studentesse nella pagina Moodle del modulo.



Oggetto:

Note

Gli/le studenti/esse con DSA o disabilità, sono pregati/e di prendere visione delle modalità di supporto (https://www.unito.it/servizi/lo-studio/studenti-con-disabilita) e di accoglienza (https://www.unito.it/accoglienza-studenti-con-disabilita-e-dsa) di Ateneo, e in particolare delle procedure necessarie per il supporto in sede d’esame (https://www.unito.it/servizi/lo-studio/studenti-con-disabilita/supporto-
agli-studenti-con-disabilita-sostenere-gli-esami).

Oggetto:

Moduli didattici

Oggetto:
Ultimo aggiornamento: 30/10/2023 17:05
Location: https://www.didattica-est.unito.it/robots.html
Non cliccare qui!