Granger causality: guida completa all’analisi delle dipendenze temporali e oltre

La Granger causality, o Granger causality in inglese, è uno strumento fondamentale nell’analisi delle serie temporali. Non si tratta di una “causalità” nel senso filosofico o filosofico-empirico, ma di una probabilità combinata di prevedibilità: se i ritardi di una variabile X migliorano la previsione di una variabile Y rispetto a un modello che usa solo i ritardi di Y, allora si può affermare che X Granger causa Y. In questa guida esploreremo cosa significa questa idea, come si stima in pratica, quali sono i limiti da tenere presenti e come applicarla in contesti reali, dall’economia alle neuroscienze passando per la finanza.

Granger causality: definizione e intuizioni chiave

La Granger causality è una nozione di causalità operativa: non si afferma che X provochi fisicamente Y nel senso stretto, ma che l’informazione contenuta nei valori passati di X aiuta a prevedere Y nel futuro. Partendo da questo assunto, la Granger causality si traduce in test statistici che confrontano modelli di previsione con e senza i ritardi di X. Se l’aggiunta dei ritardi di X riduce notevolmente l’errore di previsione di Y, allora X è considerata Granger-causa di Y. Nel linguaggio della statistica, si verifica un’ipotesi nulla: X non Granger-causa Y. Il rifiuto dell’ipotesi nulla fornisce evidenza di una dipendenza causale in senso Granger.

È importante sottolineare una distinzione fondamentale: la Granger causality non implica causalità universale o diretta. Variabili di terze parti non osservate, confonditori o cambiamenti strutturali possono generare segnalazioni spurie. Inoltre, la relazione può essere bidirezionale: in molti sistemi, A Granger-causa B e B Granger-causa A in diversi contesti o finestre temporali.

Fondamenti matematici della Granger causality

Il fulcro della Granger causality è un modello di vettore autoregressivo (VAR). Supponiamo di avere due serie temporali X_t e Y_t misurate in intervalli costanti. Un modello VAR di ordine p (VAR(p)) esprime ciascuna variabile come funzione lineare dei propri ritardi e dei ritardi dell’altra variabile:

Y_t = a_0 + a_1 Y_{t-1} + … + a_p Y_{t-p} + b_1 X_{t-1} + … + b_p X_{t-p} + ε_t

X_t = c_0 + c_1 X_{t-1} + … + c_p X_{t-p} + d_1 Y_{t-1} + … + d_p Y_{t-p} + η_t

Se i coefficienti {b_1, …, b_p} sono significativamente diversi da zero, a livello di ipotesi nulla che X non Granger-causa Y, si ottiene evidenza di Granger causality da X a Y. Allo stesso modo, si può testare la Granger causality in senso opposto. I test si basano comunemente su un’analisi di varianza o su statistiche tipo Wald o F, a seconda della dimensione del campione e delle caratteristiche del modello.

Granger causality: condizioni essenziali per l’analisi

Per affidarsi ai test di Granger causality è necessario che alcune condizioni siano ragionevoli:

Stazionarietà delle serie o trattamento appropriato di non-stazionarietà (ad es. differenziazione o cointegrazione).
Incertezza ridotta riguardo l’ordine di ritardo p; una scelta errata può portare a falsi positivi o negativi.
Presenza di rumore bianco o processi con autocoerenza adeguata; residui ben distribuiti e senza auto-correlazione significativa.
Assenza di variabili omesse che confondono la relazione tra X e Y; se presenti, possono richiedere una Granger causality condizionale.

Queste condizioni orientano le scelte pratiche, come la differenziazione, la specifica di modelli VAR e l’interpretazione dei risultati.

Metodi di stima e test della Granger causality

La metodologia classica è basata su modelli VAR e sul test di Granger causality. Ecco i passi tipici:

Modello VAR e scelta dell’ordine

Si stimano modelli VAR(p) che includono tutte le variabili di interesse e i rispettivi ritardi fino all’ordine p. La scelta dell’ordine p è cruciale: criteri come AIC (Akaike), BIC (Bayesian Information Criterion) o HQIC (Hannan-Quinn) guidano la decisione. Un ordine troppo basso rischia di catturare solo porzioni della dinamica, mentre un ordine troppo alto può sovra-adattarsi e ridurre la potenza del test a causa della perdita di gradi di libertà.

Test di Granger causality

Una volta stimato il VAR(p), si confrontano modelli annidati per Y_t:

Modello completo che include i ritardi di X e Y.
Modello ridotto privo dei ritardi di X (cioè, X non Granger-causa Y).

La differenza di errore di previsione tra i due modelli è testata statisticamente (tipicamente F o Wald). Se la differenza è significativa, si conclude Granger causality da X verso Y. Per la Granger causality in entrambe le direzioni si eseguono test separati.

Granger causality condizionale e multivariata

In presenza di ulteriori variabili potenziali stimanti, la Granger causality può essere estesa in forma condizionale: X Granger-causa Y condizionando sull’influenza delle altre variabili Z. Questa estensione è fondamentale per evitare confonditori e per capire se la relazione tra X e Y persiste al netto di altre variabili.

Granger causality nello spettro e altre estensioni

Geweke ha introdotto la Granger causality nello spettro, ovvero una versione che esamina la relazione di causalità in diverse frequenze. In breve, è possibile quantificare quanto X Granger-causa Y a diverse scale temporali: flussi a breve periodo potrebbero mostrare una direzione diversa rispetto a quelli a lungo periodo. Questo è particolarmente utile in economia e neuroscienze, dove fenomeni ciclici e ritardi di trasmissione variano in frequenza. Negli ultimi anni si sono sviluppate estensioni non lineari della Granger causality basate su kernel o modelli non lineari, utili quando la relazione tra le variabili non è ben descritta da una regressione lineare.

Granger causality condizionale: cosa cambia con i terzi

Quando esistono variabili di controllo non osservate o osservate, la Granger causality condizionale consente di distinguere tra una relazione diretta tra X e Y e una dipendenza apparente dovuta a una variabile Z che influenza entrambe le serie. L’analisi condizionale è spesso più robusta in presenza di confondenti e migliora l’interpretazione della direzione causale. Tuttavia, richiede dati sufficientemente ricchi e una specifica accurata delle variabili di controllo per migliorare la potenza del test.

Applicazioni comuni della Granger causality

La Granger causality trova impiego in numerosi domini: economia, finanza, neuroscienze, ingegneria e scienze sociali. Ad esempio, in economia si analizza se variabili come tassi di interesse, inflazione e produzione possano causarsi a vicenda o se determinate politiche monetarie influenzino variabili reali. In finanza, la Granger causality viene usata per indagare la relazione tra prezzo di un titolo e volumi di scambio o tra indicatori macroeconomici e i mercati azionari. Nelle neuroscienze, la Granger causality è impiegata per studiare la direzione dell’influenza tra segnali EEG o fMRI, utile per mappare reti neurali e flussi di informazione. In contesti di ingegneria dei sistemi, permette di comprendere come segnali provenienti da sensori differenti si influenzano reciprocamente nel tempo.

Una guida pratica passo-passo all’implementazione di Granger causality

Di seguito proponiamo una guida pratica che può essere seguita sia da data scientist sia da ricercatori in ambito accademico. L’obiettivo è rendere la Granger causality uno strumento accessibile senza rinunciare a rigore statistico.

Preparazione dei dati: stazionarietà, differenziazione e prewhitening

Per applicare Granger causality è essenziale che le serie siano stazionarie o che si adotti una strategia adeguata per gestire non-stazionarietà. I test di unit root (ADF, PP) aiutano a valutare la necessità di differenziare le serie. La differenziazione riduce la tendenza e la stagionalità, ma può anche eliminare segnali utili se non utilizzata con giudizio. Il prewhitening è una tecnica utile quando si analizzano dipendenze tra segnali rumorosi, per rimuovere componenti auto-correlate che potrebbero distorcere i risultati del test di Granger causality.

Specifica del modello VAR e scelta del ritardo

La qualità della stima dipende dall’adeguatezza del modello VAR: includere i ritardi giusti e controllare la stabilità del sistema è cruciale. Si procede stimando VAR(p) per una gamma di p e confrontando i criteri AIC/BIC/HQIC. L’analisi delle funzioni di impulso-risposta (IRF) e delle quantità di spillover può arricchire l’interpretazione oltre al solo test di Granger causality.

Test di Granger causality: interpretazione passo-passo

Dopo l’estimazione del VAR, si eseguono i test di Granger causality in entrambe le direzioni. L’ipotesi nulla è X non Granger-causa Y. Un p-value basso indica che l’aggiunta dei ritardi di X migliora la previsione di Y. È utile riportare anche intervalli di confidenza per le statistiche e considerare l’effetto in diverse finestre temporali se si sospetta una dinamica non-stazionaria o una struttura di ritardo non costante.

Limitazioni e interpretazione critica

Nonostante la sua utilità, la Granger causality presenta limiti importanti che chi usa questo strumento deve conoscere:

Assenza di causalità intrinseca: la Granger causality è una misura di prevedibilità, non di causalità strutturale o di meccanismi fisici. Variabili non osservate possono confondere la relazione tra X e Y.
Dipendenza dal tempo e dalla finestra: la direzione di Granger causality può cambiare nel tempo. È utile eseguire analisi mobili o a finestre scorrevoli per rilevare cambiamenti dinamici.
Problemi di cointegrazione: quando le serie sono integrate ma simmetriche tra loro, la Granger causality classica può dare risultati fuorvianti. In presenza di cointegrazione è preferibile utilizzare modelli VAR con term di cointegrazione o approcci come VECM.
Qualità dei dati: rumore, missing values, decimazioni temporali non allineate possono introdurre bias significativi. Pulizia e controllo della qualità dei dati sono passi imprescindibili.

Strumenti pratici: software consigliati

Oggi esistono strumenti robusti per stimare e testare la Granger causality:

R: pacchetti come vars per VAR, urca per analisi di causality e IRF; pacchetti aggiuntivi per test di cointegrazione e grafici di relazione dinamica.
Python: la libreria statsmodels offre modelli VAR e strumenti di test; altre librerie supportano analisi in spazio di frequenza e test di Granger condizionale.
Matlab: toolbox econometrics fornisce implementazioni complete di VAR, test di Granger causality e analisi IRF.
Ambiti avanzati: strumenti per Granger causality nello spettro e metodologie non lineari possono richiedere pacchetti specifici o implementazioni personalizzate.

Esempi concreti: come leggere i risultati della Granger causality

Immagina di analizzare due serie economiche: tasso di interesse (I) e inflazione (P). Se I Granger-causa P, l’inclusione dei ritardi di I nel modello di P migliora la previsione di P. Se al contrario P non Granger-causa I, l’inclusione dei ritardi di P non migliora la previsione di I. In molti casi si osserva una Granger causality parziale o temporanea: ad esempio I Granger-causa P solo in determinate finestre temporali durante shock di politica monetaria. Interpretare questi risultati richiede contesto economico, considerazione di confondenti potenziali e una valutazione delle assunzioni di modello.

Granger causality: note etiche e pratiche

Nell’uso pratico, è essenziale comunicare chiaramente che i risultati dipendono dall’insieme di variabili osservate, dall’ordine scelto e dalla finestre temporali considerate. Evitare inferenze unilaterali con una singola prova è una regola d’oro. L’interpretazione va incorniciata nel contesto del dominio di studio, tenendo presenti limiti e alternative metodologiche.

Conclusioni: perché Granger causality rimane uno strumento utile

Granger causality continua a essere uno dei metodi più versatili e accessibili per esaminare la dinamica delle dipendenze temporali. In settori diversi, dalla finanza all’economia, dalla neuroscienza all’ingegneria, consente di formulare ipotesi sulla direzione delle influenze temporali e di valutare la rilevanza di variabili nel processo di previsione. Abbinata ad estensioni nello spettro, a modelli condizionali e a controlli robusti, la Granger causality diventa una lente utile per capire come flussi di informazione e di effetto si muovono lungo il tempo.

Ricapitolando: cosa occorre ricordare sulla Granger causality

– Granger causality è una misura di previsibilità, non una prova assoluta di causalità fisica.

– Si basa su modelli VAR e test di ipotesi su differenze di errore di previsione.

– Richiede dati di buona qualità, stazionarietà o gestione adeguata di non-stazionarietà e una corretta specificazione del modello.

– Può essere estesa a contesto condizionale e in frequenza per un’analisi più ricca della dinamica tra variabili.

– L’interpretazione deve considerare confondenti, cointegrazione e slittamenti temporali variabili nel tempo.

Note pratiche finali e risorse

Per chi desidera mettere in pratica questa metodologia, si consiglia di iniziare con dati economici semplici o segnali neuroscientifici a due variabili, costruire un VAR(p) con ritardi moderati, eseguire i test di Granger causality e poi estendere l’analisi a Granger causality condizionale e allo spettro se i dati lo permettono. Esistono numerose risorse accademiche e tutorial pratici che guidano passo-passo nell’implementazione con R, Python o Matlab. La chiave è procedere in modo sistematico, documentare le scelte di modellazione e interpretare i risultati nel contesto reale delle dinamiche studiato.