Allora: la serie storica dei fallimenti dal 1867 a oggi è questa:
La fonte è Istat, integrata con Cerved e Crif (non ho trovato dati Istat dopo il 2007, chissà perché. Se li avete, grazie in anticipo). Una notazione ovvia: questi sono dati assoluti, sarebbe interessante rapportarli al numero di imprese.
Si vede bene quello che potevamo immaginare: un picco durante la crisi del 1929. Poi l'Italia parte, dopo il 1945, le aziende nascono e muoiono. Si vede anche una cosa che non sapevo, e che faceva sacramentare Alberto: il deciso cambio di passo dei fallimenti all'inizio degli anni '80, in quel periodo che tante soddisfazioni ci sta ancora dando. Negli anni '50-'70 i fallimenti erano su un corridoio fra i 6000 e gli 8000, così, a spanna. Negli anni '80 si collocano fra i 12000 e i 14000. Il cambiamento di struttura è rapidissimo, da crisi del 1929. Fra 1980 e 1984 i fallimenti raddoppiano, poi crescono ancora. Il picco è nel 1994. Poi si scende, e ora stiamo risalendo.
Il cambiamento di passo, ripeto, è evidente. Bisognerebbe entrare nel dettaglio: vedere chi e dove è fallito. Sicuramente un parente di Alberto, ma a noi non basta per un giudizio complessivo.
Restiamo però nell'aggregato e vediamo se esiste una relazione fra fallimenti e crescita.
Questo è il grafico dell'andamento storico dal 1950 ad oggi:
A grandi linee si vede che quando l'Italia tira il freno, stringendo il vincolo esterno con l'adesione allo Sme, la crescita scende (in un corridoio fra il 2% e il 4%) e i fallimenti decollano. Un dato abbastanza ovvio in un paese fatto di piccole imprese vocate all'export. L'asticella, del resto, era stata alzata proprio per questo, ricordate? Perché i peggiori fallissero, rendendo l'Italia più bella e più forte che pria...
I fallimenti ci sono stati, non sappiamo se dei peggiori, e l'Italia non è più bella e più forte che pria, con buona pace di chi ancora oggi vuole alzare l'asticella...
La relazione è statisticamente significativa? Sì. Questo è lo scatter:
e un professionista, considerando che i gradi di libertà del modello sono 62, vede subito che è una relazione fortemente significativa. La t di Student del coefficiente della crescita è -4.37. L'equazione interpolante dice che per ogni punto di crescita in meno, cioè per ogni -0.01 della variabile x, quella sulle ascisse, che è appunto la crescita, ci sono -55317x(-0.01)=553 fallimenti in più.
Per i precisini, qui il tabulato Eviews:
con tutti i caveat del caso.
Gli imprenditori hanno però un difetto, fra i tanti: sono tenaci e preferiscono non fallire. Ne consegue che la relazione fra crescita e fallimenti difficilmente sarà statica. Difficilmente, cioè, i fallimenti oggi saranno spiegati dalla recessione oggi. Più facile che siano spiegati dalla recessione ieri: per un po' provi a resistere, poi non ce la fai, e crolli. In effetti, se consideriamo la relazione fra fallimenti e crescita dell'anno prima, vediamo che è più forte:
La crescita spiega circa il 30% della varianza dei fallimenti nell'anno successivo. Niente male, per essere un modello back-of-the-envelope. Naturalmente si può fare di più.
(Breve supercazzola per espertoni - loro la adoreranno! Voi leggete solo le parti in grassetto...)
Applicando la tecnica di specificazione general-to-specific di David Hendry, ho tirato fuori questo modellino che potrebbe piacere di più agli schizzinosi:
(ulteriore supercazzola per superesperti: la regressione è unbalanced nel senso di Maddala e Kim, ma se filtri la variabile dipendente i dati raccontano sempre la stessa storia...)
Fine della supercazzola e morale della favola
Alberto aveva ragione ad avere le madonne. Il modellino approssima abbastanza bene i dati. Se prendiamo il 1980 come punto di svolta, prima la crescita era intorno al 7%, poi intorno al 2%. Circa 5 punti di crescita in meno si sono tradotti in più di 10000 fallimenti in più all'anno, guarda caso proprio in un decennio.
E allora, cari imprenditori, se vi dimostro che esiste una relazione fra cambio, export e crescita, che dite, l'idea dell'euro vi sembrerà ancora buona? Ma poi, che cosa devo dimostrarvi? Voi mica siete economisti: voi lo sapete meglio di me!
Morale della favola: il governo aveva detto che quest'anno avremmo avuto quasi l'1% di crescita, e invece sarà meno di zero. Fanno 1500 fallimenti in più. Naturalmente potrebbe toccare al vostro vicino. Nel dubbio, ci teniamo l'euro?
Addendum delle 22:12 dopo una grandinata di notevoli proporzioni (ma sempre meno grave della recessione): è la recessione che causa i fallimenti, o sono i fallimenti che causano la recessione?
Luca Gandolfi ha lasciato un nuovo commento sul tuo post "Recessioni e fallimenti in Italia":
Chiedo: non avrebbe senso verificare anche la correlazione invertendo le variabili?
Postato da Luca Gandolfi in Goofynomics alle 31 agosto 2014 19:59
Questa domanda di Luca mi fa capire che avete bisogno che vi sollevi dalla vostra beatitudine in statistica, altrimenti ora che cominceranno a uscire i risultati delle nostre ricerche vi sarà un po' difficile orientarvi. Una cosa è il Fogno, un'altra il calcolo delle probabilità!
Comunque, la correlazione è una relazione perfettamente simmetrica, come vedremo, per la semplice proprietà commutativa della moltiplicazione (invertendo l'ordine dei fattori ecc.). Se la correlazione fra y e x è 0.6, quella fra x e y invece pure, ma di questo vi darò ampia e semplice dimostrazione (oh, va da sé che se avete problemi con le tabelline mi arrendo, però a quel punto se credete al resto che vi dà il commerciante col gomito sulla bilancia, potete anche credere a me!).
Volevo però aggiungere una cosa per chi invece la statistica già la sa, dando un senso alla domanda di Luca, che credo potesse essere: ma non è che il prodotto cala perché le aziende chiudono? In altri termini, la domanda di Luca è "offertista": dané, laurà (la locomotiva del Nord). Questa domanda un fondamento ce l'ha.
Mi spiego.
In un’economia di mercato si produce per vendere e si vende
per guadagnare, il che significa, in buona sostanza, che il prodotto di
un’economia coincide con il totale dei redditi percepiti a vario titolo da chi
questo prodotto (beni e servizi) lo ha posto in essere. Insomma, il prodotto
interno (Pil) coincide con il reddito interno (prodotto e percepito nel paese). Va
anche detto che a fronte di un reddito percepito, ci deve essere una spesa
effettuata. Se il fornaio non vende non guadagna, ma se nessuno domanda pane,
il fornaio non vende (quindi non guadagna, quindi dopo un po’ chiude, e quindi
non produce). Ne consegue che il Pil di un paese da un lato coincide col valore
della produzione posta in essere, dall’altro col valore dei beni domandati e
venduti. Domandati e venduti, lo sottolineo nuovamente, perché, almeno fino a
quando non saremo in grado di leggere nel pensiero e di misurare oggettivamente
l’intensità delle passioni (un progresso che non rivoluzionerebbe solo la
scienza economica), in macroeconomia la domanda di beni si misurerà coi fatti,
cioè con quanto è stato effettivamente speso per acquistarli. “La domanda
aggregata è domanda solvibile”: ricordo questa frase, che allora mi sembrava
sibillina, da un mio vecchio manuale di macroeconomia. Cosa vuol dire?
Semplice: che se non hai soldi non puoi comprare, quindi la tua domanda rimane
un pio desiderio, privo di rilevanza macroeconomica, perché non può tramutarsi
in spesa, che rilevanza macroeconomica invece ne ha (perché si contabilizza, si
misura). Quindi quando parlano di prodotto, di reddito, o di domanda (cioè di spesa)
aggregata, gli economisti stanno sostanzialmente parlando della stessa cosa. Le
tre cose (prodotto, reddito, domanda aggregata) sono concettualmente e
contabilmente equivalenti, ma nel laico evocano concetti molto diversi, il che
lascia agli azzeccagarbugli di varia estrazione ampio margine di manovra.
La mia spiegazione della correlazione osservata è che la recessione, in quanto calo di domanda, fa chiudere le imprese. Ma potrebbe anche darsi che la chiusura delle imprese, in quanto riduzione della produzione, faccia calare il Pil. Chi viene prima?
La risposta per ora la do a chi la può capire. In termini meramente descrittivi, i fallimenti sono negativamente correlati sia con la crescita passata che con quella futura, il che significa che se c'è stata meno crescita ci sono più fallimenti, e se ci sono più fallimenti ci sarà meno crescita. Il correlogramma incrociato è questo:
e vedete che i fallimenti hanno correlazione -0.4855 con la crescita contemporanea (dell'anno in corso), poi correlazione -0.5269 con quella dell'anno prima, e -0.3791 con quella dell'anno dopo, -0.5262 con quella di due anni prima, -0.3410 con quella di due anni dopo, ecc. ecc.
Sono tutti coefficienti significativi, ma quelli dei ritardi (cioè della crescita negli anni precedenti) sono maggiori di quelli degli anticipi (cioè della crescita negli anni successivi). L'analisi descrittiva una qualche indicazione quindi ce la dà.
Poi possiamo applicare un test di causalità del Granger, del tipo di quelli che abbiamo applicato due anni fa per verificare se le esportazioni causassero la produttività (cosa negata dai dilettanti, ma confermata, come vi ho detto, da una letteratura scientifica sterminata e assolutamente ortodossa, che parte fra l'altro proprio da Adam Smith, nel Capitolo III del Libro I della sua opera, dove constata come la divisione del lavoro, motore di produttività, sia limitata dall'estensione del mercato: non ha senso produrre di più se nessuno compra; osserva quindi saggiamente Smith che la civiltà è nata lungo le coste del Mediterraneo, perché qui era facile spostarsi e trovare nuovi mercati. Ha un senso, ma tutto questo, ovviamente, Monacelli non lo sa, e non diteglielo. Notate: sembra una digressione e invece il succo di tre anni di lavoro è tutto qui. Non nel fatto che i liberisti alla Monacelli ignorino Smith - e Grossmann, e Krugman, e Romer, no, di quello ce ne freghiamo! Nel fatto che la produttività dipenda dalle esportazioni...).
Il post di due anni or sono spiega a grandi linee la logica del test. Se lo applichiamo ai nostri dati il verdetto è inequivocabile:
I dati a disposizione supportano l'ipotesi che la crescita non causi i fallimenti con una probabilità dell'1%, e quella che i fallimenti non causino la crescita con una probabilità del 32%. Quindi l'ipotesi che i fallimenti non causino la crescita non può essere respinta, è relativamente probabile (32%); quella che la crescita non causi i fallimenti deve essere respinta, è assolutamente improbabile (1%). In linguaggio non tecnico: la crescita causa i fallimenti (li causa quando non c'è, ovviamente, visto che la correlazione è negativa)! Viceversa, non c'è evidenza che i fallimenti causino (de)-crescita.
Insomma: l'approccio offertista è smentito, ed è confermato che se non c'è domanda si tira giù la cler. La correlazione osservata si manifesta perché il calo di domanda causa fallimenti, non perché i fallimenti causano un calo di offerta (di produzione).
Va bene così?
Post-supercazzola per espertoni: lag length di 2 scelta da Eviews, ma siccome il cross-correlogram dava correlazioni altine a ritardi anche più alti, mi sono accertato che due ritardi bastassero per sbiancare i residui, e la risposta è sì:
Ah, naturalmente, se avete dubbi, chiedete a Udo!
Bene. Ora se vi va di capire quello che avete letto, chiedete. Se invece non vi va andatevene, perché il prossimo mese per voi sarà durissimo. Vi toccherà studiare tanta ma tanta statistica. E cominceremo proprio dalla correlazione, perché è ora...
È arrivato l'arrotino!
Appunto. Vi avevo detto di aspettare di studiare prima di commentare, e invece voi gnente! Vi sottopongo il commento di un espertone. Lui non capirà (prima legge della termodidattica), voi nemmeno, ma meglio chiarire subito chi è un econometrico e chi no, altrimenti qualcuno rischia di farsi male...
merego ha lasciato un nuovo commento sul tuo post "Recessioni e fallimenti in Italia":
Un commento tecnico relativo ai modelli di regressione lineare fallimenti/crescita mostrati.
Con un R^2 di 0.2 - 0.3 trarre conclusioni precise non e' possibile. Non contesto la validita' del modello, certamente esiste una relazione tra le variabili fallimenti e crescita vista la buona significativita' dei parametri del modello, tuttavia mi sembra azzardato sostenere, ad esempio, che una variazione della crescita di -0.01 causi 533 fallimenti.
Mi sembra che esista una certa eteroscedasticita' nei dati che certamente influenza il modello. Visivamente dallo scatter plot direi che la relazione fallimenti/crescita sia diversa nei range di crescita tra [-1 , 4] rispetto al range [5,10]. Credo che il fitting di due modelli lineari separati per i due range o l'utilizzo di un modello non lineare sarebbe piu' adatto in termini di capacita' di spiegare la varianza della variabile fallimenti, quindi in termini di precisione del modello.
Paolo
Postato da merego in Goofynomics alle 03 settembre 2014 15:36
Per fare commenti tecnici bisogna essere tecnici. Ma lei spero non lo sia, o poveri i suoi clienti!
Stime "puntuali" non hanno mai particolare senso. Le stime intervallari, però, vengono spesso respinte perfino dalle riviste scientifiche, per un ovvio motivo: da un lato il policy maker non sa cosa farsene (triste, ma vero), dall'altro chi è interessato se le trova da sé. Mi sembra che lei non sia in grado di farlo, quindi la aiuto. Posto che entrambi i modelli sono back-of-the-envelope dichiaratamente, in quello stimato con Excel si vedeva ictu oculi (se si è del mestiere) che lo standard error del coefficiente è di circa 12651, il che significa che la stima intervallare, considerando un intervallo di confidenza al 95%, cade in un range fra circa 300 e 800 fallimenti (comunque, ho aggiunto il tabulato Eviews nel caso non sapesse risalire allo standard error dal valore dell'R2. Nel PAM, che ha un R2 di 0.94, l'intervallo di confidenza del moltiplicatore di impatto va da 80 a 140 (a spanna). Il moltiplicatore totale è una funzione non lineare dei coefficienti stimati. Se le interessa la sua dispersione, prima mi assicuri che siamo arrivati fin qui, e poi le spiego come andare avanti.
Si dice eteroschedasticità perché viene dal greco schedannumi (disperdo, come in Dispersit superbos, per capirci), e non c'è, perché se dico che la diagnostica è a posto, significa che è a posto:
(li conosce, vero? Sicuro?)
D'altra parte, sarebbe abbastanza difficile individuare eteroschedasticità in uno scatter.
Circa la non linearità, il suo ruolo in economia è decisamente sopravvalutato, e la diagnostica non offre particolare indicazioni in merito:
Ma che la diagnostica fosse a posto io l'avevo detto. Di norma e in media in economia la dinamica conta molto, ma molto più della eventuale nonlinearità (con tutto il rispetto per i colleghi che studiano quest'ultima). Un reshuffling dei dati che distrugga la loro relazione temporale (per studiare eventuali differenze nel coefficiente in relazione al range dell'esplicativa) non avrebbe molto senso. Per uno studio di eventuali asimmetrie non ci sono tantissimi dati, ma si potrebbe fare. Non credo che porterebbe l'R2 molto sopra al 94% di quello del modello dinamico (che ha a sua volta dei problemi).
Detto questo, le evidenze presentate sono robuste ma semplici. Non presenterei questo lavoro a una rivista scientifica (ma stia attento quando presenta i suoi), e se volessi costruire un modello previsionale dei fallimenti intanto non considererei questa variabile dipendente, che ha poco senso per i motivi che i commentatori le hanno esplicitato, e poi non considererei solo indicatori di domanda, ma anche di stress finanziario.
Insomma, come sempre quando arriva un espertone, la domanda è: ma de che stamo a parla'?
È tornato l'arrotino!
Buongiorno,
mi spiace ci sia rimasto male, la mia era semplicemente una critica non un attacco.
Trattare da incompetenti, a priori, chi le propone suggerimenti o muove delle osservazioni probabilmente funziona quando si vuole mantenere una propria dignità su un social network.
Per quanto riguarda la risposta al mio commento, andiamo per ordine.
Lei mi risponde "Stime puntuali non hanno mai particolare senso..."
Bene perché allora l'ha indicata nel post ?
Poi continua "Le stime intervallari, pero', vengono spesso respinte ..."
Beh allora qui ci si prende in giro, o una o l'altra andrà bene, no ?
Eteroschedasticità. Io le ho detto, "mi sembra che ci sia..." non avendo i dati non ho fatto test, dallo scatter si può' sicuramente fare una fare una previsione prima di fare dei test.Bene, non e' presente secondo i test di Breusch-Pagan e di White.
Non linearità', lei dice "il suo ruolo in economia è decisamente sopravvalutato...".
Che i modelli lineari siano piu' semplici da trattare, e che molti processi in natura possano essere spiegati in modo eccellente con modelli lineari va bene, ma l'argomento di non utilizzarli perché' lei pensa che l'utilizzo in economia sia sopravvalutato, non ha senso. Lei pensa che il mondo sia lineare ?
Il test di Ramsey riguarda un tipo di non linearità', quella polinomiale.
I tipi di non linearità' sono molti, e vedendo lo scatter continuo a dire
che la regione tra -1 e 4 ha un andamento diverso dalla regione tra 4 e 10.
Conclusioni. Il suo modello andrà' bene in termini di significatività' ma non e' un
buon modello per quei dati.
Ritorno a dirle, R2 basso quindi bassa precisione, questo è inequivocabile.
Facciamo qualche esempio. Quale e' la percentuale di crescita quando i fallimenti sono 16000 ? Secondo il suo modello risulta pari a -8.96 percento. Molto negativa, proviamo a spostarci un po. 14000 fallimenti, crescita secondo il modello pari a -5.35 percento. Sempre negativa.
Da 11039 fallimenti in su, il suo modello predice una crescita negativa quando in realtà' in quel range (tra 11039 in su), a crescita negativa vi sono solo 3 valori.
Il suo modello sottostima fino al 4 percento circa e sovrastima dopo.
Stessa cosa vale per la regressione dei dati dell'anno precedente.
Attenendosi a modelli lineari, provi a rimuovere degli outliers o dei valori influenti, controlli con un test, non so Cook's Distance o quello che preferisce, so che li conosce tutti.
Oppure invece di usare il Least Squares provi un metodo di regressione robusto, certamente il modello migliora.
Buona Giornata,
Paolo
Paolo, Paolo... Io ho provato a tutelarti dalle conseguenze della tua incredibile supponenza, ma vedo che proprio non ci arrivi. La prima cosa che è evidente dal tuo ragionamento è che di econometria non sai nulla. Insomma, sei incompetente, e in questo non c'è nulla di male. Sai qualcosa di statistica, probabilmente molto più di me, ma la statistica è un'altra cosa. Quella che serve a un epidemiologo non è quella che serve a un econometrico. Dimostri di non saper nulla di time series analysis, non sai molto di analisi econometrica della nonlinearità, e soprattutto hai un piccolo problema di vista, determinato forse da un eccesso di amore per te stesso: continui a parlarmi di un "modello" con R2 basso, ma io vedo un modello con coefficiente di determinazione corretto pari a 0.939. Sei sicuro di non aver bisogno di un controllo oculistico?
Vedi, ti spiego: qui l'incompetenza è ammessa, la supponenza no. E tu sei supponente. Venendo da un'esperienza zero in campo econometrico, vieni a fare quella che a te pare una critica costruttiva, ma è solo un inutile sfoggio di (in)competenza tecnica, a beneficio di chi e di cosa?
Ti spiego subito perché non sei un econometrico: (1) perché in econometria (in quella vera) quello che interessa dell'errore è che non sia sistematico, cioè che il modello "filtri" bene l'informazione. Per avere un R2alto (il tuo feticcio) basta overfittare il modello, la massimizzazione del coefficiente di determinazione non è più ritenuta da decenni un obiettivo né una guida attendibile nel processo di specification search; (2) perché non riesci a vedere gli eventuali problemi che un esperto nel campo immediatamente vedrebbe e che io per onestà intellettuale ho citato: omitted variable bias e unbalanced regression. Qui sì che ci sarebbe da discutere, se con lo scatter avessi preteso di proporre un modello (un tentativo di modello è qualche riga sotto, se inforchi gli occhiali...).
Anche come statistico non vai benissimo, però, a mio sommesso avviso.
Lo scatter (quello che corrisponde a una retta di regressione con R2= 0.23) non si proponeva come modello, ma solo come strumento descrittivo per accertare la significatività di una relazione statistica. E tu vuoi dirmi che una t di Student di 4.3 non è significativa? Suvvia, sii serio! Non hai bisogno nemmeno di guardarti le tavole, il tabulato ti dà il p-value: la relazione fra crescita e fallimenti è statisticamente significativa a qualsiasi livello di significatività nominale usualmente adottato. Overfittare il modello non cambierebbe questo risultato, che era quello che mi interessava stabilire.
La dialettica da bar sulle stime puntuali e intervallari è veramente di basso livello, scusami. Se vuoi fare il furbetto, mi spiace ma questo non è il posto, il concetto che ho espresso è molto chiaro: a livello divulgativo e nella comunicazione politica si usano le stime puntuali perché trasmettono un valore medio; a livello scientifico anche, perché chi è del settore la stima intervallare sa come ricavarla al volo. Quindi si usano sempre le stime puntuali, e se fai polemiche di questo tipo è evidente che non hai mai letto un paper di econometria.
Peraltro, io sono uno dei pochi autori ad aver publicato stime intervallari di moltiplicatori dinamici di modelli strutturali (perché mi divertivo a giocare con la simulazione stocastica). Al referee di quel paper proposi anche le stime del deterministic simulation bias, e lui mi disse di toglierle, trovando la mia precisione commendable, ma di scarsa utilità pratica. Questo perché concordava sul fatto noto che la non-linearità (escludendo quella di tipo moltiplicativo o logaritmico che dir si voglia) in economia abbia scarsa rilevanza empirica: esiste, in proposito, una letteratura sterminata, non si tratta di una mia opinione, mi spiace: è un fatto.
Si capisce anche che non sei un professionista dal fatto che continui a chiedere un frazionamento del campione che ne distruggerebbe la struttura dinamica, quando ti dimostro che con un modello dinamico arrivo a spiegare il 93% della varianza della variabile dipendente. Evidentemente provieni da qualche scienza "statica": beato te! In economia c'è il tempo, sai, funziona così.
Andiamo avanti? C'è solo l'imbarazzo della scelta. Rimuovere gli outliers? Allora: ripeto che lo scatter non è un modello (eventualmente lo sarebbe il PAM), ma qualora dovessi valutarlo statisticamente, ti segnalo che il test di Jarque e Bera mi dà una statistica di 0.27! Quali outlier? I residui hanno una distribuzione perfettamente gaussiana. Sai, la gaussiana è fatta così, ha due code... E perché dovrei usare il LAD invece dell'OLS se non ho una distribuzione con fat tails? Sinceramente, non lo capisco.
Perché fai così? Guarda che a me dispiace per te. Figurati se quello che dice uno che non sa nulla mi urta. Ma te lo dico paternamente: tu devi essere molto giovane. Cerca di capire come relazionarti con chi ne sa più di te. Ti aiuterà nella vita molto più che intervenire in campi nei quali non hai competenze specifiche.
Certo, proprio per il fatto che non le hai, immagino che avrai avuto difficoltà a seguirmi, e quindi non avrai capito quanto sei fuori strada. Ma io un altro tentativo per cercare di aiutarti dovevo farlo. Da qui in avanti, son fatti tuoi...