(...post inutilmente
tecnico. O lettore, se capiti oggi per la prima volta su questo blog, sappi che
esso non è sempre così. Spesso è anche peggio. Chi rimane mi fa un favore, chi
se ne va me ne fa due...)
(...prima di
raccontarvi la vera storia del pollo di Trilussa, cosa della quale, come vedo,
c’è un gran bisogno, chiamo a rinforzo i matematici e cerco di chiarire col loro
aiuto un piccolo punto. Chi è interessato alla sostanza del problema – che poi
sarebbe come si fa a prevedere una variabile economica, e che cosa certi
comportamenti delle variabili ci dicono sul comportamento degli agenti
economici, e che cosa c’era scritto nel two Charlies paper che vi ho citato
spesso, e perché Granger e Fama hanno preso il Nobel, ma anche che cos’è una bolla,
come si fa a vedere se c’è, e perché tutto questo e molto altro ci dovrebbe
interessare – può tranquillamente saltare questo post. Ci metto apposta un po’
di formule a mo’ di spaventapasseri...)
[ESPERTONE MODE ON]
Alcuni di voi (e.g., Alberto Lattuada) hanno evocato la LLN (no,
scusate, volevo dire la LLN) con
riferimento alla variabile Y,
argomentando che la media campionaria delle Y
dovrebbe asintoticamente convergere alla media non condizionata di Y.
Posto che:
dove Zj è
stato costruito come un white
noise usando una distribuzione
bernoulliana centrata (espediente didattico: volevo evitare di usare
distribuzioni assolutamente continue, ma questo non credo cambi la sostanza del
problema, no?), accade che la media non condizionata sia:
e che, peraltro, anche volendo considerare che quando si
evoca l’infinito la diventa majala di molto, tutto lascia pensare che sarà
anche:
(dove 0 si legge in realtà zerantazeromilazeranta zeri).
Quindi la media non condizionata è zero.
Ora però dobbiamo ragionare sulla media campionaria.
Intanto, chiariamo come non è fatta.
La media campionaria della Y non sarà:
perché questa è la media campionaria delle Z (essendo che ogni Y è la somma delle prime t
variabili Z, e quindi se la dividi
per t ottieni una stima della media
non condizionata delle Z che è
appunto zero).
(nota: per la notazione "t alla meno uno" mi sono ispirato a un grande classico).
La media campionaria delle Y
sarà viceversa:
Quindi, ad esempio, con riferimento al grafico in questo
post, sarà 601/100=6.01.
Ora, siccome come altri di voi (e.g., Marco85) hanno
chiaramente visto, le Y non sono
i.i.d., cioè non sono distribuite in modo né identico né indipendente, la
domanda è: siamo sicuri che esista una qualche LLN che ci garantisca che:
(dove con la freccia indico un qualche tipo di convergenza
in probabilità)? Voi quale LLN usereste per dimostrare la convergenza in probabilità
della media campionaria delle Y alla
media non condizionata delle Y che
dovrebbe essere zero?
Occhio, perché quando Fausto vi dice questo:
Fausto di Biase ha
lasciato un nuovo commento sul tuo post "Passeggiata aleatoria (1bis)":
Un calcolo non difficile mostra che la media DEL QUADRATO di Y_n è uguale a n.
Non c'è bisogno di osservare che IL QUADRATO di Y_n è per forza di cose un numero positivo, perché non solo più per più fa più, ma anche meno per meno fa più.
Dopo n passi, il nostro ubriaco stocastico (senza offesa parlando) si trova a una distanza dal punto di partenza pari a circa la radice quadrata di n.
In alcuni dei tuoi grafici questo è visibile. La radice quadrata di 50000 è circa uguale a 223. La radice quadrata di 100 è uguale a 10.
Postato da Fausto di Biase in Goofynomics alle 01 marzo 2014 10:59
Un calcolo non difficile mostra che la media DEL QUADRATO di Y_n è uguale a n.
Non c'è bisogno di osservare che IL QUADRATO di Y_n è per forza di cose un numero positivo, perché non solo più per più fa più, ma anche meno per meno fa più.
Dopo n passi, il nostro ubriaco stocastico (senza offesa parlando) si trova a una distanza dal punto di partenza pari a circa la radice quadrata di n.
In alcuni dei tuoi grafici questo è visibile. La radice quadrata di 50000 è circa uguale a 223. La radice quadrata di 100 è uguale a 10.
Postato da Fausto di Biase in Goofynomics alle 01 marzo 2014 10:59
diciamo che vi sta dando un avvertimento. Ecco, queste poche
righe leggetele mentalmente con questo accento. Il
quadrato è una specie di testa
di cavallo...
Ovviamente la mia offerta a pensarci sopra è un’offerta che potete rifiutare (a
proposito, mi avete fatto ricordare che devo telefonare a Luca). Adesso si
esprimano Marco Basilisco e Enrico Pesce, e poi parliamo del pollo di Trilussa,
perché vedo negli astanti un certo ondeggiamento fra momenti campionari e momenti
della distribuzione...
[ESPERTONE MODE OFF]
(N.B.: la rima in
espertone è la stessa per tutti, pure per me, quindi io sto parlando di cose
delle quali fondamentalmente non capisco un cazzo, però so come si usano. Un po’
come la maggior parte di noi quando spinge l’interruttore per accendere la
luce, mi spiego? La conseguenza è che adesso sciogliamo la muta dei matematici...
Mentre loro mi inseguono per le strade della ville lumière, dove io percorro
traiettorie rigorosamente ergodiche - ma loro, essendo dei teorici e non degli applicati, non realizzano che la cosa migliore da fare per raggiungermi è stare fermi - e prima che io spieghi a Nat la vera
storia del pollo di Trilussa – Nat: se uno legge Tolstoj deve sapere cos’è una
martingala, mi dispiace: l’umanesimo è una croce più pesante di quanto possa
esserti sembrato al classico! – ricordo alla colonna parigina che domani se
vedemo a cena. Che probabilità avete di trovare il ristorante lanciando una
monetina a ogni fermata del métro?)
(...siete la classe che ho sempre sognato di avere: a una certa età bisogna anche cominciare a volersi bene e farsi ogni tanto un bel regalo...)
(...prima conseguenza del post: una telefonata di gelosia di Marco che mi dirà: "Ma cos'ha quell'Enrico che io non ho!?" È tanto un bravo ragazzo, Marco, un giovane geniale, segnato dalla vita, con le sue piccole, scusabili fragilità...)
(...n.b.: io un'idea sulla risposta tecnica ce l'ho e ha a che fare con memoria del processo e esistenza dei momenti. Sono fuori strada? Domanda seria per persone serie - quindi non avrò risposta...)
Secondo me la Y è sbagliata. Perché chi sta fermo viene investito, i ristoranti non si trovano tirando la monetina a meno che non sia moneta elettronica e chi cammina gira l'angolo e trova la Cheviceria "El Pulpo" (http://mondialternialternateworlds.blogspot.co.uk/2013/09/parigi-da-mangiareparis-to-eat.html)
RispondiEliminaGiuro che non sono parenti miei. Ed è bene conoscere lo spagnolo, se volete ordinare.
Ok, provo stasera.
Elimina(p.s.: lo sapevo che non avrei avuto risposta: sono riuscito a contagiarvi...).
EliminaAlberto, io nel fine settimana litigo con la moglie. Leggere, ho letto, ma per ragionare (addirittura!) non mi è rimasto molto tempo...
RispondiEliminaMa poi ci fai anche pace? Se hai bisogno di aiuto, qui volontari mi par di capire che ne trovi...
EliminaCi stiamo lavorando; ringrazio gli eventuali volontari, ma direi che questa va risolta comunque in autarchia!
EliminaAllora vedi che ha ragione er Melanzana? Chi non vuole il cambio fisso vuole l'autarchia e/o la guerra commerciale...
EliminaBe' nella storia del pollo di Trilussa non viene condiderata la varianza. E'quello ??
RispondiEliminaLa varianza è un pezzo di questa storia, ma per raccontarvela devo fare un passo indietro perché cosa sia la varianza non lo sanno tutti, ma è un requisito minimo pe' capisse...
EliminaRipeto, poi vado e non commento più, era solo per chiedere indizi. Sarà mica una catena di Markov omogenea? Prof. Insultami se non ho studiato.
RispondiEliminaL'espertone mode on richiede studio e pazienza. Quindi aspetto di studiare prima di scrivere baggianate. Ecco perché non ho ancora -e ripeto ancora- commentato. Tzè tzè (come diceva Bombolo).
RispondiEliminastai cercando di appropriarti del mio tempo disponibile in un weekend ma mi rifiuto di subìre tale espoprio. Anche per confermare che l'offerta non crea necessariamente la domanda e che la merce prodotta può restare in magazzino. Stavolta faccio come quegli studenti che saltano (random) alcuni capitoli sperando che all'esame non capiti proprio quella domanda. Tanto alla fine la si sfanga comunque. Comincio a frequentare qualche sezione di partito, entro in qualche direzione, mi "occupo" di qualcosa, mi faccio vedere in giro, "intervengo" in qualche dibattito (basta dire bene qualsiasi minchiata) e vedrai che divento pure ministro della Repubblica. Alla peggio, ci saranno sempre i vigneti da coltivare. Buona domenica!
RispondiEliminahttp://mathworld.wolfram.com/RandomWalk1-Dimensional.html
RispondiEliminahttp://math.stackexchange.com/questions/118889/mean-distance-from-origin-after-n-equal-steps-of-random-walk-in-a-d-dimensio/118918#comment300848_118918
E per ci ci tiene all'orgoglio nazionale:
http://freemathbooks.com/introduction-probability-random-processes/
Uff.. faccio prima a dichiarare quello che ho capito (che è poco).
RispondiEliminaIl valore y101 lo prevedo uguale a 0, cioè =y100. Il problema è che non ho la più pallida idea di dove sono, come da grafici del post precedente: cioè la mia sequenza può essere che cresca, che scenda o che barcolli sullo 0.
Ne desumo che se osservo il mio cammino (se mi guardo indietro) e pongo y(n+1)=yn avrò l'istinto "conservatore" a confermare il trend precedente.
Ma il perché sono in quella data posizione non lo colgo (potrei ipotizzare che possa assumere infiniti valori)
Abbattetemi.
Ma veramente non ce n'è motivo, hai detto tutto quello che c'era da dire.
Elimina"Il perché sono in quella data posizione non lo colgo" lo traduciamo: "media non condizionata uguale a zero".
"Confermare il trend precedente" lo traduciamo: "media condizionata all'osservazione precedente uguale... all'osservazione precedente.
Tutto corretto. Ora c'è da capire cosa significhi.
Prof. purtroppo devo dedicare i miei 2 neuroni attivi ad altro progetto in questo fine settimana...
RispondiEliminaAmmetto di averci capito poco, però mi sembra qualcosa di simile alla radiazione di fondo dell'universo che è distribuita uniformemente e pari a circa 3 gradi kelvin se vista nel suo insieme, ma che nel dettaglio presenta delle "increspature" che evidenziano, nello spazio e nel tempo, le zone e i periodi in cui si sono formate le galassie e i vari ammassi stellari. Anche questi ultimi visti da debita distanza possono restituire ad un ipotetico osservatore posto al fuori dal nostro universo, un immagine uniforme e "piatta" dello stesso, ma avvicinando il punto di osservazione si notano zone con elevata concentrazione di materia e zone "vuote" costituite dallo spazio interstellare.
RispondiEliminaAdesso apro una bottiglia di Amarone e mi riprendo da questo delirio ^_^
Il professore è un eversivo vuole insinuare nelle vostre menti il dubbio che 30 (o 40) anni di monetarismo non abbiano nessun fondamento scientifico ma siano solo il frutto di una certa volontà (reazionaria) di plasmare la società in senso antidemocratico. In altre parole se i banchieri centrali fossero democraticamente eletti il monetarismo non sarebbe tanto di moda. Ma purtroppo i fatti dimostrano il contrario: appena Draghi ha annunciato lo strumento di rifinanziamento delle banche milioni di disoccupati europei consci del fatto che il tasso di sconto era negativo in termini reali sono corsi in banca a chiedere un mutuo per aumentare i loro consumi.
RispondiEliminaNon penso di aver capito la domanda, ma provo a rispondere. :)
RispondiEliminaLa LLN, il grafico del valore medio del lancio di un dado lo mostra, dice che il limite della sommatoria dei risultati del lancio della moneta divisa per il numero dei lanci tende al valore medio (per i dadi 3,5, per la moneta dei post 0) per un numero di lanci che tende all'infinito.
Più volte si lancia la moneta è più la media dei lanci, cioé dei +0,5 e dei -0,5, cioé la somma dei +0,5 e dei -0,5 divisa per il numero dei lanci, si avvicina a zero, che è la media di Z.
Ma la Yt è la sommatoria dei primi t lanci della moneta. Non c'è alcun motivo per pensare che debba avvicinarsi a zero all'aumentare del numero dei lanci.
Infatti, immaginiamo di essere a 100 lanci dall'infinito e di essere magicamente arrivati allo 0... i successivi 100 lanci potrebbero portarci di nuovo a 13, come nel primo grafico di questa serie di post. :)
"le Y non sono i.i.d., cioè non sono distribuite in modo né identico né indipendente"
EliminaLe Yt con t crescente no, ma le Yt, con t fissato, lo sono.
Fisso t, lancio la moneta t volte e vedo quanto è la somma Yt. Ripeto l'operazione n volte. La media di Yt per il numero delle volte che lancio la moneta tenderà a zero per n che tende all'infinito.
Non ho capito la domanda, ma neppure perché sia interessante la media dei risultati di una somma che si espande... :)
La media campionaria indicata sopra, quella del secondo t alla -1 dei quarant'anni di malgoverno democristiano, si comporta come le Yt, ha solo un andamento più smussato, o almeno sembra che si comporti così nel mio grafico.
P.S.
Ma tutto questo per quello che a Napoli, non ricordo più a che proposito, parlò di random walk ben noti in letteratura?
:)
No, quello lo ha lavato la pioggia, poi vi parlerò anche di quella letteratura, della quale lui non sa un cazzo perché non se ne è mai occupato, porello. No, il discorso è più profondo. Con t fissato che minchia vuol dire? Se parli di distribuzioni asintotiche è normale che t vari, no?
Elimina"Con t fissato" vorrebbe dire ad esempio t=50.000 e ripetere questi 50.000 lanci della moneta n volte, come nel post 1bis, e vedere dove finisce di volta in volta la Y. :)
EliminaNone, nun funziona così. Siamo comunque in una scienza non sperimentale, e quindi non possiamo "replicare" il processo. Questo non capiscono i dilettanti del "PIL multifattoriale" e scemenze simili. Il "fixed in repeated sample" non va bene in economia (ma nemmeno in astronomia, alla fin fine). Non puoi avere 50 replicazione del Pil italiano da Garibaldi ad oggi. Ce n'è una. L'informazione non la accumuli "replicando" l'esperimento (perché non è un esperimento), ma studiandone il divenire, accumulando informazioni. I tecnici converranno che in econometria con la nozione di "non distorsione" ci fai poco, è più utile quella di consistenza (convergenza in probabilità).
EliminaOh, ecco!
EliminaMo' sì, che so di non sapere.
Grazie, prof., per avermi fatto capire che il "metodo degli ensemble", tipico della Meccanica Statistica, NON VA BENE.
Resto quindi in ascolto, perché è materia per me nuova.
Sia il Teorema Limite Centrale che i risultati di convergenza per martingale sono utili in questo esempio.
RispondiEliminaP.S.
Complimenti all'autore di questa bacheca, che applica egregiamente il motto che Columella (4 d.C. - c. 70 d.C.) ha enunciato nel De Re Rustica:
Nihil recte sine exemplo docetur aut discitur.
A proposito di latino: la "E" viene dal latino "expectatio".
Lo so, lo so, sono un rompiscatole. Lo nacqui.
Da cui il detto "expactatio non petita, scassacatio manifesta". Ma insomma, la media campionaria delle Y converge a zero o no? Cioè: sono io che sono sfigato, o il problema è che la varianza esplode?
EliminaRispolverato libro di statistica:
EliminaSe X è binomiale la sua varianza V(X) è n*p*(1-p): 100*0.5*(1-0.5) = 25
Poi V(Y) = V(X1) + V(X2) + ... + V(Xn)
Morale: più prove faccio più è probabile che finisco distante dalla media..
Forse è questo il motivo per cui non arrivo mai a 0..
@ Alberto L.
EliminaA zero ci torni. Anzi, si può dimostrare che hai probabilità prossima a 1 di tornarci infinite volte. Ma la frequenza di questi ritorni all'origine è sempre più rada al crecere del numero dei lanci. Come dice sopra il professore, quando si evoca l'infinito la diventa majala...
@ Alberto B
Pur non essendo certo un espertone nei fatti, come espertone nei desideri frustrati di quando studiavo 'sta roba mi riconosco profondamente nell'approccio socratico alla rima in "...oni". Il vero espertone non può dubitare di essere in fondo e sempre un "...one". Direi che questa rivelazione autovalutativa rappresenta la summa dell'esperienza umana. Certe cose, meglio saperle da sé che farsele dimostrare dagli altri ;-)! Per restare in tema, qualsiasi sia la sorte degli eventi si è più preparati alla bastonatura che è sempre dietro l'angolo...
Converge a zero quasi certamente, e quindi in probabilità, per la legge forte dei grandi numeri.
Elimina@alberto
EliminaEcco, secondo me questo qualcosa con la soluzione c'entra, perché se, ad esempio, il processo avesse avuto origine nel passato infinitamente remoto, la varianza quanto sarebbe?
@Enrico
EliminaOcchio però! Mi stai dicendo che Y ripassa infinite volte dalla propria media non condizionata (zero), o che la media delle Y converge alla propria media non condizionata? Queste due affermazioni sono in qualche modo equivalenti?
@Fausto
EliminaGrazie! Solo una cosa: ma quindi la condizione che il momento secondo sia finito può essere "aggirata"? Perché quando t tende a infinito la varianza di Y invece pure. Ha qualcosa a che vedere con gli ordini di grandezza? Scusa, ma sono qui per imparare...
Sì, si può aggirare: la legge forte dei grandi numeri NON necessita della ipotesi di finitezza del momento del secondo ordine.
EliminaSe aggiungi quella ipotesi ottieni qualcosa in più: il Teorema Limite Centrale.
@Alberto
EliminaSi. La media empirica (campionaria) converge alla media non condizionata in un numero infinito di passi, anche se l'obiezione sollevata è pertinente, sottile e da lei me la aspettavo.
Altro risultato notevole è che un istogramma del "guadagno" (chiamo così Y, l'integrale delle "vincite" nei vari passi) dopo N lanci, effettuato su una molteplicità di "passeggiate aleatorie" o sessioni di gioco, è centrato sullo zero. A riprova che non siamo nelle mani di un baro, la moneta non è truccata (quindi difficile sia l'euro ;-)!).
Il "cammino quadratico medio", cioè la dispersione intorno allo zero del "guadagno" cresce al numero dei lanci, come già notato da qualcuno e in parte evidente dai grafici pubblicati. E questo può fregare il giocatore a corto di liquidità ma adottato dalla sfiga, anche in un gioco equo dal punto di vista teorico. L'infinito non è per tutte le tasche e poi, rischiare grandi perdite con una aspettativa razionale di guadagno nulla mentre l'universo invecchia è ragionevole?
Ma la parte interessante è quella che mi aspetto dalle sue conclusioni nell'applicazione della teoria.
@Crotalo
EliminaSecondo me se stessi lanciando la moneta da infinito tempo, avrei fatto infiniti tentativi, cioè infiniti n, e quindi infinita V(X).
Ancora un passo: se lancio da infinito tempo, ho varianza infinita, adesso sono infinitamente lontano dalla media, non importa se sopra o sotto.
Vuol dire che la serie è andata convergendo sempre meno e ora (dopo infinito tempo) non converge più?
C'è qualcosa che non va qui. L'infinito era la condizione che doveva salvarci e riportarci a 0, per definizione di white noise.
@Enrico
Se la frequenza con cui la serie passa per la media diminuisce sempre più al crescere delle prove, significa che dopo infinite prove la frequenza è nulla e la media non la vedo più? C'è una fregatura qui da qualche parte.
@Alberto L
EliminaMentre gli zeri sono tutti zero allo stesso modo, gli infiniti, come gli uomini, non nascono tutti uguali... c'è chi è più infinito degli altri. Sarà anche una fregatura, ma purtroppo è la realtà.
A scanso di equivoci, l'enunciato è questo.
EliminaSupponiamo che Z_1 sia una variabile aleatoria, definita su uno spazio di probabilità O, tale che il valore atteso del valore assoluto di Z_1 sia finito. Siano Z_2, Z_3, ..., Z_n, ... variabili aleatorie, definite sullo stesso spazio di probabilità O, tali che
1. le Z_k sono identicamente distribuite, k=1,2,3,4, ...
2. le Z_k sono indipendenti.
Consideriamo Y_k = la somma Z_1 + Z_2 + ... Z_k e sia
y_k = (Y_k)/k = il rapporto tra Y_k e k (che nel testo viene denotato con "Y segnato", che non so riprodurre in questo contesto)
Allora y_k converge quasi certamente alla media di Z_1 (che nel tuo esempio è uguale a zero).
Il risultato sussiste anche se, invece di supporre che le variabili aleatorie Z_k siano indipendenti, si assume che siano indipendenti due a due.
Tra i tanti testi utili, segnalo due che ho a portata di mano in questo momento: il libro di Daniel Stroock (Probability Theory: An Analytic View) e quello di Kai Lai Chung (A Course in Probability Theory).
Segnalo anche che questo argomento ha stretti legami con la "teoria ergodica".
P.S.
Oggi ho dato mezz'ora di ripetizioni a uno studente delle medie inferiori, molto sveglio, da famiglia onesta e laboriosa ma non agiata. Mi illudo nel mio piccolo di essere un piccolo motore di promozione sociale. Ho scoperto che anche qui in provincia sono arrivati i "pentamestri". Avrei voluto dire allo studente che a stonare non è tanto l'ibridazione tra latino e greco, che si trova anche in "televisione", se non erro, ma il fatto che, nell'ambito della sequenza "bimestre", "trimestre", "quadrimestre", ci si sarebbe aspettati (sul modello di "quinquennio") un "quinquestre" o forse un "quimestre", forme eufonicamente sincopate dell'impronunciabile "quinquemestre". Ma ho taciuto. Ormai i buoi sono scappati. Se ormai, noi che abbiamo inventato il capitalismo, dobbiamo ricorrere alla parola "store", perché com'è noto la parola "negozio" in italiano non esiste, che cosa possiamo aspettarci, se non un continuo imbarbarimento?
Una volta i matematici erano più puntigliosi. Non avrebbero confuso gli infiniti con gli ordini di infinito! Si vede che la riforma Gelmini è stata retrospettiva... E questo non è un O(T).
EliminaInsomma è una forma indeterminata. Si può solo ragionare sulla velocità di convergenza/divergenza all'infinito, usando gli esponenti degli infiniti?
EliminaVabbè.. Ok. Perché abbiamo fatto quest'esercizio?
Se dici a me, a quali infiniti e ordini di infinito ti riferisci?
EliminaMi sembra che il risultato che ho enunciato sia corretto e risponda alla tua domanda.
:-)
Dove mi sono sbagliato? Cosa c'entrano gli infiniti?
La varianza ha un comportamento al limite infinito.
EliminaCioè, aumentando i lanci, la distribuzione, che tende ad una normale per il Teorema del Limite Centrale, avrà sempre media (e moda e mediana) in 0, sebbene la frequenza relativa diventi vieppiù rarefatta.
Inoltre, poiché metà degl esperimenti è positiva e metà è negativa, e gli esperimenti sono infiniti, i passaggi per 0 si confermano infiniti, come detto più sopra.
Con gli ordini di infinito la battuta veniva male. Sia generoso e consenta a un ex-fisico un atteggiamento di snobistica trasandatezza rispetto al puntiglio dei matematici. Ma se la pena è la contiguità di qualsivoglia genere con la Gelmini, no, mi arrendo senza condizioni e chiedo perdono ;-)...
Elimina@Fausto
EliminaNo, dicevo a Enrico, ovviamente!
@Valerio
EliminaPoi più avanti vi faccio vedere come presentano i processi stocastici in un testo di time series analysis. Praticamente, per dimenticare le condizioni iniziali li presentano in un modo tale per cui l'infinito è adesso, con ovvie conseguenze sulla varianza adesso.
@Enrico
EliminaEra evidente che non potevi essere un matematico. Si farebbero strappare le unghie prima di dire una cosa simile!
@Fausto:
EliminaNel tuo commento ci segnali che Y_k/k converge a 0.
Nel post però il professore chiedeva se sum(Y_k)/k tende a 0.
Non sono un matematico ma facendo alcune prove si direbbe che mentre Y_k/k converge, sum(Y_k)/k diventa sempre più difficile che sia in un intorno della media di Z_1 (sebbene il suo valore atteso sia quello).
A domanda rispondo:
Eliminadomanda (posta dall'Autore del sito): @Enrico
Occhio però! Mi stai dicendo che Y ripassa infinite volte dalla propria media non condizionata (zero), o che la media delle Y converge alla propria media non condizionata? Queste due affermazioni sono in qualche modo equivalenti?
risposta: dipende dalla dimensione
una passeggiata aleatoria di dimensione uno (cioè sugli interi relativi), avente media assoluta finita, è ricorrente se e solo se ha media zero; e vale la legge forte dei grandi numeri
prendiamo una particolare passeggiata aleatoria di dimensione tre (cioè avente come spazio degli stati il reticolo tridimensionale formato dai punti dello spazio tridimensionale le cui coordinate sono numeri interi relativi), per la precisione prendiamo quella particolare passeggiata aleatoria di dimensione tre chiamata ``passeggiata aleatoria semplice'', in cui il nostro ubriaco stocastico si muove con probabilità un sesto da un vertice a uno dei sei vertici a distanza euclidea pari a uno: per esempio, dall'origine delle coordinate si muove con probabilità un sesto per andare, in un passo, ai punti (1,0,0), (-1,0,0), (0,1,0), (0,-1,0), (0,0,1), (0,0,-1); questa passeggiata è transiente, ma è comunque valida la legge forte dei grandi numeri (e qui la media è nulla)
A noi basta la dimensione uno perché 'sta roba ci serve a concettualizzare le serie storiche di dati. Ottimo allargamento di orizzonti, però...
Elimina@Blue:
EliminaHai ragione. L'enunciato che ho dato è giusto, ma non risponde alla domanda posta, risponde a un'altra domanda. Chiedo scusa. Devo aver applicato la nota tecnica di Sostituzione di Problema: invece di trovare la soluzione al problema posto, trova una soluzione a un problema simile ma più facile.
Al momento non so quale sia la risposta alla suddetta domanda; comunque, la radice quadrata di n non porta bene.
Osservo che per una passeggiata aleatoria semplice (cioè simmetrica) di dimensione uno, quale quella qui considerata, se indico con R_n la cardinalità dell'insieme formato da Y_1, Y_2, ..., Y_n, con la notazione usata dall'Autore di questa bacheca, cioè il numero di posizioni distinte occupate dall'ubriaco stocastico in n passi (le posizioni essendo numeri interi relativi), allora risulta che R_n/n, cioè il rapporto tra R_n e il numero di passi, converge a zero in probabilità.
@Fausto
EliminaIo direi che sum(Y_k)/k = (k*Z1+(k-1)*Z2+(k-2)*Z3+...+Zk)/ k
ossia Z1+(k-1)/k*Z2+....+Zk/k
Ad occhio è una passeggiata aleatoria con i passi che si restringono.
Nonostante i passi si restringano, temo non converga a 0.
Anzi, rifacendomi al commento di Alberto Lattuada (varianza di Y = somma delle varianze di Z), direi che la varianza continua ad aumentare ad ogni passo aggiuntivo, sebbene sempre più lentamente.
Come dicevo, ho fatto confusione, e ho risposto a una domanda più semplice.
EliminaOra rispondo alla domanda originale (spero!).
Osserviamo che, poiché le quantità Y_{k} sono le k-esime somme parziali delle Z_{i}, la media aritmetica delle Y_{k} si può scrivere in termini delle Z_{i} con una espressione che tutti i lettori del libro di Zygmund ``Trigonometric series'' ricorderanno, per averla vista nel capitolo 3 del primo volume. In verità la ricorderanno anche i lettori del libro di Wheeden e Zygmund ``Measure and Integral'', per averla vista nel capitolo 12. L'espressione ha a che fare con la ``sommabilità secondo Cesàro'' (da Ernesto Cesàro, matematico italiano). Indico, per ragioni tipografiche, con W_{k} questa espressione, che Alberto ha indicato con ``Y barrato (con pedice k)''. Sarebbe la ``media campionaria delle somme parziali di variabili aleatorie indipendenti e identicamente distribuite, che assumono i valori 1 e -1 con uguale probabilità''. Gal e Stackelberg hanno dimostrato che la W_{k} obbedisce a una forma della legge del logaritmo iterato: il limite superiore del rapporto tra W_{k}, e la radice quadrata del prodotto tra due terzi, k, e il logaritmo del logaritmo di k, converge a 1 quasi certamente (cioè per quasi ogni traiettoria). Quindi possiamo escludere che W_{k} converga verso lo zero per quasi ogni traiettoria.
Dunque, la media campionaria di Y segue una versione della legge del logaritmo iterato, quindi possiamo escludere che, quasi certamente, cioè con probabilità uno, cioè per quasi ogni traiettoria, converga a zero. Questo non esclude che, secondo la ``convergenza in misura'', o ``convergenza in probabilità'', che dir si voglia, il comportamento sia diverso. Ti serve conoscere anche la eventuale ``convergenza in misura''? Solo che ora devo andare a fare i piatti, mettere i panni in lavatrice, portare fuori il secchio dell'organico, dormire almeno qualche ora. Ma se ti serve saperlo, ci penserò sopra. :-)
EliminaBenvenuto! In effetti ti stavo aspettando, munito di paper dei quali io avevo capito solo la conclusione, e tu mi spiegherai... come ci si arriva!
Eliminaa domande rispondo:
EliminaAlberto: Benvenuto! In effetti ti stavo aspettando, munito di paper dei quali io avevo capito solo la conclusione, e tu mi spiegherai... come ci si arriva!
risposta: ti aiuto volentieri, se posso; dovrebbe esserti utile una particolare rappresentazione di questo processo stocastico, che se non mi sbaglio è stata usata da Khinchine per dimostrare la sua legge del logaritmo iterato; in questa rappresentazione, si costruisce esplicitamente uno spazio di misura Omega e una misura di probabilità su di esso, e si costruisce esplicitamente il processo stocastico in questione: lo spazio di misura Omega non è altro che l'intervallo [0,1], e la misura non è altro che la misura di Lebesgue. L'interesse di questa costruzione, che, se non erro, risale a Khinchine, sta nel fatto che, implicitamente, ma non esplicitamente, viene usato un "albero", che risulta comodo per visualizzare quasi geometricamente l'evoluzione del processo. Insieme all'albero viene usato il suo "bordo". Come dice il proverbio? "Non c'è albero senza bordo". Infatti, il bordo di un albero è isomorfo, come spazio di misura, all'intervallo [0,1], un risultato che è implicito nella Fisica di Aristotele, anche se naturalmente il Nostro non lo diceva con lo stesso nostro linguaggio.
@ Enrico Pesce et al: il punto, o, meglio, come direbbe Ingravallo, lo gnommero, è formato in buona parte da questo: il simbolo "infinito" andrebbe usato, il più possibile, e certamente in questi contesti, come "simbolo incompleto", secondo la terminologia che Russell e Whitehead hanno usato nei Principia Mathematica. Cosa sia un "simbolo incompleto" si capisce meglio riflettendo su cosa siano i "simboli completi". Ad esempio, "2" è un simbolo completo, che rimanda a un ben determinato ente concettuale, che vive cioè nel mondo delle idee, e che si può usare per generare (infinite) frasi, nei limiti dei normali vincoli sintattici e semantici; è noto infatti che la capacità generativa del linguaggio ci permette di generare infinite frasi. Invece, un "simbolo incompleto" è un simbolo che può essere usato solo all'interno di ben determinate frasi, e non altrove. Ad esempio, il simbolo "più infinito" può essere usato nella frase "il limite di f(x) quando x tende a più infinito", e poche altre: può essere usato solo all'interno di un numero (finito e) predefinito di frasi. Usare un simbolo incompleto come se fosse un simbolo completo produce catastrofi.
P.S. La legge del logaritmo iterato dice che, posto
a_n = la radice quadrata del prodotto tra i seguenti tre numeri
2, n, e il logaritmo del logaritmo di n
se Y_n è la posizione dopo n passi raggiunta nel corso di una passeggiata aleatoria semplice sugli interi (probabilità un mezzo di muoversi a destra di un passo, un mezzo di muoversi a sinistra di un passo)
allora il massimo limite del rapporto tra Y_n e a_n è uguale a 1, per quasi ogni traiettoria stocastica, cioè quasi certamente. Quindi il nostro ubriaco oscilla, ma c'è una logica nella sua oscillazione. Per simmetria, un enunciato analogo vale per il minimo limite.
@Alberto:
EliminaSe vuoi ti mando i dettagli della costruzione arborea. Si spiega tutto meglio con alcune figure.
I dettagli vengo a prendermeli insieme a qualche arrosticino! Torno oggi in Italia. Circa l'intervallo [0,1], questo mi ricorda appunto il modo in cui in econometria si studiano le distribuzioni asintotiche di regressioni nelle quali entrano random walks. Poi ne parliamo, così finalmente capirò quello che ho fatto negli ultimi 20 anni.
EliminaCon piacere!
EliminaTi avviso però che non so cosa siano le regressioni
(cioè ne ho una vaga idea: l'idea è che esiste una tendenza a "regredire" cioè a muoversi verso la media, ma è troppo poco).
A presto!
Prima sapevo di non aver centrato la risposta, ora ho capito di non capito la domanda. Effetto Dunning-Kruger.
RispondiEliminaIo vedo Y più vicino allo 0 dopo 50k lanci che dopo 100 (pensando al range di valori possibili +/-25k o +/-50).
EliminaAnche io temo di non aver capito la domanda. Mi consolo: mal comune...
LA STATISTICA
RispondiEliminaSai ched' e' la statistica? E' 'na cosa
che serve pe' fa' un conto in generale
de la gente che nasce, che sta male,
che more, che va in carcere e che sposa.
Ma pe' me la statistica curiosa
e' dove c'entra la percentuale,
pe' via che, li', la media è sempre eguale
puro co' la persona bisognosa.
Me spiego: da li conti che se fanno
seconno le statistiche d'adesso
risurta che te tocca un pollo all' anno:
e, se nun entra ne le spese tue,
t'entra ne la statistica lo stesso
perche' c'e' un antro che ne magna due.
Trilussa (Carlo Alberto Salustri), 1871-1950
salve prof., se vuole vedere una Parigi diversa, venga a Barbès e le mostro il quartiere della goutte d'or.
RispondiEliminaso che ha di meglio da fare, ma mi farebbe davvero piacere mostrarle il "mio" quartiere.
angelo
Abito lì (in cima a Magenta). Domattina volevo tentare un'incursione al Louvre, volevo vedere un po' di Rubens, sto a rota de cellulite, però se c'è una coda come stamani... Scrivimi!
EliminaIo veramente alla media campionaria delle Y c'ero arrivato, ma lì mi sono fermato. Sono curioso di vedere dove va a parare. Mentre leggevo i post sul cellulare (su uno sgangherato regionale Roma-Napoli, stavo andando a trovare mia madre) pensavo che stessero per introdurre la teoria delle aspettative razionali, quella simpatica teoria che, se non ricordo male, sosteneva che i soggetti che operano sul mercato hanno accesso a tutte le informazioni disponibili e le utizzano in media correttamente Insomma hanno in testa tutte le equazioni del modello di equilibrio e le risolvono, in media, correttamente. Da ciò l'inefficacia delle politiche fiscali, dato che gli operatori ne sconterebbero in anticipo gli effetti, e la necessità di limitare il ruolo della stato in quanto esso avrebbe solo effetti distorsivi sui comportamenti degli operatori. È da lì che sarebbe partita la devastante corsa del neoliberismo che tuttora imperversa. Ma forse non c'entra nulla e sto finendo fuori strada. E allora mi viene in mente il CAPM e le teorie delle scelte di portafoglio ma non so se c'entra qualcosa. Quello che ho capito di sicuro è che le mie nozioni di statistica e calcolo delle probabilità ormai tendono a zero come la media delle Y. Aspetto gli eventi.
RispondiEliminaDove vado a parare lo hai capito benissimo. Si vede che hai studiato alla Sapienza quando era la Sapienza...
EliminaGrazie per l'apprezzamento prof., io ho dovuto faticare come una bestia per laurearmi perché lavoravo e seguivo i corsi serali (quei pochi che c'erano, tra i quali quelli di De Vincenti), ma studiare l'economia non mi pesava e con gli esercizi di politica economica di Acocella ci andavo a nozze.
EliminaMi è venuta voglia di rimettermi a studiare (non è mai troppo tardi...)!
Saluti.
Azz... Allora ci hanno fregato le nostre aspettative irrazionali. Serve il "baro" statale per aggiustare le cose e portare i lanci della moneta in media zero.
EliminaFun... giocare, sbagliare, vincere... provarci... come in Borsa... ma.
RispondiEliminaLA STORIA ripete se stessa con pelle diversa... quindi ripasserá dall' origine piú e piú volte...
sei tu che segli la bisca e il tuo rischio Alfa... fatto ció usa la curva che vuoi, gaussiana, frattale, mandelbrot, quantica, weillbull... é un gioco e usa la densitá di popolazione prevista tramite carta xr...almeno 4 livelli...anche se i geni ltcm si divertirono fino a 26 sigma... trascura i cigni e credi nel random...ma attento é tutto un grande fratello.
La raccolta dati in possesso e il timing ti diranno dove la fisch ha piú possibilitá.
buon divertimento...ma vince il banco sempre.
Non sono abituato ad affrontare questo tipo di problemi, ma visto che questi post sembrano la una palestra del dilettante, azzardo la mia.
RispondiEliminala media del lancio delle monete (X) , su un INFINITO numero di lanci è uguale a zero.
Su PICCOLE SERIE invece non è determinabile, esse possono essere, al limite, composte di tutte teste o tutte croci; poiché il grafico della funzione Y dipende dai risultati dei lanci precedenti (che sono casuali) è indeterminabile. Anche se un infinito numero di funzioni Y dovrebbe essere a somma zero.
Sono ignorante e quindi sono.
RispondiEliminaProf. non posso seguirla nei ragionamenti matematici in quanto mi mancano le basi. Ho fatto il classico tanto tempo fa.
Comunque la Y dovrebbe essere 0.
Non capisco perché lei avvicina l'esito di un fatto casuale, la moneta tirata in aria, alla teoria dei mercati efficienti di Fama, che nulla dovrebbe aver a che fare con la passeggiata aleatoria.
O forse fa riferimento al fatto che l' igNobel è stato attribuito contemporaneamente a colui che parla delle esuberanze irrazionali.
Forse che la coda grassa c'è anche quando assegnano il Nobel?
Forse so' de coccio.
Non ho capito se il post è finito o se continua.
Perché io capisca la conclusione deve essere teratera, Espertone mode off.
Ci sono libri con formule. Io preferisco quelli senza formule, anche se talvolta non capisco neanche quelli.
Nicobra
Riposto il mio commento non apparso (misteri della rete) sul thread precedente.
RispondiEliminaNon è Y che tende a zero, anzi Y coll'aumentare dei lanci può assumere valori sempre più grandi o meglio tenderà ad oscillare per valori sempre più grandi sopra e sotto l'asse delle ascisse
E' la relazione tra Y ed il numero dei lanci che tende a zero in conseguenza ed a conferma della eguaglianza delle probabilità dei due diversi esiti (testa o croce).
Buon pomeriggio a tutti! Direi questo: non c'è convergenza neppure in probabilità poiché oltre a non avere le ipotesi i.i.d. non c'è neppure la stazionarietà (come lei dice professore la varianza esplode!) quindi non c'è alcun teorema che garantisca la convergenza della media campionaria verso il valore atteso (come credo invece avvenga per i processi autoregressivi). A parte questo, anche io abito a Parigi accanto al père Lachaise, se per caso vi vedete da qualche parte e se non disturbo fatemi sapere!
RispondiEliminaC'è qualcosa che non mi torna, sia in una frase di "Passeggiata aleatoria (1)", sia nell'affermazione riportata di Fausto di Biase.
RispondiEliminaIn "Passeggiata aleatoria (1)":
"Ma cosa succede? Succede che la somma di tante variabili a media zero in realtà non si comporta come una variabile a media zero, ma come una variabile che cresce seguendo una tendenza più o meno lineare, simile a quella di molte variabili economiche."
Sono d'accordo con questa frase se va intesa come "Cosa succede *in questo esempio*?".
Non sono d'accordo se invece la si intende come "sarà sempre vero che ci sarà una crescita lineare".
Una apparentemente simile affermazione è quella di Fausto che dice:
"Dopo n passi, il nostro ubriaco stocastico (senza offesa parlando) si trova a una distanza dal punto di partenza pari a circa la radice quadrata di n."
Questa affermazione sembra suggerire che la passeggiata tenderà verso la radice quadrata di n, ma non è così.
La meta attesa della passeggiata aleatoria, la media di Z, i valori attesi di Yt nonché di ∑Yt (anche per t molto grande) sono tutti 0 (al tempo zero).
Quello che cambia nella nostra previsione al tempo zero è che più passi faremo, più aumenta la varianza di Yt.
In altre parole Y1000 ha "media" 0 tanto quanto Y100, però avrà una varianza maggiore, ossia una "dispersione" maggiore attorno allo zero.
In altre parole: Y1000, rispetto a Y100, potrà più facilmente finire lontano di X unità dallo zero (dove X è un numero a piacere).
Le affermazioni che non mi "tornano" sopra, invece *sembrano* voler affermare che Y1000 "debba" finire lontano da 0.
E' vero che all'aumentare di t ci sono più possibilità di andare lontano di X unità, ma la meta "preferita" (più probabile) partendo da 0 è sempre 0 (l'ubriaco barcolla ugualmente verso destra e verso sinistra).
Il discorso di zero come meta "preferita" ovviamente vale solo al tempo zero (prima di aver lanciato la moneta).
Cambia invece la meta "preferita" (le nostre aspettative) quando non ci troviamo più al tempo 0, ma siamo ad esempio al tempo 50 e Y50 è, ad esempio 6.
Una volta arrivati per caso a 6 dopo 50 passi, ci dobbiamo aspettare che nei prossimi 10,100 o 1000 passi continueremo a barcollare attorno a questo numero (e non torneremo necessariamente allo zero) perché, come abbiamo detto prima, l'ubriaco barcolla ugualmente verso destra e verso sinistra.
PS: Sia la frase in Passeggiata aleatoria (1) che il messaggio di Fausto possono essere in realtà interpretate esattamente come la mia frase " Y1000, rispetto a Y100, potrà più facilmente finire lontano di X unità dallo zero" però a me sembravano ambigue ed ho volute "chiarificarle" (forse solo a me stesso).
PS2: Ora mi arriva il morso del crotalo..
Quindi la causalità dell'agente c'è e con esso la speranza del libero arbitrio.....pare.
RispondiEliminaPer chi volesse visualizzare la "varianza" di Y che aumenta, ho creato alcuni grafici:
RispondiEliminaGrafici varianza all'aumentare di t
Seguendo la metafora dell'ubriaco (che barcolla ad ogni passo con eguale probabilità a destra ed a sinistra), i grafici mostrano dove finiscono 100000 ubriachi se barcollano per 10, 25, 50, 100, 250 o 500 passi.
Nel primo grafico, gli ubriachi, barcollando per soli 10 passi non finiranno molto distanti da dove sono partiti (lo zero).
Alcuni di loro faranno un po' più di passi a destra, alcuni un po' più di passi a sinistra, ma in genere molto pochi (nel grafico nemmeno si vedono) faranno tutti i passi a destra (+10) o a sinistra (-10).
Nei grafici seguenti il ragionamento generale rimane valido: poiché barcollano ugualmente verso destra o verso sinistra ad ogni passo, tenderanno a mantenersi al centro (media attesa = 0).
Però, con l'aumentare dei passi, aumenta la varianza, ossia aumenta la dispersione attorno al punto di partenza.
Mentre con soli 10 passi era molto raro che qualcuno si trovasse a +10 passi verso destra (perché avrebbe dovuto farli tutti e 10 nella stessa direzione), quando aumentiamo il numero di passi diventa sempre più facile che qualcuno faccia una decina di passi in più verso uno dei due lati.
Nell'ultimo grafico, con 500 passi, diventa addirittura "comune" trovare degli ubriachi ad oltre 10 passi dal centro ed in alcuni casi persino a 20 e più passi.
Quindi, sebbene la media rimanga zero, all'aumentare dei passi, diventa sempre meno probabile che all'ultimo passo ci si ritrovi esattamente al centro.
...in effetti se chiamo K(X) il primo tempo per cui
EliminaY_k =X
(dove X continua a essere un numero a piacere) allora la probabilita' che K(X) sia finito e' uno (anche se la sua media e' infinita).
All'elenco del Prof. Di Biase aggiungerei libro di Williams "Probability with martingales" che se non ricordo male era molto chiaro.
Ecco, vedo che state uscendo allo scoperto! Sì, 'sta cosa delle martingale evidentemente c'entra, dato che la vita è tutta una scommessa, come poi ci diremo meglio. Grazie!
EliminaBeh, piu' che altro 'sta cosa delle martingale c'entra perche' una passeggiata aleatoria e' una martingala (ovvero un processo casuale che si "ricorda" di tutti i passi precedenti).
EliminaVorrei aggiungere un'osservazione:
attenzione a non farsi fregare dall'infinito!
Quale mai dovrebbe essere "l'ultimo passo"?, che vuol dire (come ho letto non mi ricordo piu' da chi) che uno puo' essere "a dieci passi dall'inifinito"?
E ancora.
Siccome X nel discorso sopra e' un numero a piacere nessuno mi vieta di pensare che sia X=0; quindi so che in un tempo finito ci ritorno (se e' per questo ci ritorno infinite volte...), ma ho per caso detto quanto e' grande 'sto primo tempo finito?
L'infinito e' una roba delicatissima: maneggiare con cura.
(Mathematicus dormiens non est excitandus...)
E certo che una random walk è una martingala, siamo d'accordo! E siamo d'accordo anche sul resto, va da sé. Quanto all'eccitazione, ti ricordo che la forma espressiva del social è il flame, e io sono l'accendino. Magari se mi date una mano, invece di battervi il belino... Grazie!
EliminaTi chiedo scusa: le osservazioni sopra erano per chiarire una questione che mi pareva stesse sviando piu' di qualcuno, ovvero tentavo (goffamente!) di dare una mano.
EliminaEvidentemente l'ho fatto in modo inappropriato: se e' cosi' mi dispiace.
No, assolutamente no, anzi, hai fatto benissimo. Certo che erano sviati, molti. Ora piano piano li rimettiamo sul sentiero. Grazie!
EliminaIl mio penny (per evitare fraintendimenti sulla valuta) sui lanci delle monete, tanto io sono un beato.....
RispondiEliminadopo una sequenza di n lanci le 2^n sequenze di risultati sono tutte ugualmente probabili, ma il numero di serie dove il numero delle teste è pari a quello delle croci è n!/((n/2)!*(n/2)!) [considerando n pari], quindi la probabilità che dopo n lanci il numero di teste sia pari a quello delle croci è il rapporto tra questi due valori.... e adesso vado a magnare....
Lo ammetto, i logaritmi a confronto so stati na passeggiata
RispondiEliminaTranquillo, ora ci mettiamo anche quelli. Qua nun se butta gnente...
EliminaHo provato a giocare col tasto di Dio (f9, su libreoffice calc), però con una moneta "sbilenca", o fortemente truccata. Le probabilità di testa o croce non sono più (.5,.5) ma (.1,.9) ... (.9,.1). Ho provato a simulare per (d, 1-d); d=.5 è il testa o croce.
RispondiEliminaDa 5000 a 100000 estrazioni non cambia molto. Vengono delle belle rette interpolatrici Y = 0.5-d.
senza formule matematiche si può dire che se lancio la moneta infinite volte tende a zero la differenza di croci e testa? Mentre se si prende un periodo di riferimento determinato la probabilità di essere scostati su più croci o più testa aumenta all'aumentare della durata del periodo, cioè: nel breve periodo la differenza è minima e nel lungo periodo la differenza è più ampia??
RispondiEliminaStavolta sono arrivato tardi a lezione (ma non avrei saputo la risposta).
RispondiEliminaPerò il problema originario mi ha evocato i propagatori di Feynman nei sistemi a molte particelle: anche lì si tratta di vedere se le perturbazioni "convergono"...
Prof,ora capisco il perche lei abbia bisogno di buon vino e di tanta buona musica.
RispondiEliminaAnche impiegando una intera vita non ci capirei na beneamata
Troppo carine queste divagazioni, è un piacere leggere questo blog. Dopo economia, musica, letteratura, isolati accenni di biologia sistematica, anche i giochi matematici. Ma come si fa a fidelizzarmi di più?
RispondiEliminaSpiegandoti il nesso. Poi ci provo.
EliminaProf, ma possiamo usare la regressione lineare per fare la previsone se R^2 è prossimo a 1?
RispondiEliminaFINALMENTE! Qualcuno ha capito dove stiamo andando, solo che purtroppo... chi ha capito quello che ha detto? Mettete una croce qua sotto... Ma tu mi sei già saltato da Fama a Granger. Il percorso adesso è: Lucas, Trilussa, Fama, Granger, quindi la risposta (che è NO), arriva fra qualche giorno.
EliminaSinceramente io Lucas, Trilussa, Fama, Granger non li conosco, ho solo fatto la considerazione che se il coefficiente di determinazione è 1 il modello può essere considerato attendibile per una previsione.
EliminaSe i numeri fossero una grandezza fisica (per esempio una temperatura) credo che mi potrei fidare del modello per prevedere la sua evoluzione in un tempo non troppo distante. Ma qui non siamo proprio nel mio campo (credo abbia capito qual'è) e quindi me ne torno a scervellarmi.
Saluti
Ha detto che la regressione lineare è, in un certo senso, frequentista? :)
EliminaPenso che intenda dire che usare una regressione per estrapolare la tendenza futura dell'andamento della variabile aleatoria, sia al tempo t che al tempo zero è del tutto fuorviante, in quanto la direzione è del tutto casuale (con distrub. di probabilità dicotomica) e che il grafico rispecchia solo l'aumentare della varianza dal suo valore centrale(detto valore atteso e non a caso anche "speranza matematica" che è zero). Credo che sia un esempio di come potrebbe ragionare il piddino che è in noi guardando a prima vista il grafico e i suoi valori. Questo è quello che ho capito fino adesso dai vari contributi
Elimina@Simone RE
EliminaMa il modello lo conosciamo a priori, è il lancio ripetuto di una moneta non truccata e l'analisi di quel modello ci dice che l'andamento di Ȳt non è in generale descrivibile come una funzione lineare di t. Mi pare quindi un errore concettuale usare una regressione lineare per descrivere l'andamento di Ȳt.
Ossia, come in una forma o nell'altra si legge nel disclaimer di qualsiasi prodotto finanziario che non sia a rendimento fisso, "la performance passata non è indicativa dei risultati futuri".
Esatto. Il piddino che è in noi, come forma le sue aspettative? Non è mica una domandina da poco...
EliminaScusate, sono beatissimo. Ma in che senso l'R^2 è prossimo a 1?
EliminaCon un paio di migliaia di repliche dell'esperimento l'R^2 mi si distribuisce così (indipendentemente dal numero di lanci); i relativi r invece così.
O forse si sta parlando di tutt'altra cosa? :-s
Penso meramente per induzione visto che l'elemento deduttivo viene rimosso per una sorta di ipnosi collettiva mediatica. Mi ricorda l'allegoria del "tacchino induttivista" che si aspetta che anche il giorno del ringraziamento l'allevatore gli porti da mangiare come tutti gli altri giorni. Vuol dire che faremo la fine dei tacchini? Tutto torna.
EliminaSi sta parlando del fatto che non esistono mille repliche del tasso di cambio lira/dollaro dal 1945 al 1998, ad esempio...
EliminaSarà mai che laddove il filosofo (nella fattispecie il matematico e lo statistico) accecato dalle sue criptiche formule e dai suoi astratti teoremi non riesce a vedere che una passeggiata aleatoria l'ingegno superiore del piddino riconosce immediatamente un trend?
EliminaPerò la moneta lanciata o la ruota della roulette dei trend del piddino se ne battono il belino (cit.) essendo le loro sortite indipendenti da tutto, e il piddino che si reca al casinò (come il filosofo e chiunque altro) ne uscirà più spesso alleggerito che appesantito.
Ma nel caso dei mercati la storia mi sembra più complessa perché non siamo solo osservatori ma anche agenti, e il trend intravisto dal piddino contribuirà insieme a tutta l'informazione (che ipotizziamo completa ed esatta) a determinare l'esito al tempo t+1.
E mi aspetto che, in conseguenza di ciò, quello che in un mondo popolato unicamente da filosofi sarebbe rigorosamente un random walk, in un mondo in cui agiscano anche piddini (e naturalmente tante altre specificità) random-walk non lo sia più.
E qui mi fermo perché davvero non so se sbagli di più il filosofo o il piddino.
A proposito della formazione delle aspettative (di piddini?) e degli inganni/autoinganni, potrebbero essere interessanti i seguenti grafici.
EliminaImmagine 1
Nella prima immagine vediamo i grafici di 30 repliche di 2000 lanci di una moneta.
I grafici sono disegnati usando tutti la stessa scala e non sembrano molto interessanti.
In genere tendono a rimanere attorno allo zero, come ci aspetteremmo da una moneta non truccata, sebbene possa tranquillamente capitare che su 2000 lanci, a volte ci sia uno sbilanciamento tra teste e croci.
Nella vita però non sempre abbiamo la possibilità di osservare 30 repliche di uno stesso fenomeno.
Di solito abbiamo a disposizione una sola serie, ossia ciò che è effettivamente avvenuto nel nostro passato.
Cosa succede quindi se, anziché usare una scala delle Y che va bene per tutte le repliche, noi usassimo per ogni grafico una scala delle Y diversa, "adatta" al singolo grafico?
Immagine 2
Nella seconda immagine vediamo le stesse serie di lanci di prima, solo che in questo caso i grafici sono stati disegnati ognuno con la propria scala, come se non fossimo a conoscenza degli altri grafici.
Come si può vedere adesso sono molto più evidenti picchi, valli ed altri andamenti che potrebbero sembrare "significativi".
E se noi non sapessimo che questo è solo un banale lancio di monetine?
Se pensassimo che invece di essere casuale, questo processo abbia invece una qualche causa che lo sta spingendo verso l'alto o il basso?
Allora, forse, nel tentativo di capire "dove sta andando a parare" questo processo, forse proveremmo anche a disegnare una retta che ci indichi la direzione..
Immmagine 3
Ed ecco che l'inganno è compiuto, da un processo aleatorio che non sta andando da nessuna parte ora abbiamo dei bei grafici "significativi" che potrebbero essere scambiati per grafici di azioni, obbligazioni, PIL.. :)
@ Blue.
EliminaSospetto che il prof non stia andando in questa direzione, ma mi piace notare che già con duemila lanci il "trend" risulta quasi sempre significativo (p<.05, e più sono i lanci, più è probabile che lo sia). E cosa ancor più sorprendente (per me) è che la porzione di varianza spiegata (guardando l'R^2) spesso non sia poca, ma si distribuisca tra 0% e 100% in un modo che a me pare uniforme o quasi.
@Henry
EliminaSto grafico è fichissimo.
Grazie :-)
EliminaPoi non so se ha senso, ma ho provato anche a guardare la "storia di un R^2", cioé ricalcolandolo ogni volta da t=1 fino a t=n. E questo è un esempio a caso della storia di un R^2 fino al cinquecentesimo lancio della moneta.
(Poi boh. Ma davvero si può calcolare un modello di regressione quando ciascuna osservazione "ricorda" le precedenti? Io so' psicologo, e beato, queste cose non mi capitano.)
@Henry
Eliminanon so che test statistico hai usato, ma in quei pochi che mi è capitato di usare spesso si suppone che le osservazioni siano indipendenti, ed in questo caso non lo sono affatto (il valore di Y100 dipende fortemente dal valore di Y99).
Chiaramente violando le assunzioni, il test inizia a prendere fischi per fiaschi sul valore di probabilità.
Nel grafico di R^2, cosa hai messo sulla ascissa? (Sono solo distribuiti lateralmente per non ammassarli troppo?)
A me non sembra uniformemente distribuito, sembrano esserci molti punti ammassati sullo zero e ad occhio (che inganna) forse una densità maggiore tra 0.6 ed 1.
I punti ammassati vicino allo zero forse provengono dalle volte in cui il trend è rimasto piatto, per cui finisci per tracciare una retta orizzontale che non ti spiega nulla (credo).
Questo è ancora più fico. Sento che dovrò presto parlarvi di regressione spuria...
Elimina@Blue
EliminaHai ragione, ma hai anche torto. Nel senso che sì, la mancata indipendenza delle osservazioni inficia la validità di test tipo t di Student, perché di fatto le stime della matrice di covarianza dei coefficienti di regressione sono distorte, non rispettando le ipotesi di Gauss-Markov. Però... se il modello "vero" fosse una tendenza deterministica cui si somma un disturbo stocastico indipendentemente distribuito (o anche semplicemente incorrelato)?
Ci sei, vero? Gli altri seguiranno...
Mi pare di capire che il piddino, pensa che possiamo essere tutti come Casanova, senza però capire che: Casanova è sopravvissuto per poterci raccontare la sua storia, mentre il piddino finirà accoltellato dal marito delle cortigiana. Che è poi la storia dell'infame conio, o no?
Elimina@Blue
EliminaSì, nel grafico dell'R^2 sono solo distribuiti lateralmente, per non ammassarli. Per dare un senso all'ascissa avrei potuto variare il numero dei lanci della moneta. Se volete, e se il computational power mi assiste, ci provo, ma sono abbastanza sicuro che non cambi. Ho già visto che va sempre così a 10, 100, 1000 lanci di moneta...
Anche sì, c'è un certo ammasso verso lo zero, e infatti che l'R^2 medio e mediano non è .50, ma .44. Non so perché, ma non è un caso.
La morale della storia dell'R^2 (qui un altro esempio fino a 2000 lanci) mi pare che sia che l'R^2 continua a ondeggiare senza mai convergere da nessuna parte... C'è solo che al passare dei lanci, per comprensibili (?) ragioni le oscillazioni diventano sempre più lente e lunghe.
@prof.Bagnai
EliminaNo, confesso, purtroppo non ci sono, le mie nozioni di statistica sono ad un livello molto più basso: le ipotesi di Gauss-Markov non le conosco e le matrici di covarianza le ho incontrate solo di striscio fino ad adesso.
Onestamente non ho capito dove mi vorrebbe condurre con la domanda "se il modello "vero" fosse una tendenza deterministica cui si somma un disturbo stocastico indipendentemente distribuito (o anche semplicemente incorrelato)?".
Intende dire che se si riuscisse a comprimere l'apparato normativo nel campo economico lasciando che "le masse" agiscano come mercato, avremmo una banca dati immensa (statistiche fmi, ocse, etc etc, feisbuk etc etc e altri vari...) che ci darebbe (se noi fossimo i padroni del vapore certo) in linea di massima l'indirizzo verso il quale andrebbero i consumatori e quindi il denaro?
RispondiEliminaOT indovinello senza formule: perché vine voglia di fare la pipi quando si esce al freddo?
RispondiEliminaUna bella serie di post. Solo un avvertimento, la funzione usata dai fogli di calcolo non è randomica ma solo pseudorandomica.
RispondiEliminaA un cordiale grazie a quest'oca di benvenuto aggiungo il fatto che di questo si è già discusso in un commento, e ti garantisco che non cambia molto l'essenza del problema... Stay tuned!
EliminaInnanitutto il lancio di una monetina è di sinistra così come di sinistra sono le dinamiche stocastiche, il caos ed i modelli statistici che si possono risolvere perfettamente. L'Economia, l'ingegneria gestionale e le scienze politiche sono invece di destra come dimostrato dalla grande presenza di Ciellini nei rispettivi gruppi di ricerca.
RispondiEliminaBene, ora mi metto in cattedra col rischio di dire fesserie e farmi prendere del coglione. Del resto sono un semplice studente di PhD (ventottenne ricercatore schiavizzato).
La probabilita` di ritorno allo zero di un cammino aleatorio va come P_r=1/t^(d/2) dove d è la dimensionalità dello spazio in cui il cammino avviene, per comprendere cio` basta pensare al fatto che le dimensioni possono essere fattorizzate e la probabilita` di essere nell'origine al tempo t va` come 1/"la distanza percorsa dal walker" alla "numero di dimensioni".
Perche` e` importante la probabilita` di ritorno? Perche` essendo il random walk un processo markoviano ogni volta che si ritorna all'origine e` come ricominciare il processo da capo quindi se siamo sicuri che il processo ritorna all'origine (in un tempo finito) allora possiamo sostituire le medie temporali con le medie nello spazio delle fasi (praticamente le medie su un numero grande di simulazioni) e siccome il processo e` simmetrico rispetto alla trasformazione Z -> -Z, Y -> -Y allora tutti i momenti dispari sono nulli e la "media campionaria" e` quindi nulla. Discorso diverso ovviamente per i momenti pari (che crescono nel tempo per il semplice motivo che non possono calare).
In d < 2 il processo ritorna all'origine infinite volte perche` t*P_r diverge con t grande.
Prof, probabilmente la risposta è stata già data ma nella moltitudine di commenti non la vedo. La media campionaria (in assenza di barra me la faccia chiamare Y*) NON converge a 0.
RispondiEliminaSappiamo che Y_n = Y_(n-1) + Z_n
Y* per definizione è la somma delle Y_j divisa per n
Svolgendo esplicitamente la somma delle Y_j e scrivendola in funzione delle Z_i,
abbiamo che tale somma è pari a n*Z_0 + (n-1)*Z_1 + ... + 1*Z_n
Dividendo la somma per n otteniamo
Y* = Z_0 + (n-1)/n Z_1 + ... + Z_n/n
E' del tutto evidente che questa cosa NON può convergere in probabilità a 0. Ora, ci sarà sicuramente un argomento straightforward, ma io sono arruggininito e non mi viene in mente quindi vado per assurdo.
Se tale serie convergesse a 0 (in P), a maggior ragione convergerebbe la serie gemella Y** = (n-1)/n*Z_n + (n-2)/n*Z_(n-1) + ... + Z_1/n. (è il "negativo" della nostra serie).
Ma... Y* + Y** = Y_n !! Quindi se Y* convergesse a 0 (in P), lo dovrebbe fare anche Y_n. ABSURDUM
Amico, tu vuoi tanto una risposta, e io te la darei anche, se almeno sapessi mettere le parentesi. Alla a-Normale le mettete così? Vola basso.
EliminaNon so a cosa si riferisca, ma può essere che ci siano typo/imprecisioni di notazione. In tal caso mi scuso, ed anzi me ne dolgo, se ciò la trattiene dal continuare un discorso molto interessante!
EliminaQuanto all'arguzia "a-Normale"... non l'avevo mai sentita :)
Provo a rispondere alla domanda sulla media campionaria delle Y_t:
RispondiEliminaLa somma
Y1+Y2+Y3+...+Yt
la possiamo scrivere così:
tZ_1+(t-1)Z_2+(t-2)Z_3+...+2Z_(t-1)+Z_t
divisa per t mi dà
Z_1+[1-1/t] Z_2+...+[2/t]Z_t
che chiaramente non convergerà mai a zero (si comporta come Yt, solo che cresce un po' più lentamente).
La faccio semplice (troppo?).
RispondiEliminaRiscrivo Y. (Spero che la notazione di sommatoria, per quanto orrenda, sia comprensibile).
Y(t) = Y0 + somma[j=1:t](X(j))
Dove Y0 = 0
Caio, che ha le informazioni al momento j = 0, vede Y = 0 e un valore atteso pari a 0.
Al momento j1 il fenomeno è osservato da Tizio.
Y(t) = somma[j=1:j1-1](X(j)) + somma[j=j1:t](X(j))
La prima somma è nota a Tizio; è una costante, cui assegna il valore Y(j1-1), quindi
Y(t) = Y(j1-1) + somma[j=1:t](X(j))
Tizio che ha le informazioni al momento j = j1 vede Y = Y(j1-1) e un valore atteso pari a Y(j1-1).
L'equazione è la stessa , ma la variabile Y, a differenza di X, possiede MEMORIA, proprio per come è definita.
Di chi mi devo fidare? Ovviamente di Tizio, che ha PIU' INFORMAZIONI di Caio.
Mi azzardo a tradurre per goofynomics: il piddino non studia il passato: per X gli è andata bene, ma per Y ... sara un bagno di sangue !!!
NOTA:
Prima di postare sono andato a controllare se altri avevano dato una soluzione analoga. Temo che il nuovo post (Il keynesianesimo ...) includa (in modo assai più rigoroso) quanto ho scritto ...
Se è ancora interessato, posso darle anche una dimostrazione più generale, che si basa su una versione del Teorema del limite centrale applicabile a variabili indipendenti, ma NON necessariamente identicamente distribuite... mi dica lei.
RispondiEliminahttp://en.wikipedia.org/wiki/Lindeberg's_condition
(occuparsi di ciò mentre si frequenta una Business School è come bere sorsate di acqua fresca... no bullshitting in mathematics)
Sì, ma dimostrazione però di cosa? Siamo sicuri che ci siamo capiti su quale convergenza mi interessava? Hai visto le altre osservazioni di Fausto? Magari apriamo un tavolo tecnico, come direbbe un sindacalista, perché la cosa mi interessa (anche se non devo fare un uso creativo della matematica, umile servo nella vigna del Signore).
EliminaDi seguito ciò che io ho compreso:
RispondiEliminaLA SUA DOMANDA: E' vero o no che la media campionaria delle Y converge a 0 in probabilità?
IN FORMULE: E' vero o no che (Y_0 + Y_1 + ... + Y_t) / t ---> 0 in probabilità per t ---> +inf. ?
Mi conferma che la domanda è questa?
La risposta mi pare proprio NO; una possibile dimostrazione è quella del mio messaggio del 2 marzo ore 20.37.
Leggendo i messaggi di Fausto, mi par di capire che lui giunga alla conlcusione corretta di non convergenza quasi ovunque, che però è più debole della non convergenza in probabilità... quindi gli manca un "piccolo step" (messaggi del 3 marzo ore 00.30 - 00.49)
(è più debole perché esistono successioni non convergenti quasi ovunque ma convergenti in probabilità)
Se mi dà l'ok a tutto ciò, e le interessa un argomento più generale sulla convergenza di variabili indipendenti, posso procedere a darle una seconda dimostrazione. (cioè una versione "avanzata" del limite centrale, anch'essa parzialmente citata da Fausto)
Per intanto... buona serata!!
Sì, hai capito la domanda e io avevo intuito la risposta. Mi sembrava che chi la faceva semplice non avesse capito la domanda. La dimostrazione mi interessa, poi apriamo un tavolo tecnico, ma non so quanto riuscirei a capirla. L'intuizione che do ai miei studenti è che un risultato di questo tipo ha qualcosa a che vedere con la non esistenza (diciamo: la divergenza) del momento secondo di Y(t), però... dopo avervi letto son sicuro che questo è solo un pezzo della storia (e forse non è nemmeno quello importante). Grazie mille, vai pure avanti.
EliminaChiedo scusa per il ritardo nel commento (chi il lavoro ce l'ha....). Grazie alla splendida lezione del prof. ho fatto questo che consiglio (non che il file Excel non fosse chiaro). Il MIT è sempre un bel posto, soprattutto questo programmino per imparare a programmare in tenera età, evoluzione dell'antico LOGO. Professor Bagnai, insegni Scratch ai suoi bambini... che in certi casi l'economia e la matematica, e persino il clavicenbalo, possono attendere.
RispondiEliminaLLN : Lotta liberazione nazionale!
RispondiEliminaNon so a che punto sia la discussione e non ho le basi matematiche per seguirla però, a costo di andare off topic volevo dare questo contributo. C'è un esperimento che va avanti da 15 anni. Hanno lanciato la monetina un bel po' di volte e seppure con un po' di diffidenza ogni tanto vado a dare un'occhiata al sito. Questo blog è un grande spazio di coscienza collettiva.
RispondiEliminaNon ho ben capito se la questione è stata risolta, al limite aggiungo niente di nuovo...
RispondiEliminaLa variabile causale Y_n data dalla somma di n variabili Z è una distribuzione binomiale con media
E[Y] = nE[Z] = 0
e con varianza
V[Y] = nV[Z] = 0.25n
All'aumentare di n la varianza aumenta e pertanto all'aumentare di n diminuirà la probabilità a convergere al valore atteso (valore medio). Y_inf ha valore medio nullo e varianza infinito. Le funzioni di distribuzione con varianza infinito ha la bella caratteristica che gli esperimenti non convergono mai a nessun valore (es. Pareto con alpha=2).
Provo a mandarle un documento Word con le dimostrazioni relative perché è difficile farlo nei commenti...
Un abbraccio
Equivoco diffuso, in cui e` caduto anche Eragon 1964: la domanda NON era relativa al comportamento di Y_n ma di "Y barrato _n".
RispondiEliminaLa questione si risolve [1] osservando che un calcolo immediato mostra che la funzione caratteristica di "Y barrato_n" converge verso la funzione che vale 1 in zero e zero altrove, che non e` una funzione caratteristica. Ne segue che "Y barrato_n" non puo` convergere in legge e quindi neanche in probabilita`.
Ribadisco che per la successione "Y barrato_n" vale la legge del logaritmo iterato, come dimostrato negli anni cinquanta e sessanta.
[1] P. Baldi. Comunicazione personale, 3 aprile 2014.
Caro Fausto,
RispondiEliminami ero perso la questione dell'Y_barrato, ma le cose non cambiano tanto. Mi spiegherò dopo. Secondo me l’utilizzo del logaritmo iterato non è opportuno in questo contesto perché porta a conclusioni errate a mio modesto parere, ma anche se portasse a conclusioni giuste, mi sembra il classico caso dell’”ufficio complicazioni affari semplici”. La questione può essere semplicemente esaminata utilizzando la somma di variabili casuali, più semplice.
Infatti sia definita Z una variabile casuale con distribuzione discreta [-0.5, 0.5] e probabilità [1/2, 1/2] con media nulla e varianza 0.25.
La variabile casuale Y_n definita come somma{k=1,n}(Z_k) avrà media nulla e varianza 0.25n. Essa è una distribuzione discreta di tipo binomiale avente n+1 punti tra [-0.5n … 0.5n]. Pertanto all’aumentare di n l’intervallo della funzione aumenta ed anche la varianza. La cosa si può vedere dai grafici pubblicati dal Professore dove abbiamo sempre sequenze diverse. All’estremo per n-->infinito la distribuzione sarà definita nell’intervallo ] –inf, +inf[ con varianza infinita, che appunto ci dice che generando n sequenze diverse avranno sempre comportamento diversi.
La variabile casuale Y_barrato_n definita come Y_n/n avrà sempre media nulla e varianza 0.25. Essa è sempre una distribuzione di tipo binomiale avente n+1 punti nell’intervallo [-0.5, 0.5]. Questa distribuzione all’aumentare di n non cambia l’intervallo di definizione e neanche la varianza, ma aumentano i numeri di punti su cui è definita. Portando la cosa all’estremo, cioè per n-->infinito, avremo una distribuzione continua uniforme definita nell’intervallo [-0.5, 0.5]. Cioè avessimo scritto in un foglio Excel “=RAND()-0.5” avremmo ottenuto lo stesso risultato. Ovviamente non gli stessi numeri, ma lo stesso comportamento (stiamo parlando di variabili stocastiche). Provare per credere… e poi mi dici… :D
Così è se vi pare… e se non vi pare così è lo stesso, perché la matematica, come l’economia, non è un’opinione…
Poi io non ho ben capito a cosa puntasse il Professore con questo (o mi son perso qualcosa o non l’ha detto), comunque tutto questo va trattato con molta cautela. Per esempio se di una sequenza n, di cui sono noti m valori (ora eventi certi), si possono usare le funzioni sopra per calcolare il comportamento della sequenza n-m. Ma se non sto attento nell’utilizzarle, potrei entrare in un paradosso matematico. Ma questo è un’altra storia…
Un abbraccio.
Caro Eragon 1964
RispondiEliminacontinui a fare confusione nella definizione di Y^barrato_n, che e` la v.a. che interessa il prof. Bagnai. Tu definisci la suddetta v.a. come il rapporto tra Y_n e n, ma questa definizione non e` quella giusta (come spiegato a chiare lettere dall'interessato). La definizione giusta e` "il rapporto tra la somma dei primi n termini della successione Y_k, e n". Per inciso, osservo che il risultato NON e` una binomiale, come si puo` vedere ad esempio calcolandone la funzione caratteristica.
Naturalmente e` difficile per chiunque escludere a priori che ci siano dimostrazioni piu` brevi di quella che viene proposta in un dato momento. Pero`, a parte il fatto che quella che ho indicato (del fatto che la successione Y^barrato_n NON converge a zero in legge e quindi neanche in probabilita`) NON e` particolarmente complessa, in quanto utilizza i fatti piu` fondamentali del calcolo delle probabilita`, una dimostrazione piu` semplice dovrebbe in primo luogo partire dalla definizione corretta dei termini della questione.
Cordialmente.
Fausto
Questo commento è stato eliminato dall'autore.
RispondiElimina