venerdì 21 febbraio 2025

C’è un informatico in sala?

In questi minuti registro nel blog un picco di traffico anomalo:


L’ultimo post non sta poi attirando così tanto traffico: è solo una glossa su un tema relativamente laterale. Guardando le statistiche dei contatti per minuto vedo questo:


I contatti riguardano per lo più vecchi post, non dei più letti. O qualche sito molto frequentato li ha messi in evidenza in qualche modo, oppure… oppure non ho idea! È successa una cosa simile nello scorso mese di agosto, con un picco di 50.000 visualizzazioni al giorno. Non sono riuscito a spiegarmi il perché! Il massimo mensile di visualizzazioni l’abbiamo avuto a luglio 2015 (non è difficile capire perché…), con 808.772 visualizzazioni, pari a 26.089 al giorno. In questo periodo siamo attorno alle 10.000 visualizzazioni quotidiane, in crescita, ma… qualcosa non mi torna!

Voi che sapete tutto, che idea vi siete fatti?


Addendum delle 5:09

Il fenomeno continua e la situazione ora è questa:

Il dato positivo è che rivedo post che mi dimenticavo di aver scritto, e molti sono divertenti! Mah… anzi: mha!





41 commenti:

  1. Io ogni tanto riprendo il sempreverde "Il PD, ovvero la crescita negata" quando si parla sulla bolla di investimenti mancati.

    RispondiElimina
    Risposte
    1. Diciamo che quando sono stato settimane o addirittura mesi senza scrivere le visite al Blog si situavano comunque attorno alle 2000 o 3000 al giorno. Questa è quella che potremmo definire la “temperatura basale” del Blog. Oltre le 27.000 non è mai successo neanche quando eravamo miglioni (secondo i coglioni).

      Elimina
  2. Probabilmente un pessimo tentativo di DDoS (in pratica, cercare di tirare giù il blog ingolfandolo di richieste d'accesso)

    l'idea più plausibile che mi viene in mente è quella

    RispondiElimina
    Risposte
    1. L’ho pensato anch’io, ma mi sembra una cosa un po’ ridicola. Per quel che posso capirne siamo su un server Google. Hai voglia di richiedere accesso, capienza ci dovrebbe essere! E poi, anche se non posso escluderlo, che senso avrebbe farci tacere ora? In fondo il nostro messaggio ora a quei cretini sembra meno distruttivo di quanto potesse sembrargli una decina di anni fa. Se è così, allora evidentemente sono molto più disperati. Non riesco a considerarla una buona notizia.

      Elimina
    2. In effetti credo sia improbabile mettere in crisi un server (in realtà più di uno, visto che son sempre ridondanti) di Google. Sarebbe però interessante avere una statistica per IP (la zona, visto che l'IP è quasi sempre dinamico e non statico), in modo da avere un'idea della/e zone di provenienza degli accessi.

      Elimina
  3. Io da ex segretario locale Ds e poi PD, so solamente che i PDDINI EURISTI ED EUROPEISTI SONO IGNORANTI a tutti livelli.

    RispondiElimina
  4. Ci ho pensato anch'io, "web scraping" selvaggio.

    RispondiElimina
  5. Comunque, anche se la cosa sta andando avanti, riesco a postare. Quindi, se vogliono rompere i coglioni devono fare di più. Mi chiedo anche quanto queste richieste di accesso non ci facciano salire certe metriche. Quanto a sapere se quello che scrivo vi interessa, io ho con voi sostanzialmente lo stesso rapporto che ho col mio corpo: prima di salire sulla bilancia so esattamente quanto peserò. Posso sbagliarmi di un grammo, ma siccome la bilancia riporta solo gli etti non mi sbaglio. Anche qui, quando scrivo, so esattamente quello che vi piacerà e se accedo al pannello scommetto su quante sono le visualizzazioni del giorno e vinco sempre. Questo fattore di disturbo passerà, si annoieranno. Ah sì, naturalmente il corollario è che scrivo quello che ritengo di dover scrivere, non quello che ritengo possa piacervi. Se non vi piace oggi, vi piacerà domani. 😇

    RispondiElimina
    Risposte
    1. «scrivo quello che ritengo di dover scrivere, non quello che ritengo possa piacervi. Se non vi piace oggi, vi piacerà domani.»

      Per piacere o meno - personalmente non è detto che il tempo muti i miei giudizi, considerando che "piacere e dispiacere" sono categorie che aborro, poiché è ciò che "apprendo" o "non apprendo" ad essere vitale per me - è necessario leggerlo il blog e direi che la maggioranza dei giornalisti dimostra sufficiente e censurabile presunzione ed ignoranza.

      Elimina
  6. Sto constatando lo stesso fenomeno anch'io. Da qualche centinaio al giorno le visualizzazioni sono schizzate a parecchie migliaia.

    RispondiElimina
    Risposte
    1. Sì. Ha a che fare con l'AI ? plausibile.

      Elimina
    2. Mi sembra l'ipotesi più probabile: volume di traffico troppo basso per un attacco ma troppo altro per normali bot/spider.

      Elimina
  7. Egregio Onorevole,

    al seguente link, alcuni strumenti per monitorare il traffico di un sito web:
    https://www.aranzulla.it/come-controllare-le-visite-di-un-sito-1277337.html

    Sembra che Google Analytics possa fare al caso suo.

    Un saluto,
    Fabio

    RispondiElimina
  8. non proprio infurbatico, ma ci provo: son pochi accessi, per un tentativo di saturazione.
    Magari correlato con giorno e ora dello _splendido_ Discorso di Mattarella alla Scuola di Goofynomics?. Se si', puo' essere la conseguenza di scraping di x/twitter, agenti grok che riassemblano e ricontrollano il tutto, e il retweet di Borghi che aiuta a mandare in tendenza negli altri motori di ricerca. Per un combinato disposto di #goofynomics in mainstream algoritmico (grande idea da ricordare, tra l'altro...).
    Per saperne di piu', l'ovvio consiglierebbe di dare uno sguardo ai log (tipo, a che ora e da dove arrivano le connessioni, quanto traffico passa, ecc.), ma qui sicuramente ha i suoi mastini.

    RispondiElimina
  9. Per me sono quei burloni che chiedono a Grok di scrivere un tuo discorso ipotetico e quindi l’AI si sta facendo il giro su tutto il sito :D

    RispondiElimina
  10. Anche un altro forum cui partecipo è da 3 giorni sotto attacco e in questi giorni richiede un processo di verifica ("non sono un robot") per poter accedere (da "complottista scettico" mi sento di dire che forse c'entrano le elezioni in Germania).

    RispondiElimina
    Risposte
    1. Il Prof potrebbe mettere obbligatoria la spunta su "non sono un piddino", le connessioni si abbasserebbero di botto 😂

      Elimina
  11. Verosimilmente qualche IA che fa scraping ha "scoperto" goofynomics. Il che però vorrebbe dire che c'è a monte (ossia da parte di chi si vale del tool o di chi ne fa il training) un interesse per certi contenuti.

    RispondiElimina
  12. Elonio ha appena reso disponibile a tutti Grok 3 (dal 17 mi pare, ma il rilascio è stato graduale, io ce l’ho da un paio di giorni).
    Di certo tutti lo stanno provando, anche per chiedere di lei e vedere cosa dice (io l’ho fatto 😅).
    Magari è quello?

    RispondiElimina
  13. Ma perché? Scusate. Se voi chiedete all'intelligenza artificiale delle informazioni e questa "intelligenza" va a recuperare informazioni da un sito quell'intelligenza artificiale che va a "pescare" le informazioni da un determinato link viene considerata come visualizzazione? Quindi allora anche l'intelligenza artificiale che "va" su determinati link dovrebbe avere allora un suo indirizzo IP e un suo indirizzo Mac? presumo... se fosse quello che altera le visualizzazioni

    RispondiElimina
    Risposte
    1. Una macchina che scambia pacchetti in rete HA indirizzo logico ed indirizzo fisico. La IA ė un software che viene eseguito su una o più macchine distribuite quindi HA PER FORZA ip e Mac altrimenti come fa a collegarsi?

      Elimina
    2. Sinceramente a me pare ovvio che sia così.

      Elimina
    3. Il problema è che quella macchina è gestita da un'azienda come azienda "dovrebbe" rispettare certi criteri come per esempio quello della privacy che può essere gia il primo criterio ,oppure rispetto dei diritti d'autore ,imparzialità e neutralità. Dopo che sia reale o meno difficile provarlo ( o forse no se possibile tracciare gli indirizzi delle visualizzazioni )però lo hanno scritto nero su bianco... lasciato nel commento sotto la fonte se servono altre farò altre ricerche...

      Elimina
  14. A mio avviso vi sbagliate , in generale, i siti web collegati vengono recuperati dai dati di addestramento=( già inclusi nel suo database utilizzati ), quindi no, molto probabilmente non è così. Non è dato fall ai che salgono le visualizzazioni. Forse chi chiede la fonte da goofynomics come fonte e molti utenti vanno a dare una "sbirciatina" di persona , allora può essere.

    RispondiElimina
    Risposte
    1. Era così con le prime versioni di ChatGPT, ma molti sistemi moderni sono in grado di accedere a Internet sul momento. Ad esempio, chiedendo un istante fa a ChatGPT 4o «Qual è l'ultimo articolo apparso su Goofynomics ?» mi ha risposto «L'ultimo articolo pubblicato su Goofynomics è intitolato "Allacciate il cinto erniario…" ed è stato pubblicato sabato 22 febbraio 2025». È chiaramente una informazione che non può avere nei suoi dati di addestramento. Ci sta però che l'accesso a Internet richieda un account a pagamento.

      Elimina
    2. Più che altro anche il fatto che finché chatGPT ti ha condiviso solo il link non aumenta la visualizzazione del post, lui è entrato come "fantasma" senza indirizzo IP logico e fisico.

      Elimina
    3. Questa del “fantasma” mi sembra una lieve imprecisione. Puoi argomentarla tecnicamente o citare una fonte?

      Elimina
    4. https://www.microsoft.com/it-it/privacy/privacystatement chiedo scusa ci ho messo un po' a trovarla la fonte , ho dovuto fare una ricerca abbastanza specifica in questo caso , però almeno se la fonte dichiara il vero. Nel caso di CoPilot descrive come l'intelligenza artificiale nelle interazioni del recupero delle Fonti non si comporta come "un essere umano" quindi la sua ricerca non Aumenta le visualizzazioni ,può solo indurre Chi cerca determinati dati a entrare dentro in un link e aumentare le visualizzazioni di quel contenuto.

      Elimina
    5. Adesso sto entrando magari troppo nello specifico in un contesto abbastanza complicato , però un problema è il fatto che lei per il blog si appoggia su un utenza (server) esterno per cui non è "casalingo" esempio banale io già da casa su un computer con un semplice strumentino ( https://it.m.wikipedia.org/wiki/Wireshark ) posso verificare tutti gli indirizzi fisici nella centralina del router di casa. Anche chi si vuole "infiltrare" all'interno della rete del mio appartamento, addirittura anche l'aspirapolvere robotico che ha un suo indirizzo IP e un suo indirizzo fisico riesco a vedere, dopo non saprei decriptare le sue informazioni 🤣

      Elimina
    6. Non so perché, ma non riesci a convincermi particolarmente. Ma tu che lavoro fai? E hai letto l'inizio di questo post? Perché se le cose stessero come dici tu (il "fantasma", il server non "casalingo", ecc.), allora la coincidenza che documento in quel post come la spieghi?

      Elimina


    7. In questo momento, su 2 piedi non è possibile controllare da quale macchine provengono le visualizzazioni. Questo perche non ci sono dati per verificare tali informazioni, dato che ogni sviluppatore informatico aziendale sta sviluppando la propria ai non esiste solo grok 3 e quante interazioni abbia con le altre ai (se le ha) . Di conseguenza, sarebbe necessario richiedere a Blogspot una tabella delle visualizzazioni, se possibile. Inoltre, se si disponesse di un server domestico, sarebbe possibile catturare tutti i pacchetti di tutti gli indirizzi che si connettono alla macchina domestica che ospita i contenuti condivisi online. Pero, in mancanza di molti dati, è difficile fare una diagnosi precisa.
      Come umile direttore tecnico amministrativo più di questo non posso scrivere senza dare informazioni errate 😅 , casomai capire se questo grock3 può avere l'interazione con le altre intelligenze artificiali visto che se fosse solo per quello mi sembra difficile... e a mio avviso grock 3 non può avere interazioni con altre ai di ricerca

      Elimina
  15. Potrebbe essere un crawler/spider di qualsiasi tipo, da quello di archive.org a uno scraper per un dataset di machine learning.

    Quelli "well behaved" solitamente si dichiarano nella stringa di user-agent, se blogspot mostra qualche informazione (anche aggregata) del genere magari si riesce a intuire cosa sia.

    RispondiElimina
  16. Riprendo anche io alcuni commenti precedenti per suggerire che potrebbe trattarsi di web scraping per fini di allenamento di intelligenze artificiali (i.e. reti neurali). Qualcuno, per puro esempio, potrebbe voler scrivere (cioè far scrivere all’AI) un post pro-euro in puro stile Bagnai. Professore, se pensa che questo post possa far venire strane idee a qualcuno non esiti a non pubblicarlo 😉

    RispondiElimina
  17. Io sono un informatico, ma qui servirebbe uno specialista in sicurezza, cosa di cui normalmente non mi occupo. Da quel po' che so dai colleghi questo non sembra avere il pattern tipico degli attacchi ddos, ma per il resto, senza dati statistici dettagliati sul tipo di traffico (geolocalizzazione degli ip sorgente, navigazioni, client utilizzati ecc) si possono solo fare congetture approssimative.
    Nel mio piccolo spero sia solo l'effetto della caduta di alcune barriere censorie che hanno portato qui più utenti curiosi, o meglio, come sostengono alcuni che le AI si stanno alimentando per inseguire il "nuovo" mainstream.

    RispondiElimina
    Risposte
    1. Sicuramente Google ha rimosso qualche barriera. Questo lo vedo dal fatto che reperire i vecchi post via Google è diventato meno difficile e che il blog è tornato su nelle ricerche.

      Elimina
  18. Personalmente credo che non ci sia nessuna "trama oscura", semplicemente hai ricominciato a scrivere con una certa frequenza e quindi il traffico di nuovi e vecchi lettori è aumentato. Inoltre bisogna considerare anche il fatto che sei su diversi social (compreso tiktok se non ricordo male), quindi anche solo per curiosità porti traffico sul blog.

    RispondiElimina
    Risposte
    1. Avremo presto la controprova: se continuo a scrivere ma il fenomeno si smorza rapidamente (come fece ad agosto) allora questa spiegazione non potrà essere considerata valida… Nota bene: si sta già smorzando!

      Elimina
    2. Nel frattempo il fenomeno si è smorzato, MA la “radiazione di fondo” del blog resta meno fredda (sui 12.000 anziché 9.000).

      Elimina

Tutti i commenti sono soggetti a moderazione.