Noi di
ideativi, in tanti anni di lavoro, abbiamo sviluppato progetti molto diversi, non limitati ad il solo web. Il fattore comune è sempre stata la scrittura di codice, e tramite questo strumento, abbiamo, ad esempio, sviluppato gestionali, applicazioni mobili, analizzato dati, implementato sistemi di acquisizioni dati telefonici, il tutto volto ad aiutare le azienda ad usare strumenti informatici più evoluti, per migliorare la produttività, ridurre gli errori, e dare un servizio migliore alla propria clientela.
Una delle cose che facciamo da tanti anni è
realizzare strumenti per acquisire dati da web o interagire con i siti. Sono sicuro che il primo pensiero che vi viene in mente a queste parole è il web spam. Ma non è così. Malgrado sia una attività molto in voga in questi anni, ci sono tanti altri usi per cui le azienda hanno bisogno di strumenti simili. Vi faccio alcuni esempi:
- scansionare il web, alla ricerca di dati per elaborare analisi di mercato (ad esempio leggi L'elenco di tutti i siti analizzati per il Web Reevolution);
- esportare dati da strumenti web dove le azienda hanno memorizzato i loro dati. Pensate ad esempio ad un sistema di fatturazione cloud che un'azienda usa da anni. Non supporta l'esportazione, però l'azienda ha bisogno di prendere tutti quei dati per importarli in un nuovo sistema;
- spostare dati da un sistema all'altro. Sicuramente il primo pensiero sarebbe accedi al database e sposti i dati. Ed invece no. Alcune grosse aziende acquistano sistemi intranet per il loro business che sono blindati. Malgrado li abbiano in casa, non possono accedere a basso livello alle fonti dati;
- acquisire dati da più fonti pubbliche, combinandoli;
- monitorare i cambiamenti su pagine pubbliche dove gli utenti commentano e recensiscono prodotto, brand o aziende;
- creazione di browser customizzati, per velocizzare l'accesso e l'interazioni con funzionalità presenti nella intranet aziendale;
- interagire con i siti di clienti e fornitori per acquisire informazioni necessarie per il proprio business. Può accadere che si firmino dei contratti per svolgere un certo lavoro, ma l'interlocutore, per problemi burocratici, politici o tecnici non può far mettere su un web service o una esportazione di dati necessaria allo svolgimento del compito. In quel caso bisogna arrangiarsi e acquisire i dati necessari con altri strumenti.
Oltre a questo esempio generico, vi faccio un esempio pratico, realizzato per un azienda che ora non esiste più. Un operatore telefonico, alcuni anni fa, ma presumo che lo faccia anche adesso, assegnava a dei call center in out sourcing il compito di vendere servizi telefonici. Dava degli elenchi di numeri di telefoni da chiamare, e i call center dovevano proporre questi servizi. Noi abbiamo collaborato con un call center realizzando alcuni software. In un caso l'azienda doveva vendere adsl, ma aveva il problema che un buon numero di chiamate andavano a vuoto, perché l'utente era già cliente dell'operatore telefonico (dati interni poco aggiornati) o di un concorrente (dati non in possesso). Ovviamente queste chiamate a vuoto davano un calo di produttività. Allora abbiamo realizzato un software che, dati i numeri di telefono da chiamare, interrogava i siti dei principali operatori telefonici. Tutti hanno un servizio on line che serve a verificare la copertura. Ed allora cercando un numero di telefono che aveva già un adsl con quell'operatore, il servizio mi rispondeva che l'adsl era già attiva. In questo modo potevamo scoprire quali numeri di telefono avevano già un adsl attiva e quindi questi venivano eliminati dalla coda delle chiamate, permettendo agli operatori di concentrarsi solo sui numeri buoni.
Nell'ambito di questi progetti realizzati in passato, abbiamo affinato diverse tecniche, che applichiamo per risolvere i problemi dei clienti. Allo scopo di affinare queste tecniche ed anche per acquisire dati utili per nostri progetti interni, negli anni
abbiamo costruito un database sulle aziende italiane. Attualmente questo archivio contiene i dati di circa 3 milioni di aziende italiane e di circa 447 mila loro siti.
Da tutte queste aziende ho deciso di analizzare un sotto insieme appartenente ai settori della ricettività e della ristorazione. Per realizzare
uno studio sul settore turistico, che è fondamentale per l'economia italiana e che rappresenta una buona parte del fatturato per le web agency italiane.
Stiamo parlando di circa 168 mila aziende, circa 50 mila siti e circa 7000 profili social.
Questo sarà
il primo di più articoli che di volta in volta mostreranno un aspetto diverso dei dati che abbiamo a disposizione. cercando di dare a tutti i colleghi che lavorano nel settore una serie di informazioni utili per il loro lavoro di consulenza. Volendo slegarci da tutte le statistiche che vengono dall'estero, ed avere per una volta una fotografia vera del nostro mercato. Allo stesso modo di come abbiamo già fatto nella nostra ricerca sui
profili italiani più seguiti di Google+, che ha riscosso molto apprezzamento in rete.
Gli strumenti usati
Per l'acquisizione dei dati non sono stati usati strumenti preconfezionati. Abbiamo usato solo strumenti realizzati internamente, tutti i dati sono stati inseriti in un database SQL Server e tutte le analisi sono state condotte estraendo e aggregando i dati tramite SQL. La visualizzazione dei dati tramite mappe di calore è stata implementata usando le
Fusion Tables presenti su Google Drive.
La fonte dei dati analizzati
I dati analizzati, come già descritto all'inizio dell'articolo, rappresentano
un sottoinsieme di un archivio di 3 milioni di aziende italiane, che abbiamo messo insieme negli anni, acquisendo dati da molteplici fonti. Questi dati sono stati poi elaborati. Provenendo da più fonti, i dati sono stati incrociati fra di loro e
sono stati deduplicati per eliminare dati ridondati. Inoltre abbiamo implementato
alcune tecniche di Data Quality per migliorare la qualità complessiva del dato.
La scelta di ridurre l'analisi al solo settore turistico è stato volto alla semplificazione dell'analisi di un enorme quantità di dati sporchi.
Purtroppo
non esistono soluzioni algoritmiche per arrivare a dati perfetti ed aggiornati. Oltre un certo livello occorre andare ad una pulizia manuale con un operatore umano che corregga i dati. Ed anche
con l'ausilio umano non si può arrivare ad avere dati al 100% corretti ed aggiornati. Per più motivi.
Non esistono banche dati on line con i dati corretti ed aggiornati. Spesso esiste una copia del vecchio dato e di quello nuovo.
Parafrasando una frase del dottor House,
i gestori mentono sempre. Quando hanno la possibilità di mettere le mani ad un profilo on line,
è facile cadere in tentazione di arricchire la realtà. Ad esempio cambiare il nome della struttura inserendo parole chiave più cercate, estendendo la sua struttura a categorie non proprie, inserendo errori (per imperizia) che poi possono dare errori inaspettati in altri servizi (vedi
Google Maps sbaglia la provincia per un civico particolare).
Nessuno si preoccupa di eliminare i vecchi dati non corretti. Sia nel caso di spostamento della struttura a nuovi indirizzi o in caso di cambio di recapiti, o nel caso di nuova gestione.
Giusto per dare un'idea del complessità del problema,
anche i dati di Google Maps soffrono degli stessi errori. Nel momento in cui scrivo esistono le schede di
Albiceris Sas Di Corea Lorenzo & C. e
La Cascina Ristorante Pizzeria. È evidente che
rappresentano lo stesso ristorante. Hanno lo stesso indirizzo e lo stesso numero di telefono. In questo caso è possibile capire quale delle due sia corretta. La seconda. Che possiede anche un sito attivo dove è possibile verificare i dati.
Probabilmente la prima dicitura è la ragione sociale, mentre la seconda è l'insegna.
Ma è anche comprensibile visto che sui dati di Maps c'è poco controllo su quello che viene inserito dagli utenti. Potrebbe essere quindi un'idea, andare a controllare su quello che è l'archivio storico di aziende italiane, Pagine Gialle, che fino a qualche tempo fa, riforniva di dati anche Google Maps. Sono andato a cercare nei ristoranti di Monza
cosa viene riportato per Albiceris Sas. Nel momento in cui scrivo Pagine Gialle riporta come nome di quel ristorante Albiceris Sas e non La Cascina.
Nello stesso elenco però trovo due altre duplicazioni, ovvero
RISTORANTE PIZZERIA GRILL TRATTORIA CAPRESE e
TRATTORIA CAPRESE SRL. Nome molto simile, ma indirizzi e numeri di telefono diversi. Difficilmente esistono due ristoranti con lo stesso nome, nelle vicinanze l'uno a l'altro. Molto
probabilmente è lo stesso ristorante che ha cambiato indirizzo. Però algoritmicamente è impossibile dire quale dei due sia la scheda corretta. Personalmente mi stupisce molto che Pagine Gialle come ha una procedura automatica per inserire le nuove aziende nell'archivio all'attivazione di un numero telefonico, non ne abbia una per l'eliminazione delle utenze. Inoltre le modifiche all'archivio vengono effettuate dagli operatori del suo call center.
Non sono inserite direttamente dagli utenti come nel caso di Google Maps. E quindi mi stupisce che non vengano effettuati controlli durante le variazioni di dati. Nel già citato elenco di ristoranti di Monza, ho trovato un'ulteriore duplicazione.
NINE HOTEL e
NINE. Qui gli errori sono più di uno. Prima di tutto è riportato che è un ristorante, mentre nel nome si parla di hotel. Hanno lo stesso indirizzo, ma numeri di telefono diversi. Qual'è il dato corretto? Senza ulteriori conferme è impossibile da dire.
La conferma la si può avere andando a vedere il sito ufficiale del Nine Hotel, dove scopriamo che è un ristorante, hotel e residence, è che il numero di telefono della prima scheda non è corretto.
Magari potrebbe essere un caso isolato. Prendo
l'elenco dei veterinari di Magenta. Su 9 risultati abbiamo due coppie di duplicati (sempre nel momento in cui scrivo)
AMBULATORIO VETERINARI ASSOCIATI CASTELNUOVO -
AMBULATORIO VETERINARIO ASSOCIATO DR. CASTELNUOVO - DR. COLOMBO e
CLINICA VETERINARIA MAGENTA CVM -
CLINICA VETERINARIA MAGENTA CVM. La prima coppia probabilmente è un ambulatorio che ha cambiato indirizzo, mentre la seconda è una duplicazione in cui in una è presente il telefono fisso, e nell'altra il cellulare.
È evidente che è un problema non indifferente, perché da un lato abbiamo poca cura da parte di chi ha le risorse per gestire i dati prelevandoli dalle fonti primarie (operatori telefonici), mentre dall'altro abbiamo i gestori delle strutture che spesso non verificano l'attendibilità dei loro dati presso i principali archivi on line (di questo ne avevo parlato con
+Luca Bove e
+Alessio Moretto in
Domande e risposte sulla Local Search).
Per migliorare ulteriormente la qualità delle informazioni, ho incrociato i dati in mio possesso con l'elenco completo delle
strutture presenti su
JustDog.it, il portale per la vita quotidiana e la vacanza con il cane. Su Justdog.it sono presenti i dati di oltre 200 mila aziende, che possono essere utili alle famiglie che vivono con gli animali. In particolare ho verificato i miei dati con il loro sottoinsieme di aziende che operano nel campo turistico e della ristorazione. Nello specifico
mi sono avvantaggiato della loro attività quotidiana di verifica dei dati, sia a seguito di segnalazioni di utenti o delle aziende stesse e sia in conseguenza della loro normale routine di controllo della qualità del dato.
Malgrado tutto questo lavoro degli errori rimangono, perché non è possibile capire, nemmeno ad un controllo umano, quale sia il dato corretto. In alcuni casi, se presente, il sito è così inusabile, che è difficile capire, se si sta parlando di hotel o di un ristorante, trovare l'indirizzo o i contatti telefonici. In alcuni casi pure il sito stesso riporta dati errati. E questo per bocca degli stessi gestori, che inviando la richiesta a JustDog.it, per l'inserimento sul portale, chiedono di ignorare alcune delle informazioni presenti sul loro sito, in quanto non aggiornate.
Lo studio
Dopo due anni di lavoro sui dati, per pulirli e migliorarli, ritengo di aver raggiunto un buon livello di precisione, tanto da poterli analizzare con sufficiente affidabilità e poter dare alla comunità dei colleghi del settore, quello che penso che sarà il più grande studio (per quantità di dati) mai realizzato in Italia sulle aziende turistiche del nostro paese, pensato per gli specialisti del web.
Inizieremo in questo post, andando a vedere
dove si trovano fisicamente queste aziende sul territorio nazionale, per poi proseguire nei post successivi, andando a vedere, ad esempio,
quali e quante aziende hanno il sito, quali sono i principali errori presenti,
il loro utilizzo dei social, se e come utilizzano la SEO, più diverse altre cose che per adesso non anticipo. L'analisi di tutti questi aspetti e la scrittura dei rispettivi articoli, necessiterà di diversi mesi e, come nostro solito,
rilasceremo i dati aggregati dello studio per il libero scaricamento.
Nell'ambito dei vari post di cui sarà composto lo studio, ci potranno essere dei discostamenti nei dati rilasciati. Questo perché l'attività di pulitura e di incrocio con i dati di
JustDog.it non finisce oggi, ma continuerà. Anche perchè da qui a qualche mese molte aziende potrebbero chiudere, aprire o cambiare gestione.
I dati sono categorizzati in due famiglie, ricettività, e ristorazione.
La ricettività è divisa in:
- Agriturismo
- Albergo
- Bed & Breakfast
- Campeggio
- Motel
- Pensione
- Residence
- Villaggio turistico
La ristorazione è suddivisa in
- Fast Food
- Pizzeria
- Ristorante
- Trattoria - Osteria
Una stessa azienda può essere presente su più categorie. Ad esempio è facile trovare ristoranti che sono anche pizzerie, o alberghi che hanno anche il ristorante.
La posizione delle aziende turistiche italiane
Le aziende nel campo turistico (ricettività e ristorazione) in Italia non sono ovviamente equamente distribuite nello stivale. In questa prima puntata del nostro studio, affrontiamo in dettaglio la posizione geografica che hanno le aziende italiane. Questa informazione potrebbe essere triviale, ma non lo è. Per più motivi.
Il mese scorso abbiamo parlato di
Local Search con
+Luca Bove e
+Alessio Moretto. Le ricerche turistiche sono molto frequenti sui motori di ricerca. Se cerco Ristorante Roma o Ristorante Guardiagrele (cittadina dell'Abruzzo) ovviamente avrò un numero di risultati evidentemente diverso, in quanto Roma ha sicuramente ed intuitivamente un numero di ristoranti maggiore di Gardiagrele. Ma se mi chiedo se più affollata (teoricamente) la ricerca Ristorante Olbia o Ristorante Nuoro, la risposta è molto più difficile.
Un consulente IT è una piccola azienda a sè stante, e come tale ha un target di possibili clienti.
È importante conoscere dove sono presenti potenziali clienti, dove il mercato è più ampio e dove è più rarefatto. Per web agency, web designer, social media manager, marketer, il mondo turistico spesso rappresenta una buona percentuale del fatturato. Molte persone usano internet per trovare una vacanza o un posto dove andare a mangiare. Sapere dove ci sono più potenziali clienti è importante per creare le proprie strategie commerciali. Immagino che nessuno voglia cercare di vendere frigoriferi agli eschimesi.
Ma non solo. Una volta preso un cliente in campo turistico, in qualità di consulenti
è importante sapere se si trova in una zona ad elevata concorrenza oppure no. Personalmente ho trovato gli strumenti di mappe on line poco efficaci per trovare queste informazioni. Ad esempio se cercate ristorante su Google Maps, non potete avere una idea chiara della concentrazione di questo tipo di azienda per due motivi. Su zoom poco spinti
Google adotta una clusterizzazione (un raggruppamento) della informazioni. Non potendo visualizzare decine di migliaia di punti su mappa, ne visualizza solo alcuni, non dando alcun riferimento su quale sia la concentrazione in una data zona. Ed
il livello di clusterizzazione non è uniforme. Nelle zone a scarsa concentrazione visualizza un punto ogni x, mentre nelle zone ad alta concentrazione visualizza un punto ogni y, dove y è decisamente più grande di x. Quindi nelle zone ad alta concentrazione le decimazione di punti è molto maggiore. Inoltre la ricerca che operiamo su Google Maps è generica. Se io cerco ristorante, non cerco solo quelli che hanno la categoria ristorante, ma potrei trovare fra i risultati anche il B&B che nella descrizione scrive di
essere convenzionato con ristorante nello stesso stabile.
In questa prima fase dell'analisi ci concentreremo quindi sulla sola posizione, mentre nella prossima andremo ad affrontare un discorso ancora più interessante per il mondo dei consulenti web. Ovvero quali sono le zone è più facile che un azienda abbia un sito.
Siete sicuri che la concentrazione dei siti sia proporzionale alla concentrazione delle aziende di un certo settore? Secondo voi è più facile che un albergo abbia un sito nella provincia di Rimini o nella provincia di Foggia? E quindi se io voglio vendere un sito ad un albergo è più facile che non ce l'abbia uno a Rimini oppure a Foggia? Per sapere la risposta a queste domande, dovrete attendere il prossimo post, intanto vediamo come sono concentrate tutte le aziende italiane sul territorio del nostro paese.
Come in altri casi analoghi rilasceremo i dati aggregati in comodi file excel da scaricare, in modo che ognuno possa effettuare le proprie analisi. Però le lenzuolate di dati su file Excel non sono in questo caso il modo migliore
per vedere i dati.
Questo genere di dati va analizzato visualmente per apprezzare bene il loro valore strategico, e confrontarli agevolmente con le zone vicine. In pratica è bene adottare delle tecniche di
geomarketing. Con il geomarketing andiamo a visualizzare i dati di interesse su mappa geografica, andando eventualmente a confrontare i dati a nostra disposizione con altri di pubblico dominio che potrebbero essere correlati.
In questa fase dell'analisi abbiamo deciso di visualizzare i dati tramite
mappe di calore. Un esempio di quello che possiamo ottenere è la seguente immagine:
Concentrazione della popolazione italiana (dati ISTAT 2009)
L'immagine qui sopra ci permette di apprezzare la distribuzione di popolazione sul territorio italiano, con una scala che va dal verde più chiaro (minore concentrazione) al rosso le zone (maggiore concentrazione).
Con gli hinterland di Roma, Milano, Napoli e Torino che racchiudono le maggiori concentrazioni di popolazione, con 11 milioni di italiani.
Questa immagine ci permette di descrivere la metodologia di rappresentazione usata in questo articolo. Questa e le seguenti immagini sono state ottenute utilizzando come strumento
Fusion Tables. Strumento molto utile per la velocità a rappresentare dati geolocalizzati, anche se con alcune limitazioni. La principale è che sulle mappe di calore è possibile rappresentare non più di 1000 punti. Il che rende impossibile aggregare i dati a livello comunale, in quanto in Italia abbiamo circa 8 mila comuni. D'altro canto aggregare per 110 provincie sembrava troppo riduttivo.
La soluzione è stata adottare i
Sistemi Locali del Lavoro. È una definizione della Istat.
I sistemi locali del lavoro rappresentano i luoghi della vita quotidiana della popolazione che vi risiede e lavora. Si tratta di unità territoriali costituite da più comuni contigui fra loro, geograficamente e statisticamente comparabili. Sono 686 e ci permettono di aggregare i comuni in entità comparabili fra loro. Per fare un esempio il comune di Pomezia è aggregabile a Roma, in quanto una parte notevole della sua popolazione ogni mattina si sposta verso Roma per andare a lavorare. Sul sito dell'ISTAT sono presenti tantissimi dati scaricabili e fra gli altri anche i dati dei Sistemi Locali del Lavoro e la suddivisione amministrativa ufficiale italiana in regioni, provincie e comuni. I dati sono tantissimi ed utilissimi,
peccato che l'organizzazione dell'informazione sul sito dell'istituto nazionale di statistica sia pessima. È difficile capire come trovare quello che può servire, ed una volta trovato spesso le informazioni devono essere lavorate per renderle compatibili con altre.
Copertura delle aziende turistiche in Italia
Utilizzando i sistemi locali del lavoro, otteniamo l'immagine qui sopra che descrive la concentrazione delle aziende turistiche in Italia. Confrontando le due immagini, si può notare che
la distribuzione delle aziende turistiche non è equivalente alla distribuzione della popolazione. Roma in entrambe le mappe rimane il centro italiano, sia per quanto riguarda la popolazione sia per quanto riguarda le aziende a cui ci riferiamo. Nella seconda immagine Roma è l'unico rosso intenso, mentre troviamo una maggiore distribuzione di zone gialle, con in evidenza la costiera romagnola, l'Alto Adige, la Toscana e la Liguria, che si distinguono rispetto all'immagine sulla popolazione.
Rappresentare insieme ricettività e ristorazione non è molto utile. Perché ci stiamo trovando a mischiare pere con le mele. La ricettività ha come target turisti ed utenza business, mentre la ristorazione ha anche un target locale. Ed è evidente un hotel si rivolge principalmente a clienti che risiedono al di fuori della propria città, mentre un ristorante può raccogliere sia turisti o persone in viaggio per lavoro, ma anche e soprattutto residenti nelle stesse zone. Questa è una distinzione importante per identificare il target di clientela per una azienda in questo campo, che poi ovviamente si riflette anche nella strategia online che un consulente deve mettere in atto, nella realizzazione di un sito e la sua successiva promozione online.
A tal scopo vogliamo andare più nel dettaglio, prima distinguendo ricettività e ristorazione e poi dettagliando ulteriormente entrambe la categorie.
Copertura della ricettività italiana
Se andiamo a vedere la sola ricettività la mappa cambia.
La ricettività italiana ha due fuochi principali, Roma e la costiera romagnola. Quindi da una parte abbiamo Roma e i suoi oltre 2000 anni di storia e dall'altra Rimini, Riccione, Cattolica e tutto il loro divertimento estivo. Ribadiamo il concetto, le mappe sono create a partire dal numero di aziende presenti sul territorio, non sul numero di posti letto, non sul numero di turisti. Solo il numero di aziende. Qui possiamo vedere quanta concorrenza è presente in un dato territorio.
Vediamo anche che oltre alle due zone rosse, abbiamo come zone ad elevata concentrazione di aziende turistiche buona parte della Toscana e la provincia di Perugia, Venezia, il Trentino Alto Adige, tutta la zona del Garda ed infine Milano, in qualità di capitale finanziaria italiana.
Il sud, il meraviglioso sud italiano, pieno di posti splendidi, conta meno aziende del nord, scontando l'eterna incapacità italiana di valorizzare il Mezzogiorno. Le uniche zone con una discreta concentrazione di aziende la troviamo nell'intorno di Napoli, la penisola sorrentina ed il Salento. Risulta inoltre evidente il vuoto presente nel Molise, l'Irpinia e la Basilicata. Una cosa che mi ha colpito particolarmente è la scarsa concentrazione di ricettività turistica in Sardegna. Nel mio immaginario personale, la parola Sardegna è associata al mare e alle vacanze. Sinceramente pensavo di trovare una maggiore concentrazione di aziende turistiche. Che nella seconda isola italiana sono raggruppate intorno ad Olbia, Alghero e Sassari.
La mappa della ristorazione risulta decisamente diversa:
Copertura della ristorazione italiana
Questa mappa è decisamente differente da quella della ricettività.
Si può notare quanto sia simile a quella della popolazione italiana. Le differenze sono poche. La più evidente è colore meno marcato su Napoli. Ed una minore concentrazione rispetto alla popolazione in Salento, Sicilia e Olbia ed una leggera maggiore concentrazione, sulla costa adriatica dall'Abruzzo alla Romagna ed in Liguria.
La differenza fra la mappa della ricettività e la ristorazione evidenzia e conferma il concetto espresso in precedenza in questo paragrafo. Per quanto riguarda
la ricettività le aziende si concentrano dove ci sono i maggiori flussi turistici, mentre
la ristorazione segue maggiormente la concentrazione di popolazione, visto che la clientela principale per i ristoranti è popolazione locale. Anche qui notiamo, purtroppo
un'arretratezza del mezzogiorno italiano. Dove notiamo una minore concentrazione rispetto alla popolazione di aziende ristorative al sud rispetto al nord.
Ricettività
Andiamo più in dettaglio nell'analisi della ricettività. Come abbiamo già scritto, abbiamo suddiviso le aziende del nostro database in:
- Agriturismo
- Albergo
- Bed & Breakfast
- Campeggio
- Motel
- Pensione
- Residence
- Villaggio turistico
Andando i riportare i dati su mappa di ciascuna sottocategoria, possiamo notare che ci sia una diversa distribuzione di aziende a seconda del tipo della stessa.
Mappa degli agriturismi italiani
La mappa degli agriturismi italiani ha un cuore al centro dell'Italia.
Agriturismo in Italia è sinonimo di Toscana e di luce riflessa tutto il centro Italia da Terni in su. Altre zone dove c'è una maggiore concentrazione di aziende specializzate nel turismo rurale sono in Alto Adige, la zona del Garda e l'area fra Torino e Genova. Rispetto alle mappe precedenti vediamo una maggiore uniformità nella distribuzione su tutto il territorio italiano con un'unica zona
vuota nell'intorno di Foggia.
La vacanza agrituristica è in decisa crescita negli ultimi anni, complice un'offerta più economica del soggiorno in albergo e spesso abbinata ad un offerta ristorativa con prodotti dell'azienda e sapori di una volta. Questo non significa automaticamente una vacanza di serie B. Anzi le proposte da parte degli imprenditori del settore stanno diventando sempre più variegate ed importanti. Il turista ha a disposizione molta scelta, con offerte per tutte le tasche, fino a soggiorni di vero lusso con a disposizione nel pacchetto anche un centro benessere.
Giusto per avere un'idea, potete guardare le fotografie dell'
Antico Casale di Montegualandro, dove è possibile trovare
suites affrescate, il parco di 100.000 metri quadrati con piscina e area barbecue, il Ristorante Antica Posta per Cortona 1745, il Centro Benessere & SPA. È un bellissimo posto, nulla da invidiare a molti hotel. Ho linkato direttamente la pagina delle foto, perché non è facile da trovare (la navigazione è difficoltosa) e l'homepage non rende giustizia alla bellezza del posto.
P.S.: non è un cliente di ideativi. :-D Il mio commento è assolutamente naturale.
Mappa alberghiera italiana
Dalla mappa degli alberghi italiani notiamo un maggiore sbilanciamento fra i due fuochi che abbiamo trovato nella mappa della ricettività.
La più grande concentrazione di alberghi in Italia è sulla costiera romagnola. Le zone di Ravenna, Rimini, Cesenatico e Cattolica hanno il maggior numero di alberghi del nostro paese. Un turismo prettamente estivo rispetto a quello che può raggiungere la capitale. La costiera romagnola è dove un albergo può avere la concorrenza più spietata. Ci si trovano concorrenti a distanza anche di pochi metri.
Il terzo polo alberghiero italiano si trova in Alto Adige. E poi troviamo altre concentrazioni evidenti a Venezia, sul Garda, Milano, Firenze, Lucca, Pisa, Sanremo e Napoli.
Mappa B&B italiani
La concentrazione dei B&B è decisamente diversa da quella degli alberghi.
La maggiore concentrazione è a Roma, seguita dal Salento e poi da Venezia. Ci sono ampie zone d'Italia in cui questa forma di ricettività non è molto usata, in particolare nel sud Italia e nel Trentino Alto Adige. Non è decisamente facile trovare un B&B in Molise, Calabria e Basilicata.
Sembrerebbe che questa forma di accoglienza sia preferita nella grandi città.
Concentrazione campeggi
Nella visualizzazione dei campeggi troviamo una distribuzione decisamente diversa rispetto ai precedenti.
I campeggi italiani sono disposti principalmente lungo le coste della nostra penisola, con eccezioni in Umbria, nella zona di Firenze, intorno al lago di Garda, il lago di Como, la Val d'Aosta e nella zona delle Alpi Marittime. I due fuochi dove abbiamo le maggiori concentrazioni di campeggi italiani è nella zona del Gargano a sud e nella zona fra Savona e Sanremo a nord.
Al contrario risulta particolarmente evidente l'assenza di questo tipo di ricettività su tutta la pianura Padana.
Concentrazione residence
La presenza dei residence sul territorio italiano è come si suol dire a macchia di leopardo. La maggiore concentrazione è decisamente sulla costiera romagnola, seguita dal Gargano. Inoltre troviamo un'area molto diffusa nell'Italia Centrale che attraversa, Toscana, Umbria e parte della Marche. Un'altra zona di buona concentrazione è in Liguria verso il confine della Francia. Al contrario spicca l'assenza di questo tipo di ricettività nel centro delle due maggiori isole italiane e sull'Appennino da Terni in giù.
Concentrazione villaggi turistici
I villaggi turistici sono sinonimo di sud. Il loro epicentro è sul Gargano, ma praticamente tutte le coste dello stivale di Campania, Calabria, Basilicata e Puglia danno una sede a questo tipo di strutture di ricettività. Troviamo una buona concentrazione anche in Sardegna in particolare nelle zone di Olbia e di Cagliari. Al contrario al nord la loro presenza è molto più rarefatta ad eccezione della Liguria al confine della Francia.
Motel e pensioni non sono stati rappresentati graficamente in quanto il loro numero nel nostro archivio non era statisticamente rilevante.
Ristorazione
Come nel caso della ricettività, vediamo più in dettaglio anche la categoria della ristorazione che nel nostro database abbiamo suddiviso in:
- Fast Food
- Pizzeria
- Ristorante
- Trattoria/Osteria
In questo caso le distribuzioni hanno poche differenze fra di loro. La ristorazione si distribuisce in maniera proporzionale alla popolazione.
Concentrazione fast food
I fast food in Italia non sono tantissimi. Sicuramente come numeri sono decisamente inferiori rispetto a trattorie, ristoranti e pizzerie. La loro distribuzione sul territorio nazionale segue la distribuzione di popolazione, ma con una maggiore rarefazione nelle zone meno popolate, in particolare nel sud Italia dove si concentrano intorno alle città maggiori.
Concentrazione pizzerie
Se sovrapponiamo la mappa della popolazione e quella delle pizzerie noteremo una somiglianza quasi perfetta. Le uniche differenze apprezzabili rispetto alla popolazione è una leggermente maggiore concentrazione su Milano, ed una leggermente minore concentrazione su Napoli, Palermo e Catania.
Concentrazione ristoranti
Anche nel caso dei ristoranti la distribuzione ricalca la distribuzione di popolazione. La differenza che si nota, anche se non molto evidente è una maggiore rarefazione al sud, rispetto alla popolazione.
Concentrazione trattorie/osterie
La distribuzione di trattorie/osterie ricalca meno la distribuzione delle popolazione. Risulta evidente dalla mappa che
esiste una elevata concentrazione di trattorie/osterie nell'area che va da Milano a Venezia fino al Friuli e da Milano a Bologna lungo l'autostrada. All'altro estremo si nota la quasi totale assenza in Sardegna, Calabria, Basilicata, Molise e nord della Puglia.
I dati
Come è nostro solito nel caso di ricerche, forniamo una serie di open data. Lo scopo è sia di fornire dati che siano di utilità per i professionisti del settore, sia, seguendo il metodo scientifico, di avere la possibilità che altri possano analizzare le stesse informazioni e confermare le nostre conclusioni. Oppure darne una visione diversa. Allo scopo sempre di migliorare la conoscenza del settore ed aiutare meglio le aziende che lo compongono a promuoversi correttamente sul web.
Tutti i dati sono stati estratti e raccolti in un file excel, che
può essere scaricato, oppure può essere visionato qui sotto. È consigliabile cliccare sul pulsantino in basso a destra nella griglia per vedere il file a pieno schermo, vista la mole dei dati.
Nel file excel oltre ai dati usati per ciascuna rappresentazione grafico sono presenti anche i comuni presenti in ciascun sistema locale del lavoro.
In ogni foglio dati sono anche presenti l'altitudine media, la superficie (in chilometri quadrati) e la popolazione di ciascun territorio. Tutti i dati della
tassonomia nazionale sono forniti dall'istat e risalgono ad un paio di anni fa, quando abbiamo iniziato a normalizzare e geolocalizzare tutti i dati del database delle aziende. Le modifiche occorse negli ultimi due anni in termini di variazione di popolazione e di modifiche di frazioni e comuni sono assolutamente ininfluenti ai fini di questa analisi e quindi abbiamo ritenuto non necessario procedere alla rinormalizzazione dei dati, rimandandola al momento in cui il governo deciderà l'abolizione delle provincie.
Nel primo foglio sul file excel è presente una colonna in cui è calcolato il rapporto fra numero di aziende su mille abitanti. Questo rapporto ci indica quanto la presenza di aziende turistiche sia importante per il territorio. Abbiamo riportato su mappa anche questo dato:
Numero aziende per 1000 abitanti
Come evidenziano le zone rosse, le zone a maggiore concentrazione di aziende rispetto alla popolazione sono la zona del Trentino Alto Adige, quella del Lago di Garda e le zone della bassa Toscana. All'estremo opposto troviamo Roma, Milano, Torino ed il territorio fra Foggia e Bari.
Conclusioni
Questa primissima parte della ricerca è stata dedicata al dove si trovano le aziende italiane nel campo della ricettività e della ristorazione. Potrebbe sembrare una informazione ininfluente, mentre al contrario
è una informazione importante per capire quanta concorrenza c'è nel momento in cui si diventa consulenti in di un'azienda del settore. Ed anche per sorprendere i clienti con la nostra preparazione :-D
Come abbiamo visto la ristorazione segue la concentrazione della popolazione sul territorio, mentre la distribuzione della ricettività è proporzionale l'attrattività turistica della località. Soprattutto per la ricettività conoscere queste informazioni può essere molto utile. Ad esempio, sappiamo tutti che Rimini è sinonimo di vacanza, la concorrenza è altissima, con un albergo ogni venti metri. Però
non tutti i tipi di ricettività sono iperinflazionati sulla costiera romagnola. Ad esempio nei dintorni di Rimini ci sono solo pochissimi campeggi e solo qualche decina di B&B e agriturismi. Questo vuol che su queste parole chiave ci può essere una decisamente minore concorrenza nelle ricerche locali sui motori di ricerca.
Allo stesso modo Roma caput mundi, che mette a disposizione dei turisti tantissimi alberghi e B&B, invece ha pochissimi residence. Anche in questo caso può essere facile fare un buon lavoro per via della poca concorrenza.
Ho chiesto all'amico
+Martino Mosna una sua opinione su questi dati in ottica Adwords e queste sono le sue considerazioni:
Per un'attività turistica che voglia pubblicare delle inserzioni su Google Adwords, o meglio ancora per un'agenzia che deve pianificare le campagne dei clienti, il primo fattore che incide sui costi è quello della presenza di concorrenti.
Innanzi tutto avere meno concorrenti a parità di investimento e di punteggio di qualità, significa che il nostro annuncio verrà pubblicato più in alto rispetto invece ad una SERP con una concorrenza più alta. Sempre in questo scenario, avere meno concorrenti significa avere anche meno opzioni su cui l'utente del motore di ricerca può cliccare. A tutti gli effetti quindi a meno inserzionisti concorrenti corrisponde un maggior CTR.
Viceversa, se ci sono tanti concorrenti dovremo essere disposti ad aumentare l'offerta CPC se vogliamo mantenere un buon livello di posizione media e di visibilità. E quand'anche riuscissimo ad ottenere posizioni medie di rilievo, il nostro annuncio dovrà fare i conti con un maggior numero di opzioni che l'utente può in qualche modo cliccare.
Ecco quindi che avere un'idea di quello che è il livello di concorrenza di un mercato diventa un'informazione strategica anche in ottica di investimento pubblicitario sugli annunci sponsorizzati su Google, perché aiuta a capire meglio quali sono i livelli di spesa necessari ed i risultati attendibili.
I dati di Maurizio ci permettono già di avere un'idea di quelli che sono i territori con il più alto numero di aziende ogni 1000 abitanti, così come i territori con la maggiore densità di aziende per Km quadrato, entrambi ottimi indicatori del livello di concorrenza.
Lo step successivo è quello di confrontare questi dati con quelli forniti da Google stesso all'interno dello "Strumento per le parole chiave" di Google Adwords e nella fattispecie proprio la misura della concorrenza e del CPC suggerito.
Ho solo una cattiva notizia per Maurizio: si tratta di uno strumento non accessibile allo scraping pubblico (n.d.r.: sigh) e comunque decisamente blindato anche allo scraping privato: esiste una quota limite di massimo 50 parole chiave esaminate al colpo e ci sono dei limiti anche nella quantità di analisi successive che è possibile fare. I nostri amici di Mountain View hanno preso più di una precauzione contro l'estrazione automatica di dati, pertanto si tratta di qualcosa da fare necessariamente a mano.
Infine: molte considerazioni in più potranno essere fatte ragionando non solo sulle aziende presenti in assoluto, ma sulla quantità di aziende che hanno siti web (n.d.r.: coming soon), dato che solo queste potranno facilmente prendere inconsiderazione un'attività di promozione sponsorizzata.
Sul file excel, Martino ha aggiunto alcune colonne calcolate, ovvero il numero di aziende per 1000 abitanti e le densità di abitanti ed aziende per Km quadrato. Aggiunge inoltre.
Ed infine, ciliegina sulla torta dell'elaborazione dei dati, un'ultima colonna solo sul primo foglio con un "indice turistico", dato dalla moltiplicazione secca dei due valori:
- Aziende ogni 1000 abitanti (maggiore il numero di aziende ogni 1000 abitanti, maggiore sarà il numero di persone che "campa di turismo")
- Aziende per Kmq (maggiore il numero di aziende per Kmq, maggiore sarà il territorio dedicato al turismo)
Devo dire che così ad occhio è un'indice che ci azzecca molto bene nel misurare quali sono i principali poli del turismo dove più persone campano di turismo ed in generale girano i soldoni, ovvero:
- le isole e il golfo di Napoli (principalmente turismo internazionale)
- Ortisei/Val Gardena (YA BENFENUTO IN SUDTIROL)
- la riviera romagnola (il classico turismo di massa stile anni 90 + i crucchi)
- Elba e Sanremo (i ricconi ma quelli non abbastanza ricchi da andare in Costa Azzurra)
- il Garda (i crucchi)
- le zone ricche della Toscana (questo sinceramente mi aspettavo di più, ma è anche vero che sono comunque territori ampi e poco sfruttati e non gira certo turismo di massa)
Ringraziamenti
Vorrei ringraziare
+Enrico Altavilla,
+Luca Bove,
+Martino Mosna e
+Andrea Pernici per i consigli ed i pareri che mi hanno dato durante la gestazione di questa ricerca. Molti dei loro consigli e suggerimenti prenderanno forma nei prossimi post che andranno a descrivere aspetti diversi di questo studio. Un ringraziamento aggiuntivo va a
+Martino Mosna per le sue considerazioni su Adwords e per la sua
contaminazione al file Excel.
To be continued...
Nella prossima puntata, entreremo più in dettaglio nei dati ed esamineremo le aziende che hanno un sito.