TouriNet - Data Integration

 
I dati estratti durante l’attività di Data Extraction presenteranno duplicati, problemi di consistenza, informazioni in conflitto, etc. Scopo di questa attività è lo sviluppo di un insieme di procedure per migliorare la qualità dei dati, al fine di inserire nel database solamente dati omogenei e il più possibile verificati e coerenti. Oltre a ciò dovranno essere sviluppate procedure per collegare le attività importate con l’ontologia turistica definita, al fine di valorizzare quanto più possibile il patrimonio informativo in nostro possesso.
 
Tra le procedure che verranno sviluppate in questa fase vi sono:
  • Data Cleansing: per la pulitura dei dati e l’eliminazione di eventuali errori in essi presenti;
  • Entity Resolution & Identification: per identificare univocamente le informazioni che si riferiscono alla medesima entità;
  • Entity Merging & Integration: per l’integrazione coerente in un’unica entità di informazioni ad essa riferite provenienti da diverse fonti;
  • Data Linkage: per il collegamento delle entità con i concetti dell’ontologia turistica.
 
Le entità restituite dalle procedure precedenti saranno pronte per essere inserite nel Database di Sistema.