Η δράση SEMIC του προγράμματος ISA² αποσκοπεί στην προώθηση της χρήσης σημασιολογικών εργαλείων και λύσεων για την αντιμετώπιση των προκλήσεων διαλειτουργικότητας μεταξύ των δημόσιων διοικήσεων των κρατών μελών κατά τη διατήρηση και την ανταλλαγή δεδομένων των ευρωπαϊκών δημόσιων υπηρεσιών. Για να υποστηρίξει αυτό το στόχο, η δράση έχει δημιουργήσει μια σειρά από μελέτες, οι οποίες επικεντρώνονται σε διάφορες πτυχές των σημασιολογικών εργαλείων.
Η μελέτη αυτή διερευνά τη διασταύρωση μεταξύ της διαχείρισης της ποιότητας των δεδομένων (από την άποψη της διακυβέρνησης των δεδομένων) και της σημασιολογικής διαλειτουργικότητας: πώς τα σημασιολογικά στοιχεία υποστηρίζουν και αναπτύσσουν εκτιμήσεις της ποιότητας των δεδομένων. Στην μελέτη περιγράφονται οι σύγχρονες έννοιες και τα πλαίσια για την ποιότητα των δεδομένων και συνδέονται με τη σημασιολογική διαλειτουργικότητα, μελετώντας τον τρόπο βελτίωσης της ποιότητας των δεδομένων.
Ο κύριος στόχος αυτής της μελέτης είναι να διερευνήσει πώς μπορεί να βελτιωθεί η ποιότητα των δεδομένων στο πλαίσιο της διαχείρισης δεδομένων μέσω της χρήσης σημασιολογικών μεθοδολογιών και τεχνολογιών. Παρουσιάζει τις πιο σημαντικές διαστάσεις ποιότητας δεδομένων και επικεντρώνεται στις μεθοδολογίες, τις τεχνολογίες και τα ανοικτά πρότυπα σημασιολογικού ιστού που μπορούν να χρησιμοποιηθούν από δημόσιους οργανισμούς για τη βελτίωση της ποιότητας των δεδομένων τους. Εξετάζει επίσης την ιδέα του σημασιολογικού εμπλουτισμού των μεταδεδομένων, λαμβάνοντας υπόψη την επίδραση των μεταδεδομένων στην ποιότητα των δεδομένων και την δυνατότητα ανίχνευσης.
Το κύριο συμπέρασμα της μελέτης ήταν ότι με τη χρήση τεχνολογιών αναπαράστασης της γνώσης (οντολογίες, thesauri, λεξιλόγια, ανοιχτά πρότυπα) και μηχανισμών για τη μοντελοποίηση και οργάνωση δεδομένων διακυβέρνησης, οι δημόσιοι οργανισμοί μπορούν να βελτιώσουν την ποιότητα των δεδομένων τους και να επιτύχουν τη διαλειτουργικότητα. Η χρήση οντολογιών επιτρέπει αυτοματοποιημένη συλλογιστική, η οποία μπορεί να συνάγει νέες σχέσεις και ιδιότητες και έτσι να συμβάλλει στην ακρίβεια και την πληρότητα των δεδομένων.
Οι Web query languages μπορούν να χρησιμοποιηθούν για τη βελτίωση της συνάφειας των δεδομένων. Οι RDF validation mechanisms (δηλ. SHACL) μπορούν να βελτιώσουν την ακεραιότητα και τη σημασιολογική ακρίβεια των δεδομένων. Επίσης, αποδείχθηκε ότι ο σημασιολογικός εμπλουτισμός των μεταδεδομένων μπορεί να οδηγήσει σε βελτιωμένη ποιότητα δεδομένων. Οι τεχνικές μηχανικής μάθησης, όπως η επεξεργασία της φυσικής γλώσσας σε συνδυασμό με το deep learning, μπορούν να χρησιμοποιηθούν για τη συστηματική βελτίωση των δεδομένων ποιότητας (διαρθρωμένα, ημιδομημένα και αδόμητα) και σε συνδυασμό με τον άνθρωπο οι μεθοδολογίες loop μπορούν να βελτιώσουν τη δυνατότητα ανάγνωσης και προσβασιμότητας δεδομένων με υψηλή ακρίβεια και πληρότητα.
Πηγή άρθρου: https://joinup.ec.europa.eu