ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Οι ποικίλες δυνατότητες αξιοποίησης των ανοικτών δεδομένων

Την ακόλουθη επιστημονική έρευνα επιμελήθηκαν οι μεταπτυχιακοί φοιτητές: Καραγιάννη Αναστασία, Κιουμουσίδου Μαρία, Κουνταρδάς Νεόφυτος, Κυριακίδου Ευγενία & Τερζίδου Μαρία.

Αναγνωρίζοντας την ανάπτυξη των ανοικτών δεδομένων και όλων των φορέων που συνδέονται με αυτό το αναπτυσσόμενο οικοδόμημα, σταδιακά παρατηρείται μια αύξηση του ενδιαφέροντος των ερευνητών, δημόσιων και δημοτικών φορέων αλλά και επιχειρηματιών στην αξιοποίηση των δυνατοτήτων που προσφέρουν.

Η επιστημονική άποψη ότι η απελευθέρωση των δεδομένων και η μετατροπή τους σε επεξεργάσιμη μορφή από το ευρύ κοινό θα αποτελέσει εφαλτήριο οικονομικής ανάπτυξης αναμένεται να δοκιμαστεί τα επόμενα χρόνια, την στιγμή μάλιστα που η ίδια η προώθηση των Ανοικτών Δεδομένων αποτελεί βασικό πυλώνα του Ψηφιακού Θεματολογίου της Ευρώπης για το 2020. Άλλωστε πολλές μελέτες εκτιμούν την οικονομική αξία των Ανοιχτών Δεδομένων σε αρκετές δεκάδες δισεκατομμύρια ευρώ ετησίως, μόνο για την Ευρωπαϊκή Ένωση.

Στα πλαίσια αυτά το παρόν άρθρο αποτελεί μία αρχική εξοικείωση του αναγνώστη με τα ανοικτά δεδομένα, με μία παράλληλη προσπάθεια απόδειξης της χρησιμότητας τους, μέσα από ένα πρακτικό παράδειγμα στηριζόμενο στα ανοικτά δεδομένα της υπηρεσίας προστασίας περιβάλλοντος της Σκωτίας, η οποία είναι ένας μη κυβερνητικός οργανισμός και αποτελεί το κύριο ρυθμιστή περιβαλλοντικής συμμόρφωσης στην Σκωτία. Ο ρόλος της είναι η προστασία του περιβάλλοντος και η ανθρώπινη υγεία.  

Τι είναι ανοικτά δεδομένα;

Το Ίδρυμα Ανοικτής Γνώσης της Ελλάδας (Open Knowledge Foundation Greece), χαρακτηρίζει ως «ανοιχτά» τα δεδομένα που μπορούν ελεύθερα να χρησιμοποιηθούν, να επαναχρησιμοποιηθούν και να αναδιανεμηθούν από οποιονδήποτε – υπό τον όρο να γίνεται αναφορά στους δημιουργούς τους και να διατίθενται, με τη σειρά τους, υπό τους ίδιους όρους.

Οι έννοιες των «ανοιχτών δεδομένων» και των «ανοιχτών κυβερνητικών δεδομένων» έχουν επικρατήσει τα τελευταία χρόνια (σε ορισμένα είδη κυβερνητικών δεδομένων, μπορεί να ισχύουν περιορισμοί εθνικής ασφάλειας). Τα Ανοιχτά Δεδομένα άρχισαν να αναδεικνύονται ιδίως το έτος 2009, όταν πολλές κυβερνήσεις (όπως οι ΗΠΑ, το Ηνωμένο Βασίλειο, ο Καναδάς και η Νέα Ζηλανδία) ανακοίνωσαν τις πρωτοβουλίες τους προς την κατεύθυνση του «ανοίγματος» των δημοσίων πληροφοριών.

Γιατί ανοικτά δεδομένα;

Τα «Ανοιχτά Δεδομένα» και τα «Ανοιχτά Κυβερνητικά Δεδομένα», είναι μια τεράστια πηγή δεδομένων που δεν έχει ακόμα αξιοποιηθεί. Πολλά μεμονωμένα άτομα, αλλά και οργανισμοί, συλλέγουν ένα ευρύ φάσμα διαφορετικών τύπων δεδομένων, προκειμένου να εκπληρώσουν τις εργασίες τους. Τα κυβερνητικά δεδομένα είναι ιδιαίτερα σημαντικά από αυτήν την άποψη, τόσο λόγω της ποσότητας και της καθολικότητάς τους, όσο και λόγω του ότι αυτά τα δεδομένα είναι, από νομικής άποψης, δημόσια δεδομένα και συνεπώς θα μπορούσαν να είναι ανοιχτά και διαθέσιμα σε άλλους να τα χρησιμοποιήσουν.

Ανοικτά συνδεδεμένα δεδομένα

Τα τελευταία χρόνια, η δημοσίευση Δημόσιων Ανοιχτών Δεδομένα στο Web και η μεταξύ τους διασύνδεση (Linked Open Data) κερδίζει συνεχώς έδαφος, αφού οι κυβερνήσεις αντιλαμβάνονται την δυναμική αυτής της πρακτικής: διαφάνεια, ενημέρωση των πολιτών, αύξηση αξιοπιστίας και λειτουργικότητας, δυνατότητα για νέες εφαρμογές.

Τα Συνδεδεμένα Δεδομένα, (Linked Data) αναγνωρίστηκαν ως το επόμενο μεγάλο βήμα εξέλιξης του Ιστού, και το νέφος (Linked Open Date – LOD cloud) το οποίο σχηματίζουν μεγαλώνει με ασύλληπτους ρυθμούς. Αποτελούν δε μακράν την πιο διαδεδομένη και αποδεκτή μέθοδο δημοσιοποίησης δεδομένων στον παγκόσμιο Σημασιολογικό Ιστό.

Η Διεθνής επιστημονική κοινότητα αλλά και πολλές κυβερνήσεις ανά τον κόσμο, έχουν εκτιμήσει τις δυνατότητες και τα οφέλη που μπορούν να προσφέρουν εφαρμογές και υπηρεσίες βασιζόμενες σε αυτά. Το αποτέλεσμα της διαπίστωσης αυτής είναι μια άνευ προηγουμένου, παγκόσμια συλλογική προσπάθεια που στόχο έχει να συμβάλει προς αυτή την κατεύθυνση.

Πρακτικό παράδειγμα αξιοποίησης ανοικτών δεδομένων

Επιλέγοντας την πύλη ανοικτών δεδομένων της υπηρεσίας προστασίας περιβάλλοντος της Σκωτίας (Scottish Environment Protection Agency – SEPA) παρατηρήθηκε ότι το σύνολο των δεδομένων έχει μοντελοποιηθεί και παρέχει τα δεδομένα σε μορφή RDF χρησιμοποιώντας πρότυπα σχήματα (RDFS).

Το μοντέλο RDF (Resource Description Framework) είναι ένα μοντέλο περιγραφής δομημένης πληροφορίας το οποίο ακολουθεί τη δομή ενός γράφου και βασίζεται στη χρήση Uniform Resource Identifier – (URIs) για τη μονοσήμαντη αναφορά σε οντότητες, ενώ τα πρότυπα σχήματα (RDFS) βοηθούν στην χρήση υπαρχόντων RDF λεξιλογίων.

Μελετώντας τα δεδομένα της ανοικτής βάσης της SEPA δημιουργήσαμε το γράφο ενός τμήματος του μοντέλου εννοιών της βάσης το οποίο απεικονίζεται σε εικόνα στο τέλος του άρθρου. Ακόμη εξήχθησαν σημαντικά συμπεράσματα για τις υδάτινες εκτάσεις της Σκωτίας, αρκετά οπτικοποιήθηκαν μέσω του λογισμικού Sgvizler και έγιναν στατιστικές αναλύσεις μέσω του λογισμικού R-studio.

Μέσα στη βάση υπάρχουν πληροφορίες για τους υδάτινους  όγκους που βρίσκονται στη Σκωτία (επιφανειακούς όγκους, λεκάνες απορροής, ύδατα κολύμβησης και υπόγεια ύδατα) και οι περιοχές που εκβάλουν (Περιοχές Yπολεκάνης και Περιοχές Λεκάνης Απορροής Ποταμού). Για τους επιφανειακούς και τους υπόγειους υδάτινους όγκους μπορούμε να βρούμε πληροφορίες για την τοποθεσία τους (γεωγραφικό μήκος και πλάτος), την κατηγορία, το όνομα, την ενιαία αρχή, τον κωδικό ταυτότητας, τον κωδικό wise, και τέλος τη λεκάνη και υπολεκάνη απορροής του ποταμού που ανήκουν. Οι επιφανειακοί όγκοι μπορεί να ανήκουν σε μία από τις ακόλουθες τέσσερις κατηγορίες: ποτάμια, λίμνες, παράκτιοι όγκοι και εκβολές ποταμών και έχουν επιπρόσθετες πληροφορίες, όπως το τρέχον έτος ταξινόμησης, το μήκος σε χιλιόμετρα, η περιοχή του ταχυδρομικού κώδικα και η λεκάνη απορροής. Τα υπόγεια ύδατα ανήκουν σε μία μόνο κατηγορία: υπόγεια ύδατα, και η επιπλέον πληροφορία που έχουν είναι η περιοχή που καλύπτουν σε τ.χλμ. Οι περιοχές λεκάνης απορροής ποταμού έχουν το όνομα, το εμβαδόν της επιφάνειας που καλύπτουν σε τ.χλμ, τον κωδικό wise, αλλά και τις περιοχές υπολεκανών απορροής ποταμού που μπορεί να έχουν. Οι περιοχές υπολεκάνης απορροής ποταμού έχουν το όνομα, την επιφάνεια σε τ.χλμ, τον κωδικό wise, τις λεκάνες απορροής, καθώς και την περιοχή λεκάνης απορροής ποταμού που ανήκουν. Οι λεκάνες απορροής έχουν μόνο έναν τύπο λεκάνης απορροής, που μπορεί να είναι παράκτιος, ποταμόκολπος, κύριος ποταμός ή θαλάσσια περιοχή και μια ετικέτα με το όνομά τους. Τέλος, υπάρχουν τα νερά κολύμβησης που έχουν κωδικό ταυτότητας, μια περιγραφή της κατηγορίας, μια ετικέτα με το όνομά τους, το έτος και την τοποθεσία.

Εκτός από αυτή τη βασική κατηγοριοποίηση, υπάρχουν περισσότερες πληροφορίες και ιδιότητες για τους υδάτινους όγκους και τις περιοχές απορροής που μπορούν να χρησιμοποιηθούν για να μας δώσουν πληροφορίες σχετικά με πολλά θέματα, όπως είναι η ύπαρξη ραδιενεργών ουσιών, οι υπηρεσίες οικοσυστήματος (π.χ. αν είναι ιστορικής σημασίας, αν είναι κατάλληλα για διαφόρους τύπους αθλημάτων κτλ), η σύνδεση με άλλα υπόγεια ύδατα, η πίεση, η ιστοσελίδα, η ύπαρξη εμποδίων για την διέλευση των ψαριών και πολλά άλλα.

Παρακάτω, θα παρουσιάσουμε στατιστικές αναλύσεις και οπτικοποιήσεις για ορισμένα από αυτά τα δεδομένα, καθώς και τον σχετικό σχολιασμό.

Αρχικά λοιπόν, από τα δεδομένα βλέπουμε ότι ο μέσος όρος των επιφανειακών όγκων νερού είναι 46,14 τετραγωνικά χιλιόμετρα με τον μεγαλύτερο να είναι η Sea of Hebrides με επιφάνεια 4454,96 τ.χλμ. Στον παρακάτω χάρτη εμφανίζονται οι θέσεις των 50 μεγαλύτερων υδάτινων όγκων.

Eikona1

Παρατηρούμε ότι όλες οι περιοχές βρίσκονται στις ακτές της Σκοτίας και των νησιών της. Στο παρακάτω θηκόγραμμα βλέπουμε ότι η πλειοψηφία των υδάτινων όγκων έχει επιφάνεια μικρότερη από 1000τ.χλμ. όπως φαίνεται από το κύριο σώμα με κάποιες έκτοπες τιμές να τα ξεπερνούν και να φτάνουν πάνω από 4000 τ.χλμ.

Eikona2

Στα δύο παρακάτω ιστογράμματα βλέπουμε ότι η πλειοψηφία των υδάτινων όγκων βρίσκεται ανάμεσα στα 0 και 500 τ.χλμ.

Eikona3

Eikona4

Από το παραπάνω γράφημα προκύπτει η συσχέτιση μεταξύ της έκτασης σε τετραγωνικά χιλιόμετρα και της βεβαιότητας ορθής πρόβλεψης της κατηγορίας της εν λόγω έκτασης, για τις 50 μεγαλύτερες σε έκταση (SqKm) υδάτινες εκτάσεις.

Από το ανωτέρω γράφημα και την σχετική παλινδρόμηση προκύπτει μια ανεπαίσθητη θετική συσχέτιση της τάξης του 0,1, ήτοι όσο αυξάνεται η έκταση της υδάτινης περιοχής τόσο αυξάνεται και η πιθανότητα ορθής πρόβλεψης της κατηγορίας της εν λόγω υδάτινης περιοχής!

Μπορεί να μην υφίσταται ιδιαίτερο ερευνητικό ενδιαφέρον σε αυτό το συμπέρασμα, καθ΄όσον η διαθεσιμότητα και η ποιότητα των δεδομένων στην ανοικτή βάση της SEPA δεν επαρκούσε για εκτενέστερες και πιο αξιοποιήσιμες στατιστικές συσχετίσεις και αναλύσεις, ωστόσο αποτελεί μια απόδειξη εύκολης χρήσης στατιστικών εργαλείων σε ανοικτά δεδομένα αλλά ταυτόχρονα και μια χαλαρή επιβεβαίωση ορθής χρήσης των εργαλείων στατιστικής ανάλυσης, καθώς συντάσσεται με την κοινή λογική ότι όσο μεγαλύτερη η έκταση μιας υδάτινης περιοχής τόσο πιθανότερο να χαρακτηριστεί ορθά ως προς την κατηγορία της.

Προχωρώντας στα ποτάμια, βλέπουμε ότι ο μέσος όρος του μήκους των ποταμών είναι 9,06χλμ με 2121 ποτάμια να βρίσκονται πάνω από το μέσο όρο και 1127 κάτω από αυτό. Το μακρύτερο από τα ποτάμια έχει μήκος 9,999χλμ και βρίσκεται στη Σκωτία, ενώ το μικρότερο έχει μήκος 0,78 και βρίσκεται στο Solway Tweed.

Ένα άλλο σημαντικό στοιχείο το οποίο προκύπτει από τα δεδομένα είναι ότι από όλους τους υδάτινους όγκους οι 4260 είναι φυσικοί και οι 44 τεχνητοί, όπως φαίνεται και από το παρακάτω διάγραμμα πίτας.

Eikona5

Στο διάγραμμα, με μπλε χρώμα και το γράμμα Ν εμφανίζονται οι φυσικοί υδάτινοι όγκοι και με το κόκκινο και το γράμμα Υ οι τεχνητοί. Όπως είναι φανερό, οι τεχνητοί όγκοι είναι πάρα πολύ λίγοι.

Στη συνέχεια θα προχωρήσουμε σε μία πολύ σημαντική κατηγοριοποίηση. Θα δούμε σε ποιες περιοχές έχουν σημειωθεί γεγονότα που σχετίζονται με ραδιενεργές ουσίες. Σαν πράσινες αναφέρονται περιοχές στις οποίες δεν έχει συμβεί κανένα τέτοιο γεγονός, σαν πορτοκαλί περιοχές στις οποίες έγιναν κάποια μικρά γεγονότα και σαν κόκκινες, περιοχές στις οποίες έχει συμβεί κάποιο σημαντικό γεγονός. Στον παρακάτω πίνακα βλέπουμε τον αριθμό των περιοχών για την κάθε κατηγορία καθώς και το ποσοστό της κατηγορίας στο σύνολο των περιοχών.

count percentage
«Green» «3661» «0.89»
«Amber» «114» «0.03»
«Red» «332» «0.08»

Βλέπουμε ότι στο 89% των περιοχών δεν έχει συμβεί κάποιο γεγονός στο οποίο να εκλύθηκαν ραδιενεργές ουσίες, ενώ μόλις στο 8% έχει συμβεί ένα σημαντικό γεγονός.

Είναι επίσης σημαντικό φυσικά να δούμε που βρίσκονται οι 50 μεγαλύτερες υδάτινες περιοχές που έχουν τον κωδικό RED. Στην παρακάτω εικόνα βλέπουμε ότι είναι συγκεντρωμένες σε μία γεωγραφική περιοχή.

Eikona6

Κάνοντας ζουμ βλέπουμε ότι όλες είναι στην ευρύτερη περιοχή του Galloway Park.

Eikona7

Αναλύοντας τα δεδομένα παρατηρούμε ότι κατά μήκος όλων των υδάτινων όγκων, υπάρχουν 3799 σημεία τα οποία εμποδίζουν την διέλευση των ψαριών. Τα εμπόδια αυτά μπορεί να είναι φυσικά, όπως κάποιος καταρράκτης ή και τεχνητά όπως κάποιο φράγμα. Στον παρακάτω πίνακα εμφανίζονται οι τύποι των εμποδίων που μπορεί να συναντήσουν τα ψάρια

type
«(Denil fish pass installed)» «offtake» «tailrace»
«<Null>» «outflow» «wall»
«Fish pass» «pipe» «water gate»
«Lade» «pipe bridge» «waterfall»
«Natural limit to migration» «pipeline/ gabion basket» «waterfall + dam»
«Road» «removed» «weir»
«Unknown» «retainer» «weir & waterfall»
«Unmaintained Water Gate» «retaining wall» «weir and bridge»
«abstraction» «screen» «weir with fish pass»
«artificial concrete base» «sediment trap» «intake»
«bedrock» «sluice» «lock»
«boulders» «spillway» «mill race»
«bridge apron» «tail race» «culvert with wooden baffles»
«bridge apron & culvert» «fallen tree» «dam»
«causeway» «fish pass» «dry channel»
«concrete bar» «fish scarer» «eel trap»
«crump weir with fish pass» «fish trap» «ford»
«culvert» «flow diversion» «heck»
«culvert / bridge apron» «flume» «impoundment»
«culvert with fish pass» «foot bridge»

Σύμφωνα και με την αντίστοιχη οπτικοποίηση, παρατηρούμε ότι το μεγαλύτερο ποσοστό εμποδίων που αντιμετωπίζουν τα ψάρια είναι οι καταρράκτες.

Eikona8

Στη συνέχεια προχωράμε στα νερά που είναι κατάλληλα για κολύμβηση. Η συγκεκριμένη πληροφορία μπορεί να μας βοηθήσει μελλοντικά να μελετήσουμε το κλίμα στις συγκεκριμένες περιοχές ώστε να βγάλουμε κάποια συμπεράσματα για το αν τελικά επηρεάζει και πόσο η γεωγραφική θέση στην ποιότητα των υδάτων. Έτσι, με αυτόν τον τρόπο, θα μπορέσουμε να ενισχύσουμε και διάφορες δραστηριότητες είτε τουριστικού περιεχομένου είτε άλλων.

Eikona9

Παρατηρούμε ότι στην περιοχή στην οποία βρίσκονταν υδάτινοι όγκοι με κατηγοριοποίηση RED, υπάρχουν μέρη για κολύμβηση.

Στη συνέχεια θα ασχοληθούμε με τις λεκάνες απορροής. Στον παρακάτω πίνακα βλέπουμε πόσες λεκάνες απορροής υπάρχουν για κάθε τύπο.

Type Nomber of costals
Coastal 237
Main River 97
Estuarine 29
Sea Area 30

Στο διάγραμμα εμφανίζεται οπτικοποιημένη η παραπάνω πληροφορία, και παρατηρούμε ότι η πλειοψηφία των λεκανών απορροής, πάνω από 50% είναι παράκτιες.

Eikona10

Τέλος θα ασχοληθούμε με τις λίμνες οι οποίες καταλήγουν σε μία λεκάνη απορροής. Μελετώντας όλες τις λίμνες, ξεχωρίζουμε αυτές που χαρακτηρίζονται ως ιστορικής σημασίας και που επίσης έχουν έκταση πάνω από 1 τετραγωνικό  χιλιόμετρο.

Στο παρακάτω θηκόγραμμα, βλέπουμε ότι η πλειοψηφία των λιμνών έχει μικρή έκραση που κυμαίνεται από 1 έως περίπου 5τ.χλμ. Υπάρχουν και κάποιες μεγαλύτερες λίμνες που φτάνουν και τα 50 τ.χλμ και εμφανίζονται στο διάγραμμα σαν έκτοπες τιμές.

Eikona11

Από το ιστόγραμμα βλέπουμε ότι η πλειοψηφία των λιμνών βρίσκεται ανάμεσα στα 1 με 5 τ.χλμ. με λίγες ακόμα να φτάνουν τα 10 τ.χλμ. και ελάχιστες από αυτές να έχουν μεγαλύτερη επιφάνεια, όπως φάνηκε άλλωστε και από το θηκόγραμμα.

Eikona12

Στον παρακάτω πίνακα βλέπουμε μόνο τις λίμνες οι οποίες βρίσκονται στα Highlands και χαρακτηρίζονται ως περιοχές ιστορικής σημασίας ενώ ταυτόχρονα έχουν έκταση πάνω από 10 τετραγωνικά χιλιόμετρα.

districtname label area
West Highland Fionn Loch 10.14
West Highland Loch Maree 27.98
West Highland Loch Morar 26.83
North Highland Loch Fannich 10.8
North Highland Loch Cluanie 10.46
North Highland Loch Quoich 17.46
North Highland Loch Ness 55.33
North Highland Loch Shin 32.93

Στον παρακάτω χάρτη εμφανίζονται και οι τοποθεσίες των παρακάτω λιμνών.

Eikona13

Λαμβάνοντας όλα τα προαναφερόμενα υπόψη προσπαθήσαμε να αναδείξουμε τις άπειρες δυνατότητες που μας προσφέρει ο σημασιολογικός ιστός μέσα από ένα πρακτικό παράδειγμα περιβαλλοντολογικού ενδιαφέροντος. Προφανώς τα ανοικτά δεδομένα μπορούν να αφορούν ποικίλους κλάδους και η αξιοποίηση τους να συμβάλει ουσιωδώς στην δημιουργία νέας, επίκαιρης και χρήσιμης γνώσης.

Το άρθρο αυτό επιμελήθηκε και συντάχθηκε από τους μεταπτυχιακούς φοιτητές: Καραγιάννη Αναστασία, Κιουμουσίδου Μαρία, Κουνταρδάς Νεόφυτος, Κυριακίδου Ευγενία & Τερζίδου Μαρία, στην κατεύθυνση «Ηλεκτρονικού Επιχειρείν και Τεχνολογίας Καινοτομίας (E-Business and Innovation Technology» του προγράμματος μεταπτυχιακών σπουδών του τμήματος Εφαρμοσμένης Πληροφορικής του Πανεπιστημίου Μακεδονίας, στα πλαίσια του μαθήματος «Τεχνολογίες Ιστού και Ανάλυση Δεδομένων Ιστού» με υπεύθυνο καθηγητή τον κ. Ταμπούρη Ευθύμιο.

ΡΗΤΩΣ ΑΠΑΓΟΡΕΥΕΤΑΙ ΟΠΟΙΑΔΗΠΟΤΕ ΑΠΟΣΠΑΣΜΑΤΙΚΗ ΑΝΑΔΗΜΟΣΙΕΥΣΗ ΧΩΡΙΣ ΤΗΝ ΑΔΕΙΑ ΤΩΝ ΜΕΛΕΤΗΤΩΝ

Leave a Comment