ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Τα Ανοιχτά Δεδομένα δίνουν πραγματική δύναμη στους ανθρώπους: Ένας οδηγός δημοσίευσης ανοικτών δεδομένων

Κάθε μέρα, οι κυβερνήσεις και οι κρατικούς φορείς  δημοσιεύουν περισσότερα δεδομένα στο Διαδίκτυο.  Η κοινή χρήση αυτών των δεδομένων επιτρέπει τη μεγαλύτερη διαφάνεια, παρέχει πιο αποτελεσματικές δημόσιες υπηρεσίες και ενθαρρύνει τη μεγαλύτερη δημόσια ή εμπορική χρήση και την επαναχρησιμοποίηση των κυβερνητικών πληροφοριών. Ορισμένες κυβερνήσεις έχουν δημιουργήσει ακόμη και καταλόγους ή πύλες (όπως data.gov) ώστε να είναι εύκολο για το κοινό να βρει και να χρησιμοποιήσει αυτά τα δεδομένα.

Για να βοηθήσει τις κυβερνήσεις να ανοίξουν και να μοιράζονται τα δεδομένα τους, το W3C eGov Interest Group έχει αναπτύξει  μερικές κατευθυντήριες γραμμές. Αυτά τα απλά βήματα τονίζουν πρότυπα και μεθοδολογίες για να ενθαρρύνουν τη δημοσίευση δημόσιων δεδομένων, επιτρέποντας στο κοινό να χρησιμοποιήσει αυτά τα δεδομένα με νέους και καινοτόμους τρόπους.

osdc_liberate docs_1109ay

Εντοπισμός δεδομένων
Η ικανότητα να εντοπίζουμε πράγματα από ένα URI / URL, είναι το θεμέλιο του Διαδικτύου. Οι βέλτιστες πρακτικές για τα “ανοιχτά κυβερνητικά δεδομένα” εξαρτώνται από την εφαρμογή της αρχιτεκτονικής που περιγράφεται στην Αρχιτεκτονική του Παγκοσμίου Ιστού, Τόμος1.

Αν δώσετε μόνιμα, με πατέντα ή / και ανιχνεύσιμα URI / URLs στα δεδομένα σας, οι διαδικασίες και οι άνθρωποι θα είναι σε θέση να τα βρουν και να τα χρησιμοποιήσουν πιο εύκολα. Τα URI / URLs μπορεί να χρησιμοποιηθούν σε βάσεις δεδομένων και τα μεταδεδομένα ως καθολικά, μοναδικά αναγνωριστικά (π.χ. με την προσθήκη στο σειριακό αριθμό ή σε άλλο σύστημα εσωτερικής ονομασίας σε έναν τομέα: http://www.example.gov/objects/optional-hierarchy/serial12345678.html ).
Χρησιμοποιήστε τα εσωτερικά αναγνωριστικά για τον εντοπισμό συγκεκριμένων δεδομένων για την μηχανική επαναχρησιμοποίηση (π.χ., http://www.census.gov/main/www/popclock.html). Με τη χρήση των URIs, και ενσωματώνοντας τις εσωτερικές διασυνδέσεις στο εσωτερικό μεγάλων αρχείων ή εγγράφων, οι άνθρωποι μπορούν έγκυρα να αναφέρουν τις σχετικές πληροφορίες στις δικές τους ιστοσελίδες.

Τεκμηρίωση δεδομένων
Χωρίς τεκμηρίωση, τα δεδομένα δεν είναι πολύ χρήσιμα. Όταν είναι δυνατόν, θα πρέπει να χρησιμοποιήσετε τα πρότυπα του κλάδου, όπως αυτά που βασίζονται σε XML / RDF, δεδομένου ότι τείνουν να είναι αυτο-τεκμηριωμένα. Δημιουργήστε μια ιστοσελίδα με μια απλή περιγραφή του συνόλου δεδομένων, ώστε να βοηθήσετε τις μηχανές αναζήτησης να βρουν τα δεδομένα και οι άνθρωποι να μπορούν να τα χρησιμοποιήσουν. Η περιγραφή θα πρέπει να εξηγεί πώς να βρείτε τις σελίδες ή / και τα αρχεία, και να περιγράφει το περιεχόμενο των αρχείων. Κατ ‘ελάχιστον, να τεκμηριώνει τον τίτλο, την περιγραφή, την ημερομηνία δημοσίευσης και μία έγκυρη πηγή για τα δεδομένα. Χρησιμοποιήστε σαφή γλώσσα και μία σύνδεση με τις σχετικές πληροφορίες, ώστε να βοηθήσει να βάλει τα δεδομένα σε ένα ευρύτερο πλαίσιο. Όταν είναι δυνατόν, επίσης, τεκμηριώστε πλήρως την περιγραφή του κάθε δεδομένου, του προτύπου των δεδομένων και / ή την επικύρωση των δεδομένων (π.χ., εάν δεδομένο είναι η θερμοκρασία, επίσης, να εξηγήτε το σχετικό πρότυπο, όπως Κελσίου, Φαρενάιτ ή Κέλβιν). Να επωφεληθείτε από τα αναδυόμενα πρότυπα, για την περιγραφή συνόλων δεδομένων. Εφαρμόστε τα εργαλεία αναζήτησης των εγγράφων καθώς και οποιαδήποτε ξεκούραστη μέθοδο απόκτησης των δεδομένων, όταν διατίθεται.

Σύνδεση δεδομένων
Το επόμενο βήμα, πέρα από τα ανεπεξέργαστα δεδομένα, είναι τα πλήρως συνδεδεμένα δεδομένα. Υπάρχει ένα φάσμα από τα ανεπεξέργαστα σε πλήρως συνδεδεμένα δεδομένα και τα πρότυπα, όπως το RDF που μπορεί να σας βοηθήσει να συνδέσετε τα δεδομένα σας.
Παρακάτω αναφέρονται οι τέσσερις προσδοκίες, για το δίκτυο των συνδεδεμένων δεδομένων:
1. Τα URIs θα είναι τα ονόματα για τα πράγματα
2. Τα URIs HTTP θα βοηθουν τους ανθρώπους να βρουν αυτά τα πράγματα
3. Όταν κάποιος αναζητά ένα URI, θα πρέπει να βρίσκουν χρήσιμες πληροφορίες
4. Σύνδεσμοι εντός των δεδομένων σας, που βρίσκονται σε άλλα URIs, θα βοηθούν τους ανθρώπους να ανακαλύπτουν περισσότερα, που σχετίζονται με τα πράγματα.
Χρησιμοποιώντας URIs όπως περιγράφεται, θα παρέχουν ένα πλούσιο και εύκολα διασυνδεδεμένο web των δεδομένων, το οποίο θα είναι πιο εύκολο για τις αναζητήσεις και την χρησιμοποίηση από το κοινό. Ωστόσο, πολλές βάσεις δεδομένων δεν χρησιμοποιούν URIs, αλλά αντ’ αυτού χρησιμοποιούν εσωτερικά προερχόμενα μοναδικά αναγνωριστικά. Για να συνδέσετε αυτά τα δεδομένα στο ευρύτερο διαδίκτυο, θα πρέπει να χρησιμοποιηθούν συστήματα που μπορούν να προβλέψουν ή να «χτίσουν» τα URIs, πριν από τη δημοσίευση των δεδομένων.

Διατήρηση δεδομένων
Η διατήρηση των δεδομένων που δημοσιεύονται, είναι μία από τις μεγαλύτερες ανησυχίες των κυβερνήσεων. Πώς μπορούμε να διασφαλίσουμε ότι τα δεδομένα είναι διαθέσιμα και μπορούν να χρησιμοποιούνται, για όσο διάστημα οι άνθρωποι τα έχουν ανάγκη; Οι άνθρωποι μπορούν να συνεχίσουν να επικαλούνται τα παλαιότερα δεδομένα στο αρχικό URI δεκαετίες μετά, την αρχική δημοσίευση τους.
Για να διατηρηθεί η ιστορία ενός συνόλου δεδομένων, σκεφτείτε για το πώς θα ενσωματώσετε νέα URIs στα νέα αναβαθμισμένα σύνολα δεδομένων και στη συνέχεια να τροποποιήσετε αναλόγως τη δομή των URIs σας. Χρησιμοποιήστε εκδόσεις στο συνόλων των δεδομένων, ώστε οι άνθρωποι να μπορούν να αναφέρουν και να συνδέονται, με τις παρούσες και τις παρελθούσες εκδόσεις. Νέα και αναβαθμισμένα σύνολα δεδομένων, μπορεί να ανατρέξουν πίσω στις αρχικές βάσεις δεδομένων. Εάν χρειάζεται, να παρέχετε εργαλεία, ώστε να «μεταφραστούν» τα παλαιότερα δεδομένα. Τεκμηριώστε προσεκτικά τις αλλαγές μεταξύ των εκδόσεων και να ενσωματώσετε την έκδοση αριθμού / δείκτη μέσα στα δεδομένα, αν είναι δυνατόν. Εξετάστε τη μορφή του αρχείου προσεκτικά, και να επιλέξετε ανοικτά πρότυπα, τα οποία δεν είναι ειδικό λογισμικό.

Σύνδεση δεδομένων με interfaces
Αν θέλετε πραγματικά να βοηθήσετε τους ανθρώπους να ανακαλύψουν και να εξερευνήσουν τα δεδομένα που δημοσιεύετε, υπάρχουν μερικά χρήσιμα πρότυπα του W3C, τα οποία μπορούν να βοηθήσουν. Είναι δυνατόν τα δεδομένα να γίνουν αναγνώσιμα από τον άνθρωπο, με τη χρήση XSLT, για αυτά τα δεδομένα που βασίζονται σε XML και RDF. Κάντε τις ιστοσελίδες αναγνώσιμες από μηχάνημα με την ενσωμάτωση σημασιολογικής πληροφορίας στην HTML, χρησιμοποιώντας RDF ή / και Microformats. (Σημειώστε ότι οι μηχανές αναζήτησης μπορούν να επωφεληθούν των ενσωματωμένων σημασιολογικών πληροφοριών, βοηθώντας περισσότερους ανθρώπους να βρουν τα στοιχεία σας.) Εάν είναι πάρα πολύ δύσκολο να προσαρτήσετε XSL ή CSS στυλ στα παλιά δεδομένα, είναι ακόμα δυνατό να περιγράψετε πώς να μετατραπούν τα δεδομένα με την βοήθεια μιας ειδικής ή γενικής μηχανής XSLT (για παράδειγμα, δείτε http://www.xmldatasets.net).
Τα εξωτερικά μέρη μπορούν να δημιουργήσουν νέες και συναρπαστικές διασυνδέσεις που μπορεί να μην είναι προφανείς για τους εκδότες των δεδομένων. Για το λόγο αυτό, δεν θέτουν σε κίνδυνο την ακεραιότητα των δεδομένων, προκειμένου να δημιουργήσουν φανταχτερές διασυνδέσεις. Εάν πρέπει να δημιουργήσετε μια διεπαφή, τότε δημοσιεύστε τα στοιχεία χωριστά από το περιβάλλον, και να εξασφαλίσετε ώστε τα εξωτερικά μέρη, να έχουν άμεση πρόσβαση στα πρωτογενή δεδομένα, ώστε να μπορούν να δημιουργήσουν δικές τους διεπαφές, εφόσον το επιθυμούν.
Επιπλέον, δεδομένου ότι όλα τα  έγγραφα στον παγκόσμιο ιστό, χρησιμοποιούν (X) HTML, XML και τα RDF μπορεί να χρησιμοποιηθούν ως αντικείμενα βάσης δεδομένων, και το κοινό μπορεί να δημιουργήσει λογισμικό, εφαρμογές Web και mash-ups που να χρησιμοποιούν τα σύνολα των δεδομένων, και να συνδεθούν πίσω με την αυθεντική έκδοση στην ιστοσελίδα της κυβέρνησης. Δύο πρότυπες γλώσσες W3C , που μπορούν να το κάνουν εφικτό, είναι οι XQuery και SPARQL. Μόλις δημοσιεύσετε τα δεδομένα σας, οι ίδιες οι κυβερνήσεις μπορούν επίσης να δημιουργήσουν ένα φιλικό προς το χρήστη διαφανές interface, που να επιτρέπει στους χρήστες να έχουν πρόσβαση και εσείς να βελτιώσετε τις πληροφορίες που τους ενδιαφέρουν.

Δημιουργία τυπικών ονομάτων / URIs για όλα τα  αντικείμενα
Έχοντας ένα μοναδικό αναγνωριστικό για κάθε εγγεγραμμένη εταιρεία ή αντικείμενο, είναι εξίσου σημαντική πληροφορία, σχετικά με τις λοιπές πληροφορίες των εν λόγω εταιρειών ή αντικειμένων. Εκτός από τη χρήση ανοικτών προτύπων στην βιομηχανία, θα πρέπει να καταβληθεί προσπάθεια για να καταρτιστεί ένας κατάλογος, όλων των κρατικών φορέων και των κρατικών αντικειμένων. Τα URIs, θα μπορούν στη συνέχεια να χρησιμοποιηθούν σε όλα τα δεδομένα. Αυτό βοηθά στη δυνατότητα εντοπισμού, βελτιώνει τα μεταδεδομένα, και εξασφαλίζει την αυθεντικότητα.

Επιλογή δεδομένων για δημοσίευση

 Όλα τα δεδομένα που μπορεί να μοιραστούν στο κοινό, θα πρέπει να ανοιχθούν για δημόσια διάδοση. Τα δεδομένα πρέπει να δημοσιεύονται σύμφωνα με τους ισχύοντες νόμους και κανονισμούς, και μόνο αφού ληφθούν υπόψη τα ζητήματα της ασφάλειας και της ιδιωτικής ζωής.
Πρώτα δημοσιεύστε όλα τα δεδομένα που είναι ήδη διαθέσιμα σε άλλες μορφές (όπως εκτυπωμένα), ή ήδη συλλέγονται και ανταλλάσσονται με το κοινό και με άλλους τρόπους. Δημοσιεύστε τα εξαιρετικά δομημένα δεδομένα, αλλά και τα έγγραφα κειμένου. Δημοσιεύστε νόμους, κανονισμούς και κώδικες, και δημόσια έγγραφα που σχετίζονται με την αποστολή της κρατικής υπηρεσίας, το όραμα, τις αξίες και τους στόχους της.
Υπάρχουν πολλά πρότυπα για τέτοια έγγραφα [όπως Strategy Markup Language (StratML), XBRL και άλλοι]. Η χρήση των προτύπων επιτρέπει στους ενδιαφερομένους να ανακαλύψουν εύκολα και να παρέχουν ανατροφοδότηση σχετικά με τα στοιχεία που τους ενδιαφέρουν. Η δημιουργία και η δημοσίευση νέων εγγράφων σε διάφορες τυπικές μορφές είναι πιο εύκολο από ό, τι αυτό να καθορίζεται μετά τη δημιουργία του εγγράφου.

Καθώς δημιουργείτε τεκμηρίωση για τα δεδομένα, συμπεριλάβετε και τα σχήματα αναφοράς XML , τα DTDs (Document Type Definition) και τις ταξινομήσεις. Εξηγήστε πώς να ανακαλύψουν όλα τα αρχεία / έγγραφα σε μια συλλογή. Χρησιμοποιήστε τα πρότυπα syndication και τα εργαλεία για να ανακοινώσετε τις προσθήκες ή τις αλλαγές. Να παρέχετε πλήρη τεκμηρίωση, ώστε να ενεργοποιήσετε αυτόματα τη δημιουργία των λεξικών δεδομένων και την παροχή υπηρεσιών ερωτήσεων, ώστε να καταστήσετε ευκολότερο για το κοινό να βρει τα έγγραφα και τα σύνολα δεδομένων σας.

Επιλoγή του σωστού σχήματος για τα δεδομένα
Υπάρχουν πολλές διαφορετικές μορφές δεδομένων, ποια όμως θα λειτουργήσει καλύτερα με τα δεδομένα σας; Η κύρια αναγνώσιμη μορφή των δεδομένων, από τον άνθρωπο είναι η (X) HTML.
Τα ακατέργαστα δεδομένα είναι πιο πιθανό να παραχθούν χρησιμοποιώντας μορφές προσαρμοσμένες στα συγκεκριμένα δεδομένα, τα εργαλεία που χρησιμοποιούνται, ή τα πρότυπα του κλάδου. Το W3C έχει πρωτοπορήσει σε XML και RDF, τα οποία επιτρέπουν την άριστη μορφοποίηση και τυποποιημένα σύνολα εργαλείων. Στα RDF και XML αρχεία μπορούν να έχουν πρόσβαση, όπως στις βάσεις δεδομένων, χρησιμοποιώντας SPARQL, XQuery, JavaScript και πολλές άλλες γλώσσες προγραμματισμού. Όταν είναι δυνατόν, να χρησιμοποιείτε γνωστά ανοικτά πρότυπα, και εργαλεία που επιτρέπουν την εύκολη – αποτελεσματική παραγωγή και τη δημοσίευση των στοιχείων. Επίσης, να έχετε κατά νου τη δύναμη των συνδεδεμένων δεδομένων.

Περιορισμοί σχετικά με τη χρήση των δεδομένων
Αφού έχετε κάνει διαθέσιμα τα δεδομένα σας, φροντίστε να τεκμηριώνουν με σαφήνεια τυχόν νομικούς ή κανονιστικούς περιορισμούς, όσον αφορά τη χρήση τους. Σε πολλές περιπτώσεις, υπάρχουν καθορισμένα πρότυπα για την εισαγωγή των πνευματικών δικαιωμάτων ή / και πληροφορίες αδειοδότησης δεξιά στα δεδομένα (βλ πρότυπα μεταδεδομένων, όπως το Dublin Core). Είναι πολύ σημαντικό να είμαστε σαφείς σχετικά με τις αναμενόμενες χρήσεις, πιστώσεις, τους περιορισμούς και τις ευθύνες που έχουν ιδιαίτερη μέρη σε σχέση με την εργασία με και την παροχή των δεδομένων.

Πηγή: http://www.w3.org/TR/gov-data/

Leave a Comment