ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Η Σημασία των Ανοιχτών Δεδομένων στο Τομέα της Υγείας

Τι είναι Ανοικτά Δεδομένα;

Είναι δεδομένα τα οποία είναι ελεύθερα και διαθέσιμα να χρησιμοποιηθούν, επαναχρησιμοποιηθούν και αναδιανεμηθούν από οποιονδήποτε – υπό τον όρο να γίνεται αναφορά στους δημιουργούς και να διατίθενται, με τη σειρά τους, υπό τους ίδιους όρους (Open Knowledge Foundation, 2012).

Τι είναι Ανοικτά Κυβερνητικά Δεδομένα;

Ως ανοικτά κυβερνητικά δεδομένα αναφέρονται οι πληροφορίες που συλλέγονται, παράγονται ή ανατίθενται από τους δημόσιους φορείς ελεύθερα για επαναχρησιμοποίηση.

Ειδικά για το χώρο της υγείας ισχύουν οι ορισμοί υπό τις αυστηρές αρχές διατήρησης της ιδιωτικότητας και της εμπιστευτικότητας των ευαίσθητων προσωπικών δεδομένων.

Χρησιμότητα ΑΔ στον τομέα Υγείας

  • Διαφάνεια στο Εθνικό Σύστημα Υγείας –> Ενίσχυση καταπολέμησης της διαφθοράς
  • Βελτίωση παρεχόμενων υπηρεσιών -> Ικανοποίηση Ασθενών
  • Πρόληψη και προαγωγή της υγείας –> Αντίκρισμα στην υγιή διαβίωση των πολιτών

Τα Ανοικτά Δεδομένα είναι πλέον νομική υποχρέωση του Δημοσίου στην Ελλάδα και για το λόγο αυτό υπάρχει το Μητρώο ανοικτών δεδομένων, www.data.gov.gr (Ν. 4305/2014), όπου μεταξύ άλλων θεμάτων δημοσιεύονται ανοικτά δεδομένα που αφορούν την Υγεία.

Στον τομέα της Υγείας μέχρι σήμερα έχουν ενταχθεί μόνο 36 φορείς και έχουν αναρτηθεί περίπου 500 σύνολα δεδομένων → περιορισμένη η ανταπόκριση, πολλά datasets σε μη μηχαναγνώσιμη μορφή (pdf, doc κτλ).

Παραδείγματα αξιοποίησης ανοικτών δεδομένων στον τομέα της υγείας παγκοσμίως

Για την αναφορά συγκεκριμένων παραδειγμάτων αξιοποίησης των Ανοικτών Δεδομένων στον τομέα της Υγείας χρησιμοποιήσαμε την πύλη Wikidata. Το Wikidata είναι μια δωρεάν, συνεργατική, ανοιχτή, πολύγλωσση, δευτερογενής βάση δεδομένων, η οποία συλλέγει δομημένα δεδομένα για να παρέχει υποστήριξη για το Wikipedia, το Wikimedia Common, τα άλλα wikis του Wiki movement και σε οποιονδήποτε στον κόσμο. Το Wikidata παρέχει επίσης υποστήριξη σε πολλά άλλα sites και υπηρεσίες, πέρα από τα έργα του Wikimedia. Παρατηρήθηκε ότι το σύνολο των δεδομένων έχει μοντελοποιηθεί και παρέχει τα δεδομένα σε μορφή RDF χρησιμοποιώντας πρότυπα σχήματα (RDFS). Η συγκεκριμένη πύλη καλύπτει πληθώρα θεμάτων, μεταξύ των οποίων είναι η Υγεία, ο Τουρισμός, η Διασκέδαση, Πληροφορίες για τους Πληθυσμούς χωρών, Αρχαιολογικά Μουσεία κτλ, ενώ εμείς αναζητήσαμε πληροφορίες και εκτελέσαμε ερωτήματα αποκλειστικά για τον τομέα της υγείας. Το περιεχόμενο του Wikidata διατίθεται υπό ελεύθερη άδεια χρήσης, εξάγεται με τη χρήση τυποποιημένων μορφών και μπορεί να συνδεθεί με άλλα ανοιχτά σύνολα δεδομένων στον Συνδεδεμένο Ιστό Δεδομένων. Συγκεκριμένα:

  • Δωρεάν: Τα δεδομένα του Wikidata δημοσιεύονται με την άδεια του Creative Commons Public Domain Dedication 1.0, επιτρέποντας την επαναχρησιμοποίηση των δεδομένων σε πολλά διαφορετικά σενάρια. Μπορεί κανείς να αντιγράψει, να τροποποιήσει, να διανείμει και να εκτελέσει τα δεδομένα, ακόμη και για εμπορικούς σκοπούς, χωρίς να ζητήσει άδεια.
  • Συνεργατική βάση: Τα δεδομένα εισάγονται και διατηρούνται από τους εκδότες του Wikidata, οι οποίοι αποφασίζουν για τους κανόνες δημιουργίας και διαχείρισης περιεχομένου. Αυτοματοποιημένα προγράμματα ηλεκτρονικών υπολογιστών εισάγουν επίσης δεδομένα στο Wikidata.
  • Πολύγλωσση βάση: Η επεξεργασία, η περιήγηση και η επαναχρησιμοποίηση των δεδομένων είναι πολύγλωσση. Τα δεδομένα που εισάγονται σε οποιαδήποτε γλώσσα είναι άμεσα διαθέσιμα σε όλες τις άλλες γλώσσες. Η επεξεργασία σε οποιαδήποτε γλώσσα είναι δυνατή και ενθαρρύνεται.
  • Δευτερογενής Βάση Δεδομένων: Το Wikitata καταγράφει όχι μόνο τις δηλώσεις, αλλά και τις πηγές τους, καθώς και τις συνδέσεις με άλλες βάσεις δεδομένων. Αυτό αντανακλά την ποικιλομορφία των διαθέσιμων γνώσεων και υποστηρίζει την έννοια της επαληθεύσεως.
  • Συλλογή δομημένων δεδομένων: Η επιβολή ενός υψηλού βαθμού δομημένης οργάνωσης επιτρέπει την εύκολη επαναχρησιμοποίηση δεδομένων από έργα του Wikimedia και από τρίτους και επιτρέπει στους υπολογιστές να επεξεργάζονται και να το «κατανοούν».
  • Υποστήριξη για τα Wikimedia Wikis: Το Wikitata βοηθάει το Wikipedia με πιο εύκολα πλαίσια πληροφοριών και συνδέσμους σε άλλες γλώσσες, μειώνοντας έτσι το φόρτο εργασίας επεξεργασίας βελτιώνοντας παράλληλα την ποιότητα. Οι ενημερώσεις σε μία γλώσσα είναι διαθέσιμες σε όλες τις άλλες γλώσσες.
  • Χρήση από οποιονδήποτε: Οποιοσδήποτε μπορεί να χρησιμοποιήσει το Wikitata για οποιονδήποτε αριθμό διαφορετικών τρόπων, χρησιμοποιώντας τη διεπαφή προγραμματισμού εφαρμογών του.

Όπως ήδη γνωρίζουμε, η SPARQL είναι μια γλώσσα ερωτημάτων η οποία έχει σχεδιαστεί ώστε να χρησιμοποιεί παρόμοια σύνταξη με την SQL, με στόχο ωστόσο να αποκτά δεδομένα από RDF stores.

Το sparql endpoint του Wikidata βρίσκεται στο ακόλουθο link: https://query.wikidata.org/ ενώ το λεξιλόγιο της πύλης μπορεί να βρει κανείς στο link: https://bit.ly/31dgnOz.

Το μοντέλο RDF (Resource Description Framework) είναι ένα μοντέλο περιγραφής δομημένης πληροφορίας το οποίο ακολουθεί τη δομή ενός γράφου και βασίζεται στη χρήση Uniform Resource Identifier – (URIs) για τη μονοσήμαντη αναφορά σε οντότητες, ενώ τα πρότυπα σχήματα (RDFS) βοηθούν στην χρήση υπαρχόντων RDF λεξιλογίων.

Μελετώντας τα δεδομένα της ανοικτής βάσης της Wikidata, δημιούργησαμε το γράφο ενός τμήματος του μοντέλου εννοιών της βάσης το οποίο απεικονίζεται παρακάτω:

Μετά τη δημιουργία του γράφου, ασχοληθήκαμε με τη δημιουργία ερωτημάτων στο endpoint της πύλης, εστιάζοντας στο χώρο της υγείας.

Συγκεκριμένα, παρακάτω εμφανίζονται ενδεικτικά ορισμένα αποτελέσματα μετά την εκτέλεση του ερωτήματος για την εμφάνιση των ασθενειών που υπάρχουν στη βάση και του αντίστοιχου φαρμάκου που προτείνεται για την αντιμετώπισή της:

Από τη συγκεκριμένη αναζήτηση προέκυψαν 5133 αποτελέσματα, ωστόσο παρατίθενται μόνο τα πρώτα για λειτουργικούς σκοπούς.

Δεδομένου ότι βρήκαμε το κατάλληλο φάρμακο που προτείνεται για κάθε ασθένεια, εκτελέσαμε στη συνέχεια ερώτημα σχετικό με τις χημικές ουσίες των φαρμάκων αυτών, οι οποίες φαίνονται αναλυτικά παρακάτω:

Το ενδιαφέρον μας επικεντρώθηκε στη συνέχεια στις συχνότερες ασθένειες που συναντώνται ανά τον κόσμο. Σύμφωνα με το σχετικό ερώτημα και τα αποτελέσματα που οπτικοποιήθηκαν στη συνέχεια στο tableau, βρήκαμε τις 20 συχνότερες ασθένειες και παρατηρούμε ότι η ασθένεια από την οποία πλήττονται οι περισσότεροι άνθρωποι είναι το Aids, με τις γενικές παθήσεις να ακολουθούν και τον καρκίνο να ακολουθούν.

Αναφορικά με το πλήθος των θανάτων που αφορούν το Aids μετά το έτος 2000, παρακάτω δίνεται το διάγραμμα με την απεικόνιση του πλήθους αυτών ανά έτος. Από το παρακάτω διάγραμμα, φαίνεται ότι το 2005 προέκυψαν οι περισσότεροι θάνατοι από Aids ενώ από το 2010 και μετά υπάρχει μια σταθερότητα:

Μια άλλη εξίσου πολύ συχνή ασθένεια είναι ο καρκίνος, από τον οποίο πλήττεται μεγάλος αριθμός ατόμων ανά τον κόσμο. Με την εκτέλεση σχετικών ερωτημάτων στο Sparql endpoint, με βάση τον καρκίνο, βρήκαμε ότι υπάρχει αρκετή πληροφόρηση στο Wikidata σχετικά με τα φάρμακα αλλά και τους θανάτους που σχετίζονται με αυτόν.

Παρακάτω ακολουθεί μια οπτικοποίηση σχετικά με φάρμακα που προτείνονται για κάποιους τύπους καρκίνων ανάλογα με το γονίδιο που ευθύνεται για τον πολλαπλασιασμό των κυττάρων και τη βιολογική επεξεργασία που γίνεται για την αντιμετώπισή του:

Για καλύτερη κατανόηση, βλέπουμε για παράδειγμα στην 1η στήλη τον τύπο του καρκίνου (στον οισοφάγο), στη 2η στήλη τη βιολογική διεργασία για την αντιμετώπισή του (π.χ. ανταπόκριση στις ακτίνες Χ), στην 3η στήλη τον τύπο του γονιδίου και στην τελευταία το φάρμακο που προτείνεται για να αναστείλει τον πολλαπλασιασμό των κυττάρων.

Σχετικά με τους θανάτους από καρκίνο, στο ακόλουθο διάγραμμα μπορούμε να δούμε τους Αμερικάνους (άντρες και γυναίκες) που πέθαναν από οποιονδήποτε τύπο καρκίνου, έχοντας ως σημείο αναφοράς την ηλικία τους.

Αναζητώντας τις 20 χώρες με τους περισσότερους θανάτους από καρκίνο, δημιουργήσαμε το σχετικό ερώτημα στο sparql endpoint και στη συνέχεια τα αποτελέσματα οπτικοποιήθηκαν μέσω του tableau, το οποίο μας έδωσε τις πληροφορίες σε πιο κατανοητή και ευανάγνωστη μορφή:

Τέλος, θεωρήσαμε πολύ χρήσιμο να βρούμε τον κατάλογο με τα νοσοκομεία που υπάρχουν στον κόσμο, οπότε εκτελέσαμε το σχετικό ερώτημα στην πύλη και στη συνέχεια έγινε οπτικοποίηση των αποτελεσμάτων μέσω του tableau, για την απόκτηση πληρέστερης εικόνας αναφορικά με τη διασπορά των νοσοκομείων.

Αξιοποιώντας τα δεδομένα της πύλης του Wikidata, αντιληφθήκαμε πόσο σημαντική είναι η ύπαρξη Ανοικτών Δεδομένων στο χώρο της υγείας, με πολύπλευρη σημασία για όλους τους εμπλεκόμενους. Ακολουθούν συνοπτικά τα βασικά οφέλη από την αξιοποίησή τους.

Οφέλη από τη χρήση Ανοικτών Kυβερνητικών Δεδομένων στην υγεία

  • Βέλτιστη διαχείριση των διαθέσιμων πόρων για την αποτελεσματικότερη και αποδοτικότερη παροχή φροντίδας.
  • Εξασφάλιση αξιόπιστων στατιστικών στοιχείων για τη λειτουργία του συστήματος φαρμακευτικής και ιατρικής περίθαλψης
  • Αναγνώριση και προτεραιοποίηση των υγειονομικών αναγκών του πληθυσμού και των επιλογών σε υγειονομικούς στόχους
  • Σύνδεση της αποζημίωσης με την επίτευξη του υγειονομικού αποτελέσματος
  • Υπολογισμός της επίπτωσης της νοσηρότητας στο κόστος του υγειονομικού συστήματος
  • Συγκράτηση των δαπανών με αποδοτική χρήση των περιορισμένων ανθρώπινων και φυσικών πόρων
  • Σύγκριση διαφορετικών πολιτικών ελέγχου του κόστους
  • Προσέλκυση επενδυτικών δραστηριοτήτων για την ανάπτυξη κλινικών και άλλων ερευνών από τον διεθνή χώρο
  • Σημαντικό εργαλείο για την Αποτίμηση Τεχνολογίας Υγείας (Health Technology Assessment)

Για τον επαγγελματία υγείας – Εργαλείο για ποιοτικότερη παροχή υπηρεσιών υγείας

  • Διαχρονική ηλεκτρονική καταγραφή πληροφοριών για την υγεία του ασθενή
  • Τεκμηριωμένη υποβοήθηση στη λήψη αποφάσεων (evidence-based medicine)
  • Χρήση των συγκεντρωτικών στοιχείων των ασθενών, σε ανωνυμοποιημένη μορφή, για την κλινική έρευνα και επιδημιολογικές μελέτες.
  • Βελτίωση μεθοδολογιών κλινικής έρευνας και αποτελεσματικότητας των θεραπειών
  • Εξατομικευμένη ιατρική.

Για την επιστήμη

  • Εξαγωγή συμπερασμάτων μέσα από τη στατιστική ανάλυση των δεδομένων υγείας και συμβολή στην ιατρική έρευνα
  • Χρήση ανωνυμοποιημένων δεδομένων για επιδημιολογικές μελέτες
  • Συμβολή στην κλινική έρευνα, βελτίωση των μεθοδολογιών που ακολουθούνται και επιτάχυνση της διαδικασίας ανάπτυξης νέων φαρμάκων με αντίστοιχη μείωση του κόστους.

Για τον ασθενή – Ο μεγάλος κερδισμένος

  • Βελτίωση του θεραπευτικού αποτελέσματος
  • Έγκυρη πληροφόρηση/διαφάνεια/ισότητα στην πρόσβαση
  • Αποτελεσματικότερη παροχή φροντίδας υγείας
  • Υλοποίηση νέων υπηρεσιών προστιθέμενης αξίας για τον ασθενή, όπως:
  • Υπενθυμίσεις για προγραμματισμένες επισκέψεις, για τακτικές εξετάσεις ή για προληπτικές εξετάσεις
  • Έγκυρη πληροφόρηση και πρόσβαση στα δεδομένα του.

Το άρθρο αυτό επιμελήθηκε και συντάχθηκε από τις μεταπτυχιακές φοιτήτριες: Κασσιανή Γρηγορίου, Μαρία Ζυγούρα, Ζωή Καλλιανέζου, Δήμητρα Σιούλα & Μαρία Τσότση, στην κατεύθυνση «Επιχειρηματικής Πληροφορικής» του προγράμματος μεταπτυχιακών σπουδών του τμήματος Εφαρμοσμένης Πληροφορικής του Πανεπιστημίου Μακεδονίας, στα πλαίσια του μαθήματος «Καινοτόμα Συστήματα η-επιχειρείν» με υπεύθυνο καθηγητή τον κ. Ταμπούρη Ευθύμιο.

ΡΗΤΩΣ ΑΠΑΓΟΡΕΥΕΤΑΙ ΟΠΟΙΑΔΗΠΟΤΕ ΑΠΟΣΠΑΣΜΑΤΙΚΗ ΑΝΑΔΗΜΟΣΙΕΥΣΗ ΧΩΡΙΣ ΤΗΝ ΑΔΕΙΑ ΤΩΝ ΜΕΛΕΤΗΤΩΝ.

Πηγές: Wikidata, https://www.wikidata.org/wiki/Wikidata:Main_Page
Naftemporiki, https://www.naftemporiki.gr/

One thought on “Η Σημασία των Ανοιχτών Δεδομένων στο Τομέα της Υγείας

  1. Άκρος ενδιαφέρον το άρθρο και πάρα πολύ ωραία δουλεία!
    Συγχαρητήρια στους μεταπτυχιακούς φοιτητές και τους ευχαριστούμε για αυτή την ωραία παρουσίαση!

Leave a Comment