Αυτές είναι οι καλύτερες δωρεάν ανοιχτές πηγές δεδομένων που μπορούν να χρησιμοποιήσουν όλοι

Τι είναι το Open Data;

Με απλά λόγια, το Open Data σημαίνει το είδος των δεδομένων που είναι ανοιχτά για όλους και σε όλους για πρόσβαση, τροποποίηση, επαναχρησιμοποίηση και κοινή χρήση.

Το Open Data αντλεί τη βάση του από διάφορες «ανοιχτές κινήσεις», όπως open source, open hardware, open government, open science κ.λπ.

Κυβερνήσεις, ανεξάρτητοι οργανισμοί και υπηρεσίες έχουν προωθήσει το άνοιγμα των πυλών δεδομένων για τη δημιουργία ολοένα και πιο ανοιχτών δεδομένων για δωρεάν και εύκολη πρόσβαση.

Γιατί είναι σημαντικό το Open Data;

Τα ανοιχτά δεδομένα είναι σημαντικά επειδή ο κόσμος έχει αυξηθεί όλο και περισσότερο βάσει δεδομένων. Αλλά εάν υπάρχουν περιορισμοί στην πρόσβαση και τη χρήση δεδομένων, η ιδέα της επιχείρησης και της διακυβέρνησης βάσει δεδομένων δεν θα υλοποιηθεί.

Επομένως, τα ανοιχτά δεδομένα έχουν τη δική τους μοναδική θέση. Μπορεί να επιτρέψει την πληρέστερη κατανόηση των παγκόσμιων προβλημάτων και των καθολικών ζητημάτων. Μπορεί να δώσει μεγάλη ώθηση στις επιχειρήσεις. Μπορεί να είναι μια μεγάλη ώθηση για μηχανική εκμάθηση. Μπορεί να βοηθήσει στην καταπολέμηση παγκόσμιων προβλημάτων, όπως ασθένειες ή εγκλήματα ή λιμός. Τα ανοιχτά δεδομένα μπορούν να ενδυναμώσουν τους πολίτες και ως εκ τούτου να ενισχύσουν τη δημοκρατία. Μπορεί να βελτιώσει τις διαδικασίες και τα συστήματα που έχουν οικοδομήσει η κοινωνία και οι κυβερνήσεις. Μπορεί να βοηθήσει στον μετασχηματισμό του τρόπου που κατανοούμε και αλληλεπιδρούμε με τον κόσμο.

Αυτή είναι λοιπόν η λίστα με τις 15 καταπληκτικές πηγές Open Data:

1. Ανοιχτά δεδομένα της Παγκόσμιας Τράπεζας

Ως αποθετήριο των πιο περιεκτικών δεδομένων στον κόσμο σχετικά με το τι συμβαίνει σε διαφορετικές χώρες σε όλο τον κόσμο, τα Παγκόσμια Τράπεζα Open Data είναι μια ζωτικής σημασίας πηγή Open Data. Παρέχει επίσης πρόσβαση σε άλλα σύνολα δεδομένων που αναφέρονται στον κατάλογο δεδομένων.

Τα Ανοιχτά Δεδομένα της Παγκόσμιας Τράπεζας είναι τεράστια επειδή έχει 3000 σύνολα δεδομένων και 14000 δείκτες που περιλαμβάνουν μικροδεδομένα, στατιστικά χρονοσειρών και γεωχωρικά δεδομένα.

Η πρόσβαση και η ανακάλυψη των δεδομένων που θέλετε είναι επίσης πολύ εύκολη. Το μόνο που χρειάζεται να κάνετε είναι να καθορίσετε τα ονόματα των δεικτών, τις χώρες ή τα θέματα και θα ανοίξει το θησαυροφυλάκιο των Open Data για εσάς. Σας επιτρέπει επίσης να κάνετε λήψη δεδομένων σε διαφορετικές μορφές, όπως CSV, Excel και XML.

Εάν είστε δημοσιογράφος ή ακαδημαϊκός, θα σας ενθουσιάσει με τη σειρά εργαλείων που έχετε στη διάθεσή σας. Μπορείτε να αποκτήσετε πρόσβαση σε εργαλεία ανάλυσης και οπτικοποίησης που μπορούν να ενισχύσουν την έρευνά σας. Μπορεί να ενθαρρύνει μια βαθύτερη και καλύτερη κατανόηση των παγκόσμιων προβλημάτων.

Μπορείτε να αποκτήσετε πρόσβαση στο API, το οποίο μπορεί να σας βοηθήσει να δημιουργήσετε τις οπτικοποιήσεις δεδομένων που χρειάζεστε, ζωντανά συνδυασμούς με άλλες πηγές δεδομένων και πολλές άλλες τέτοιες δυνατότητες.

Επομένως, δεν αποτελεί έκπληξη το γεγονός ότι τα Open Data της Παγκόσμιας Τράπεζας βρίσκονται στην κορυφή οποιασδήποτε λίστας πηγών Open Data!

2. ΠΟΥ (Παγκόσμιος Οργανισμός Υγείας) - Ανοίξτε το αποθετήριο δεδομένων

Το αποθετήριο ανοιχτών δεδομένων του ΠΟΥ είναι ο τρόπος με τον οποίο ο ΠΟΥ παρακολουθεί ειδικές για την υγεία στατιστικές των 194 κρατών μελών της.

Το αποθετήριο διατηρεί τα δεδομένα οργανωμένα. Μπορεί να προσεγγιστεί σύμφωνα με διαφορετικές ανάγκες. Για παράδειγμα, είτε πρόκειται για θνησιμότητα ή επιβάρυνση ασθενειών, μπορεί κανείς να έχει πρόσβαση σε δεδομένα που ταξινομούνται σε 100 ή περισσότερες κατηγορίες, όπως οι Αναπτυξιακοί Στόχοι της Χιλιετίας (διατροφή παιδιών, υγεία παιδιών, μητρική και αναπαραγωγική υγεία, ανοσοποίηση, HIV / AIDS, φυματίωση, ελονοσία, παραμελημένες ασθένειες, νερό και αποχέτευση), μη μεταδοτικές ασθένειες και παράγοντες κινδύνου, επιδημικές επιδημίες, συστήματα υγείας, περιβαλλοντική υγεία, βία και τραυματισμοί, δικαιοσύνη κ.λπ.

Για τις συγκεκριμένες ανάγκες σας, μπορείτε να διαβάσετε τα σύνολα δεδομένων σύμφωνα με θέματα, κατηγορία, δείκτες και χώρα.

Το καλό είναι ότι είναι δυνατή η λήψη οποιωνδήποτε δεδομένων χρειάζεστε σε μορφή Excel. Μπορείτε επίσης να παρακολουθείτε και να αναλύετε δεδομένα κάνοντας χρήση της πύλης δεδομένων.

Το API για το περιεχόμενο δεδομένων και στατιστικών στοιχείων του Παγκόσμιου Οργανισμού Υγείας είναι επίσης διαθέσιμο.

3. Google Public Data Explorer

Ξεκίνησε το 2010, το Google Public Data Explorer μπορεί να σας βοηθήσει να εξερευνήσετε τεράστια ποσά συνόλων δεδομένων δημοσίου ενδιαφέροντος. Μπορείτε να οπτικοποιήσετε και να κοινοποιήσετε τα δεδομένα για τις αντίστοιχες χρήσεις σας.

Καθιστά διαθέσιμα τα δεδομένα από διάφορες υπηρεσίες και πηγές. Για παράδειγμα, μπορείτε να αποκτήσετε πρόσβαση σε δεδομένα από την Παγκόσμια Τράπεζα, το Γραφείο Στατιστικής Εργασίας των ΗΠΑ και το Γραφείο των ΗΠΑ, τον ΟΟΣΑ, το ΔΝΤ και άλλα.

Διαφορετικοί ενδιαφερόμενοι έχουν πρόσβαση σε αυτά τα δεδομένα για διάφορους σκοπούς. Είτε είστε φοιτητής ή δημοσιογράφος, είτε είστε υπεύθυνος χάραξης πολιτικής είτε ακαδημαϊκός, μπορείτε να αξιοποιήσετε αυτό το εργαλείο για να δημιουργήσετε οπτικοποιήσεις δημόσιων δεδομένων.

Μπορείτε να αναπτύξετε διάφορους τρόπους αναπαράστασης των δεδομένων, όπως γραφήματα γραμμών, γραφήματα ράβδων, χάρτες και γραφήματα φυσαλίδων με τη βοήθεια του Data Explorer.

Το καλύτερο μέρος είναι ότι θα βρείτε αυτές τις απεικονίσεις αρκετά δυναμικές. Αυτό σημαίνει ότι θα τους δείτε να αλλάζουν με την πάροδο του χρόνου. Μπορείτε να αλλάξετε θέματα, να εστιάσετε σε διαφορετικές καταχωρίσεις και να τροποποιήσετε την κλίμακα.

Είναι εύκολα κοινόχρηστο. Μόλις ετοιμάσετε το γράφημα, μπορείτε να το ενσωματώσετε στον ιστότοπο ή το ιστολόγιό σας ή απλά να μοιραστείτε έναν σύνδεσμο με τους φίλους σας.

4. Μητρώο Ανοικτών Δεδομένων στο AWS (RODA)

Αυτό είναι ένα αποθετήριο που περιέχει δημόσια σύνολα δεδομένων. Είναι δεδομένα που είναι διαθέσιμα από πόρους AWS.

Όσον αφορά το RODA, μπορείτε να ανακαλύψετε και να μοιραστείτε τα δεδομένα που είναι διαθέσιμα στο κοινό.

Στο RODA, μπορείτε να χρησιμοποιήσετε λέξεις-κλειδιά και ετικέτες για συνηθισμένους τύπους δεδομένων, όπως γονιδιωματική, δορυφορικές εικόνες και μεταφορά, προκειμένου να αναζητήσετε όποια δεδομένα αναζητάτε. Όλα αυτά είναι δυνατά σε μια απλή διεπαφή ιστού.

Για κάθε σύνολο δεδομένων, θα ανακαλύψετε σελίδα λεπτομερειών, παραδείγματα χρήσης, πληροφορίες άδειας χρήσης και σεμινάρια ή εφαρμογές που χρησιμοποιούν αυτά τα δεδομένα.

Χρησιμοποιώντας ένα ευρύ φάσμα προϊόντων ανάλυσης δεδομένων και δεδομένων, μπορείτε να αναλύσετε τα ανοιχτά δεδομένα και να δημιουργήσετε οποιεσδήποτε υπηρεσίες θέλετε.

Ενώ τα δεδομένα στα οποία έχετε πρόσβαση είναι διαθέσιμα μέσω πόρων AWS, πρέπει να έχετε υπόψη σας ότι δεν παρέχονται από την AWS. Αυτά τα δεδομένα ανήκουν σε διαφορετικούς φορείς, κυβερνητικούς οργανισμούς, ερευνητές, επιχειρήσεις και άτομα.

5. Ανοιχτή πύλη δεδομένων της Ευρωπαϊκής Ένωσης

Μπορείτε να αποκτήσετε πρόσβαση σε όποια ανοιχτά δεδομένα δημοσιεύονται θεσμικά όργανα, οργανισμοί και άλλοι οργανισμοί της ΕΕ σε μια ενιαία πλατφόρμα, συγκεκριμένα στην Ευρωπαϊκή Ένωση Open Data Portal.

Η ανοικτή πύλη δεδομένων της ΕΕ φιλοξενεί ζωτικά ανοιχτά δεδομένα που αφορούν τομείς πολιτικής της ΕΕ. Αυτοί οι τομείς πολιτικής περιλαμβάνουν την οικονομία, την απασχόληση, την επιστήμη, το περιβάλλον και την εκπαίδευση.

Περίπου 70 θεσμικά όργανα, οργανισμοί ή υπηρεσίες της ΕΕ όπως η Eurostat, ο Ευρωπαϊκός Οργανισμός Περιβάλλοντος, το Κοινό Κέντρο Ερευνών και άλλες Γενικές Διευθύνσεις της Ευρωπαϊκής Επιτροπής και οργανισμοί της ΕΕ έχουν δημοσιοποιήσει και επιτρέπουν την πρόσβαση στα σύνολα δεδομένων τους. Αυτά τα σύνολα δεδομένων έχουν ξεπεράσει τον αριθμό των 11700 μέχρι σήμερα.

Η πύλη επιτρέπει εύκολη πρόσβαση. Μπορείτε εύκολα να κάνετε αναζήτηση, εξερεύνηση, σύνδεση, λήψη και επαναχρησιμοποίηση των δεδομένων μέσω ενός καταλόγου κοινών μεταδεδομένων. Μπορείτε να το κάνετε για τους συγκεκριμένους σκοπούς σας. Θα μπορούσε να είναι εμπορικός ή μη εμπορικός σκοπός.

Μπορείτε να πραγματοποιήσετε αναζήτηση στον κατάλογο μεταδεδομένων μέσω μιας διαδραστικής μηχανής αναζήτησης (καρτέλα δεδομένων) και ερωτημάτων SPARQL (καρτέλα Συνδεδεμένα δεδομένα).

Χρησιμοποιώντας αυτόν τον κατάλογο, μπορείτε να αποκτήσετε πρόσβαση στα δεδομένα που είναι αποθηκευμένα στους διάφορους ιστότοπους των θεσμικών οργάνων, οργανισμών και οργανισμών της ΕΕ.

6. FiveThirtyEight

Είναι ένας εξαιρετικός ιστότοπος για τη δημοσιογραφία και την αφήγηση δεδομένων.

Παρέχει τις διάφορες πηγές δεδομένων για διάφορους τομείς όπως η πολιτική, ο αθλητισμός, η επιστήμη, τα οικονομικά κ.λπ. Μπορείτε επίσης να κατεβάσετε τα δεδομένα.

Όταν αποκτάτε πρόσβαση στα δεδομένα, θα βρείτε μια σύντομη εξήγηση σχετικά με κάθε σύνολο δεδομένων σχετικά με την προέλευσή του. Θα μάθετε επίσης τι σημαίνει και πώς να το χρησιμοποιήσετε.

Προκειμένου να καταστούν αυτά τα δεδομένα φιλικά προς το χρήστη, παρέχει σύνολα δεδομένων σε όσο το δυνατόν πιο απλές, μη ιδιόκτητες μορφές, όπως αρχεία CSV. Περιττό να πούμε ότι αυτές οι μορφές είναι εύκολα προσβάσιμες και επεξεργασμένες τόσο από ανθρώπους όσο και από μηχανές.

Με τη βοήθεια αυτών των συνόλων δεδομένων, μπορείτε να δημιουργήσετε ιστορίες και οπτικοποιήσεις σύμφωνα με τις δικές σας απαιτήσεις και προτιμήσεις.

7. Γραφείο απογραφής των ΗΠΑ

Το Γραφείο Απογραφής των ΗΠΑ είναι η μεγαλύτερη στατιστική υπηρεσία της ομοσπονδιακής κυβέρνησης. Αποθηκεύει και παρέχει αξιόπιστα γεγονότα και δεδομένα σχετικά με ανθρώπους, μέρη και οικονομία της Αμερικής.

Το Γραφείο Απογραφής θεωρεί την ευγενή αποστολή του να επεκτείνει τις υπηρεσίες του ως τον πιο αξιόπιστο πάροχο ποιοτικών δεδομένων.

Είτε πρόκειται για ομοσπονδιακή, πολιτειακή, τοπική ή φυλετική κυβέρνηση, όλοι χρησιμοποιούν στοιχεία απογραφής για διάφορους σκοπούς. Αυτές οι κυβερνήσεις χρησιμοποιούν αυτά τα δεδομένα για να προσδιορίσουν τη θέση των νέων κατοικιών και δημόσιων εγκαταστάσεων. Το χρησιμοποιούν επίσης κατά τη στιγμή της εξέτασης των δημογραφικών χαρακτηριστικών των κοινοτήτων, των κρατών και των ΗΠΑ.

Αυτά τα δεδομένα χρησιμοποιούνται επίσης στον σχεδιασμό συστημάτων μεταφοράς και οδικών οδών. Όσον αφορά τον καθορισμό ποσοστώσεων και τη δημιουργία αστυνομικών και πυροσβεστικών περιφερειών, αυτά τα δεδομένα είναι χρήσιμα Όταν οι κυβερνήσεις δημιουργούν τοπικές εκλογές, σχολεία, βοηθητικά προγράμματα κ.λπ., κάνουν χρήση αυτών των δεδομένων. Είναι μια πρακτική για τη συλλογή πληροφοριών για τον πληθυσμό μία φορά τη δεκαετία και αυτά τα δεδομένα είναι αρκετά χρήσιμα για την επίτευξη των ίδιων.

Υπάρχουν διάφορα εργαλεία όπως το American Fact Finder, το Census Data Explorer και το Quick Facts που είναι χρήσιμα σε περίπτωση που θέλετε να αναζητήσετε, να προσαρμόσετε και να οπτικοποιήσετε δεδομένα.

Για παράδειγμα, το Quick Facts και μόνο περιέχει στατιστικά στοιχεία για όλες τις πολιτείες, κομητείες, πόλεις, ακόμη και κωμοπόλεις με πληθυσμό 5000 και άνω.

Ομοίως, το American Fact Finder μπορεί να σας βοηθήσει να ανακαλύψετε δημοφιλή γεγονότα όπως πληθυσμό, εισόδημα κ.λπ. Παρέχει πληροφορίες που ζητούνται συχνά.

Το καλό είναι ότι μπορείτε να κάνετε αναζήτηση, να αλληλεπιδράσετε με τα δεδομένα, να γνωρίσετε δημοφιλή στατιστικά στοιχεία και να δείτε τα σχετικά γραφήματα μέσω του Census Data Explorer. Επιπλέον, μπορείτε επίσης να χρησιμοποιήσετε οπτικό εργαλείο για να προσαρμόσετε δεδομένα σε μια διαδραστική εμπειρία χαρτών.

8. Data.gov

Το Data.gov είναι ο θησαυρός των ανοικτών δεδομένων της κυβέρνησης των ΗΠΑ. Μόλις πρόσφατα αποφασίστηκε η δωρεάν διάθεση όλων των κυβερνητικών δεδομένων.

Όταν κυκλοφόρησε, υπήρχαν μόνο 47. Υπάρχουν τώρα 180.000 σύνολα δεδομένων.

Το γιατί το Data.gov είναι ένας εξαιρετικός πόρος είναι επειδή μπορείτε να βρείτε δεδομένα, εργαλεία και πόρους που μπορείτε να αναπτύξετε για διάφορους σκοπούς. Μπορείτε να πραγματοποιήσετε την έρευνά σας, να αναπτύξετε τις εφαρμογές ιστού και κινητών συσκευών σας, ακόμη και να σχεδιάσετε οπτικοποιήσεις δεδομένων.

Το μόνο που χρειάζεται να κάνετε είναι να εισαγάγετε λέξεις-κλειδιά στο πλαίσιο αναζήτησης και να περιηγηθείτε σε τύπους, ετικέτες, μορφές, ομάδες, τύπους οργανώσεων, οργανισμούς και κατηγορίες. Αυτό θα διευκολύνει την εύκολη πρόσβαση σε δεδομένα ή σύνολα δεδομένων που χρειάζεστε.

Το Data.gov ακολουθεί το Σχέδιο Open Data Project - ένα σύνολο απαιτούμενων πεδίων (Τίτλος, Περιγραφή, Ετικέτες, Τελευταία ενημέρωση, Εκδότης, Όνομα επαφής κ.λπ.) για κάθε σύνολο δεδομένων που εμφανίζεται στο Data.gov.

9. DBpedia

Όπως γνωρίζετε, η Wikipedia είναι μια εξαιρετική πηγή πληροφοριών. Η DBpedia στοχεύει στη λήψη δομημένου περιεχομένου από τις πολύτιμες πληροφορίες που δημιούργησε η Wikipedia.

Με τη DBpedia, μπορείτε να πραγματοποιήσετε σημασιολογική αναζήτηση και εξερεύνηση σχέσεων και ιδιοτήτων του πόρου της Wikipedia. Αυτό περιλαμβάνει συνδέσμους και σε άλλα σχετικά σύνολα δεδομένων.

Υπάρχουν περίπου 4,58 εκατομμύρια οντότητες στο σύνολο δεδομένων DBpedia. 4,22 εκατομμύρια ταξινομούνται στην οντολογία, συμπεριλαμβανομένων 1.445.000 ατόμων, 735.000 θέσεων, 123.000 μουσικών άλμπουμ, 87.000 ταινιών, 19.000 βιντεοπαιχνιδιών, 241.000 οργανισμών, 251.000 ειδών και 6.000 ασθενειών.

Υπάρχουν ετικέτες και περιλήψεις για αυτές τις οντότητες σε περίπου 125 γλώσσες. Υπάρχουν 25,2 εκατομμύρια σύνδεσμοι για εικόνες. Υπάρχουν 29,8 εκατομμύρια σύνδεσμοι προς εξωτερικές ιστοσελίδες.

Το μόνο που πρέπει να κάνετε για να χρησιμοποιήσετε το DBpedia είναι να γράψετε ερωτήματα SPARQL σε τελικό σημείο ή κατεβάζοντας τα dump τους.

Η DBpedia έχει ωφελήσει αρκετές επιχειρήσεις, όπως η Apple (μέσω Siri), η Google (μέσω Freebase και το Γράφημα γνώσης Google) και η IBM (μέσω Watson), και ιδιαίτερα τα αντίστοιχα έργα τους που σχετίζονται με την τεχνητή νοημοσύνη.

10. OpenCodeCamp Open Data

Είναι μια κοινότητα ανοιχτού κώδικα. Αυτό που έχει σημασία είναι επειδή σας επιτρέπει να κωδικοποιήσετε, να δημιουργήσετε έργα pro bono μετά από μη κερδοσκοπικούς οργανισμούς και να πάρετε μια εργασία ως προγραμματιστής.

Για να συμβεί αυτό, η κοινότητα freeCodeCamp.org διαθέτει τεράστιους όγκους δεδομένων κάθε μήνα. Το έχουν μετατρέψει σε ανοιχτά δεδομένα.

Θα βρείτε διάφορα πράγματα σε αυτό το αποθετήριο. Μπορείτε να βρείτε σύνολα δεδομένων, ανάλυση των ίδιων και ακόμη και επιδείξεων έργων με βάση τα δεδομένα του FreeCodeCamp. Μπορείτε επίσης να βρείτε συνδέσμους προς εξωτερικά έργα που περιλαμβάνουν τα δεδομένα του FreeCodeCamp.

Μπορεί να σας βοηθήσει με μια ποικιλία έργων και εργασιών που μπορεί να έχετε κατά νου. Είτε πρόκειται για αναλυτικά στοιχεία ιστού, αναλυτικά μέσα κοινωνικής δικτύωσης, ανάλυση κοινωνικού δικτύου, ανάλυση εκπαίδευσης, οπτικοποίηση δεδομένων, ανάπτυξη ιστού βάσει δεδομένων ή bot, τα δεδομένα που προσφέρει αυτή η κοινότητα μπορούν να είναι εξαιρετικά χρήσιμα και αποτελεσματικά.

11. Yelp Open Datasets

Το σύνολο δεδομένων Yelp είναι βασικά ένα υποσύνολο από τις δικές μας επιχειρήσεις, κριτικές και δεδομένα χρηστών για χρήση σε προσωπικές, εκπαιδευτικές και ακαδημαϊκές αναζητήσεις.

Υπάρχουν 5.996.996 κριτικές, 188.593 επιχειρήσεις, 280.991 φωτογραφίες και 10 μητροπολιτικές περιοχές που περιλαμβάνονται στα Yelp Open Datasets.

Μπορείτε να τα χρησιμοποιήσετε για διαφορετικούς σκοπούς. Δεδομένου ότι είναι διαθέσιμα ως αρχεία JSON, μπορείτε να τα χρησιμοποιήσετε για να διδάξετε στους μαθητές σχετικά με τις βάσεις δεδομένων. Μπορείτε να τα χρησιμοποιήσετε για να μάθετε NLP ή για δείγματα δεδομένων παραγωγής ενώ κατανοείτε πώς να σχεδιάσετε εφαρμογές για κινητά.

Σε αυτό το σύνολο δεδομένων, θα βρείτε κάθε αρχείο που αποτελείται από έναν τύπο αντικειμένου, ένα αντικείμενο JSON ανά γραμμή.

12. Σύνολο δεδομένων της UNICEF

Δεδομένου ότι η UNICEF ασχολείται με μια μεγάλη ποικιλία κρίσιμων ζητημάτων, έχει συγκεντρώσει σχετικά δεδομένα σχετικά με την εκπαίδευση, την παιδική εργασία, την αναπηρία των παιδιών, τη παιδική θνησιμότητα, τη μητρική θνησιμότητα, το νερό και την αποχέτευση, το χαμηλό βάρος γέννησης, την προγεννητική φροντίδα, την πνευμονία, την ελονοσία, την ανεπάρκεια ιωδίου διαταραχή, ακρωτηριασμός / κοπή των γεννητικών οργάνων και έφηβοι.

Τα ανοιχτά σύνολα δεδομένων της UNICEF που δημοσιεύθηκαν στο μητρώο IATI: //www.iatiregistry.org/publisher/unicef ​​έχουν εξαχθεί απευθείας από το λειτουργικό σύστημα της UNICEF (VISION) και άλλα συστήματα δεδομένων, και αντικατοπτρίζει τις εισόδους που πραγματοποιούνται από μεμονωμένα γραφεία της UNICEF.

Το καλό είναι ότι υπάρχει μια τακτική ενημέρωση όσον αφορά αυτά τα σύνολα δεδομένων. Κάθε μήνα, τα δεδομένα ενημερώνονται ώστε να είναι πιο ολοκληρωμένα, αξιόπιστα και ακριβή.

Μπορείτε ελεύθερα και εύκολα να αποκτήσετε πρόσβαση σε αυτά τα δεδομένα. Για να το κάνετε αυτό, μπορείτε να κατεβάσετε αυτά τα δεδομένα σε μορφή CSV. Μπορείτε επίσης να κάνετε προεπισκόπηση δειγμάτων δεδομένων πριν από τη λήψη τους.

Ενώ οποιοσδήποτε μπορεί να εξερευνήσει και να απεικονίσει τα σύνολα δεδομένων της UNICEF, υπάρχουν τρεις κύριοι εκδότες:

ΠΟΡΤΑ ΔΙΑΦΑΝΕΙΑΣ ΓΙΑ ΤΗΝ ΕΝΙΣΧΥΣΗ ΤΗΣ UNICEF: Μπορείτε να έχετε πολύ πιο εύκολα πρόσβαση στα σύνολα δεδομένων εάν χρησιμοποιείτε αυτήν την πύλη. Περιλαμβάνει επίσης λεπτομέρειες για κάθε χώρα στην οποία εργάζεται η UNICEF.

Publisher d-portal: Αυτή τη στιγμή βρίσκεται στο BETA. Με αυτήν την πύλη, μπορείτε να εξερευνήσετε τα δεδομένα IATI.

Μπορείτε να αναζητήσετε τις πληροφορίες που σχετίζονται με αναπτυξιακές δραστηριότητες, προϋπολογισμούς κ.λπ. Μπορείτε να εξερευνήσετε αυτές τις πληροφορίες ανά χώρα.

Πλατφόρμα δεδομένων εκδότη: Σε αυτήν την πλατφόρμα, μπορείτε εύκολα να αποκτήσετε πρόσβαση σε στατιστικά στοιχεία, γραφήματα και μετρήσεις για δεδομένα στα οποία έχετε πρόσβαση μέσω του μητρώου IATI. Εάν κάνετε κλικ στις κεφαλίδες, μπορείτε επίσης να ταξινομήσετε πολλούς από τους πίνακες που βλέπετε στην πλατφόρμα. Θα βρείτε επίσης πολλά από τα σύνολα δεδομένων στις πλατφόρμες σε μορφή JSON αναγνώσιμη από μηχανή.

13. Κάγκλ

Το Kaggle είναι υπέροχο επειδή προωθεί τη χρήση διαφορετικών μορφών δημοσίευσης συνόλων δεδομένων. Ωστόσο, το καλύτερο είναι ότι συνιστάται στους εκδότες συνόλων δεδομένων να μοιράζονται τα δεδομένα τους σε προσιτή, μη ιδιόκτητη μορφή.

Η πλατφόρμα υποστηρίζει ανοιχτές και προσβάσιμες μορφές δεδομένων. Είναι σημαντικό όχι μόνο για την πρόσβαση αλλά και για ό, τι θέλετε να κάνετε με αυτά τα δεδομένα. Επομένως, το σύνολο δεδομένων Kaggle καθορίζει με σαφήνεια τις μορφές αρχείων που συνιστώνται κατά την κοινή χρήση δεδομένων.

Το μοναδικό πράγμα για τα σύνολα δεδομένων Kaggle είναι ότι δεν είναι απλώς ένα αποθετήριο δεδομένων. Κάθε σύνολο δεδομένων αντιπροσωπεύει μια κοινότητα που σας δίνει τη δυνατότητα να συζητάτε δεδομένα, να ανακαλύπτετε δημόσιους κώδικες και τεχνικές και να αντιλαμβάνεστε τα δικά σας έργα στους Πυρήνες.

CSV, JSON, SQLite, Archive, Big Query κ.λπ. είναι τύποι αρχείων που υποστηρίζει το Kaggle. Μπορείτε να βρείτε μια ποικιλία πόρων για να ξεκινήσετε να εργάζεστε στο έργο ανοιχτών δεδομένων σας.

Το καλύτερο είναι ότι το Kaggle σάς επιτρέπει να δημοσιεύετε και να μοιράζεστε σύνολα δεδομένων ιδιωτικά ή δημόσια.

14. LODUM

Είναι η πρωτοβουλία Open Data του Πανεπιστημίου του Münster. Στο πλαίσιο αυτής της πρωτοβουλίας, καθίσταται δυνατό για οποιονδήποτε να έχει πρόσβαση σε οποιαδήποτε δημόσια πληροφόρηση σχετικά με το πανεπιστήμιο σε μορφές αναγνώσιμες από μηχανή. Μπορείτε εύκολα να αποκτήσετε πρόσβαση και να το χρησιμοποιήσετε ξανά σύμφωνα με τις ανάγκες σας

Ανοιχτά δεδομένα σχετικά με επιστημονικά αντικείμενα και κωδικοποιημένα ως συνδεδεμένα δεδομένα διατίθενται στο πλαίσιο αυτού του έργου.

Με τη βοήθεια των συνδεδεμένων δεδομένων, μπορείτε να μοιράζεστε και να χρησιμοποιείτε δεδομένα, οντολογίες και διάφορα πρότυπα μεταδεδομένων. Στην πραγματικότητα, προβλέπεται ότι θα είναι το αποδεκτό πρότυπο για την παροχή μεταδεδομένων και τα ίδια τα δεδομένα στον Ιστό.

Η ομάδα του LODUM έχει ξεκινήσει το LinkedUniversities.org και το LinkedScience.org.

Μπορείτε να χρησιμοποιήσετε το πρόγραμμα επεξεργασίας SPARQL ή το πακέτο SPARQL του R για την ανάλυση δεδομένων.

Το πακέτο SPARQL επιτρέπει τη σύνδεση σε ένα τελικό σημείο SPARQL μέσω HTTP, θέτει ένα ερώτημα SELECT ή ένα ερώτημα ενημέρωσης (LOAD, INSERT, DELETE).

15. Αποθετήριο μηχανικής μάθησης UCI

Χρησιμεύει ως ένα ολοκληρωμένο αποθετήριο βάσεων δεδομένων, θεωριών τομέα και δημιουργών δεδομένων που χρησιμοποιούνται από την κοινότητα μηχανικής μάθησης για την εμπειρική ανάλυση των αλγορίθμων μηχανικής μάθησης.

Σε αυτό το αποθετήριο, υπάρχουν, επί του παρόντος, 463 σύνολα δεδομένων ως υπηρεσία στην κοινότητα μηχανικής μάθησης.

Το Κέντρο Μηχανικής Μάθησης και Ευφυών Συστημάτων στο Πανεπιστήμιο της Καλιφόρνια, το Irvine φιλοξενεί και το διατηρεί. Ο David Aha το είχε δημιουργήσει αρχικά ως μεταπτυχιακός φοιτητής στο UC Irvine.

Έκτοτε, μαθητές, εκπαιδευτικοί και ερευνητές σε όλο τον κόσμο το χρησιμοποιούν ως αξιόπιστη πηγή συνόλων δεδομένων μηχανικής μάθησης.

Το πώς λειτουργεί είναι ότι κάθε σύνολο δεδομένων έχει τη ξεχωριστή ιστοσελίδα του, η οποία περιλαμβάνει όλες τις γνωστές λεπτομέρειες, συμπεριλαμβανομένων τυχόν σχετικών δημοσιεύσεων που το διερευνούν. Μπορείτε να κατεβάσετε αυτά τα σύνολα δεδομένων ως αρχεία ASCII, συχνά τη χρήσιμη μορφή CSV.

Οι λεπτομέρειες των συνόλων δεδομένων συνοψίζονται από πτυχές όπως οι τύποι χαρακτηριστικών, ο αριθμός παρουσιών, ο αριθμός των χαρακτηριστικών και το έτος δημοσίευσης που μπορούν να ταξινομηθούν και να αναζητηθούν.

Ανοίξτε τις πύλες δεδομένων και τις μηχανές αναζήτησης:

Ενώ υπάρχουν πολλά σύνολα δεδομένων που δημοσιεύονται από πολλές εταιρείες κάθε χρόνο, πολύ λίγα σύνολα δεδομένων αναγνωρίζονται και καθιερώνονται.

Ο λόγος για τον οποίο πολύ λίγα τέτοια σύνολα δεδομένων υποστηρίζουν ως χρήσιμο πόρο είναι ότι αποτελεί πρόκληση η ανάπτυξη, η διαχείριση και η παροχή των δεδομένων με τρόπο που τα άτομα και οι οργανισμοί τα βρίσκουν χρήσιμα και εύχρηστα.

Ωστόσο, βρείτε παρακάτω μια λίστα με λίγες σημαντικές πύλες και πλατφόρμες ανοιχτών δεδομένων που επιτρέπουν στους χρήστες να έχουν εύκολη πρόσβαση σε ανοιχτά δεδομένα, να μελετούν τον αντίκτυπο και να συλλέγουν πολύτιμες πληροφορίες.

  1. Αναζήτηση συνόλων δεδομένων Google
  2. Διαφορετικά
  3. Ανοίξτε το κιτ δεδομένων
  4. Ckan
  5. Ανοίξτε την παρακολούθηση δεδομένων
  6. Plenar.io
  7. Άνοιγμα χάρτη επιπτώσεων δεδομένων

συμπέρασμα

Τα ανοιχτά δεδομένα είναι η σειρά της ημέρας. Ο κόσμος άρχισε σταδιακά να κινείται προς ανοιχτά συστήματα και τα ανοιχτά δεδομένα είναι σωστά συγχρονισμένα με αυτό.

Οι επιχειρήσεις και οι οργανισμοί που αξιοποιούν τα ανοιχτά δεδομένα θα αποκτήσουν ανταγωνιστικό πλεονέκτημα και θα είναι σε θέση να κυριαρχήσουν στο μέλλον.