Την Τετάρτη, η Google ανακοίνωσε τη beta έκδοση μιας νέας μηχανής αναζήτησης με την ονομασία Dataset Search. Στοχεύοντας στους επιστήμονες και τους δημοσιογράφους που αναζητούν ακριβή σύνολα δεδομένων, αυτή η μηχανή αναζήτησης τους επιτρέπει να βρίσκουν ότι χρειάζονται όπου και αν φιλοξενούνται.

Μπορείτε να σκεφτείτε το Dataset Search σαν το Google Scholar, τη δημοφιλή μηχανή αναζήτησης για ερευνητικές εργασίες και εκθέσεις. Με το νέο εργαλείο, η εταιρεία στοχεύει στην ενοποίηση χιλιάδων πηγών δεδομένων και ενεργεί ως κύρια πύλη.

Ας υποθέσουμε ότι θέλετε να μάθετε για τροχαία ατυχήματα και τα σχετικά σύνολα δεδομένων. Το μόνο που έχετε να κάνετε είναι να πληκτρολογήσετε το ερώτημα και η Google θα απαριθμήσει όλες τις πηγές όπως φαίνεται παρακάτω. Απλά κάντε κλικ σε οποιαδήποτε πηγή στα αριστερά και δείτε περισσότερες λεπτομέρειες:

Για να βεβαιωθείτε ότι τα σύνολα δεδομένων είναι προσβάσιμα μέσω του εργαλείου της Google, η εταιρεία συνιστά στα ιδρύματα να υιοθετήσουν το πρότυπο σήμανσης Schema ανοιχτού κώδικα. Επιτρέπει στους εκδότες να συμπεριλαμβάνουν δεδομένα αναγνώσιμα από μηχανές, όπως η ημερομηνία δημοσίευσης, ο τρόπος συλλογής των δεδομένων, οι όροι χρήσης κ.λπ.

Η μηχανή αναζήτησης Dataset Search ήδη λειτουργεί με πολλές γλώσσες και η εταιρεία σχεδιάζει να επεκτείνει την υποστήριξη για περισσότερες γλώσσες στο μέλλον.

Τα σύνολα δεδομένων από οργανισμούς όπως NOAA, NASA, Harvard Dataverser, ProPublica κ.λπ., είναι ήδη προσβάσιμα μέσω των εργαλείων και περισσότεροι πάροχοι δεδομένων αναμένεται να προστεθούν σύντομα.