Σχετικά με τη σειρά LevelUp : Στο The Markup, δεσμευόμαστε να κάνουμε ό,τι μπορούμε για να προστατεύσουμε τους αναγνώστες μας από την ψηφιακή βλάβη, να γράφουμε για τις διαδικασίες που αναπτύσσουμε και να μοιραζόμαστε τη δουλειά μας. Εργαζόμαστε συνεχώς για τη βελτίωση της ψηφιακής ασφάλειας, τον σεβασμό του απορρήτου των αναγνωστών, τη δημιουργία ηθικών και υπεύθυνων εμπειριών χρήστη και διασφαλίζοντας ότι ο ιστότοπος και τα εργαλεία μας είναι προσβάσιμα.
Εδώ στο The Markup συχνά συνδυάζουμε παραδοσιακές δημοσιογραφικές τεχνικές με ανάλυση δεδομένων, κάτι που μας βοηθά να καταλήξουμε σε συμπεράσματα που βασίζονται σε στατιστικά σημαντικά στοιχεία. Αλλά η εύρεση και η συλλογή αρκετών δεδομένων για την εξαγωγή τέτοιων συμπερασμάτων μπορεί να είναι μια πρόκληση. Εκεί μπαίνει το web scraping.
Η απόξεση Ιστού είναι μια διαδικασία αυτόματης λήψης διαδικτυακού περιεχομένου που προορίζεται για προβολή από ανθρώπινους χρήστες, εξαγωγής συγκεκριμένων πληροφοριών από αυτό και, στη συνέχεια, αποθήκευσης αυτών των πληροφοριών σε μια μορφή που είναι εύκολα χρησιμοποιήσιμη από ένα πρόγραμμα υπολογιστή. Για παράδειγμα, αυτό θα μπορούσε να είναι η λήψη της ιστοσελίδας μιας κομητείας με πρόσφατες αποφάσεις και η μετατροπή της σε μια ακολουθία πινάκων δεδομένων , ο καθένας από τους οποίους περιέχει το όνομα μιας δικαστικής υπόθεσης, μια λίστα εναγόντων, μια λίστα κατηγορουμένων, την ημερομηνία της απόφασης και τη διεύθυνση URL για το κείμενο της απόφασης.
Επειδή η απόξεση γίνεται από υπολογιστή, μπορεί να χρησιμοποιηθεί για τη συλλογή μεγάλων ποσοτήτων πληροφοριών, καθιστώντας την δημοφιλή όχι μόνο μεταξύ των δημοσιογράφων , αλλά και μεταξύ ακαδημαϊκών, ερευνητών και ομάδων υπεράσπισης.
Η απόξεση υπάρχει εδώ και πολύ καιρό σε μια νομικά γκρίζα περιοχή, επομένως οι δημοσιογράφοι και άλλοι ερευνητές τείνουν να την προσεγγίζουν προσεκτικά.
Στο The Markup, ορισμένοι από τους δημοσιογράφους δεδομένων μας είχαν πρόσφατα ερωτήσεις σχετικά με τους νομικούς κινδύνους που ενέχει η απόξεση ιστοτόπων που φιλοξενούνται στην Ευρωπαϊκή Ένωση. Διεξάγαμε τη δική μας έρευνα για να απαντήσουμε σε αυτό το ερώτημα και προσφέρουμε μια περίληψη των όσων μάθαμε παρακάτω. Στόχος μας είναι να βοηθήσουμε άλλους δημοσιογράφους, ερευνητές και υποστηρικτές να αναπτύξουν μια στρατηγική χαμηλού κινδύνου για την απόξεση στην ΕΕ.
Μια σύντομη λέξη για την απόξεση στις ΗΠΑ πριν ξεκινήσουμε: Το νομικό καθεστώς της απόξεσης στις ΗΠΑ είναι αρκετά σαφές σε σύγκριση με την ΕΕ. Για πολλά χρόνια, η νομιμότητά του ήταν αβέβαιη, ιδιαίτερα όταν παραβίαζε τους όρους υπηρεσίας (ToS) των ιστοτόπων. Η παραβίαση αυτών των όρων φαινόταν ότι παραβιάζει ενδεχομένως τον Νόμο για την Απάτη και την Κατάχρηση Υπολογιστών (CFAA), έναν νόμο κατά του hacking που καθιστούσε έγκλημα όχι μόνο την εισβολή σε έναν υπολογιστή αλλά και την «υπέρβαση της εξουσιοδοτημένης πρόσβασης» σε έναν υπολογιστή.
Τον Απρίλιο του 2022, το 9ο Περιφερειακό Εφετείο διευκρίνισε την κατάσταση , επιβεβαιώνοντας ότι τα άτομα που απλώς σκουπίζουν ιστότοπους χωρίς να προκαλέσουν άλλη βλάβη δεν μπορούν να διωχθούν σύμφωνα με τον Νόμο. Αυτή η υπόθεση 9th Circuit εφάρμοσε μια απόφαση του Ανωτάτου Δικαστηρίου του 2021 που ονομάζεται Van Buren κατά Ηνωμένων Πολιτειών , η οποία δεν περιελάμβανε απόξεση, αλλά έκρινε ότι οι παραβιάσεις των όρων υπηρεσίας δεν αποτελούν έγκλημα σύμφωνα με την CFAA.
Το πρώτο σας βήμα στη χάραξη στρατηγικής για το πώς να σκαρώνετε ιστότοπους που βασίζονται στην ΕΕ θα πρέπει να είναι να σκεφτείτε προσεκτικά ποια δεδομένα χρειάζεστε για το έργο σας. Το νομικό καθεστώς της απόξεσης στην ΕΕ εξαρτάται σε μεγάλο βαθμό από τη φύση των δεδομένων που συλλέγετε. Σε γενικές γραμμές, μπορείτε να σκεφτείτε ότι τα δεδομένα στο Διαδίκτυο εμπίπτουν σε δύο κατηγορίες: προσωπικά ή μη, με διαφορετικούς κανόνες να ισχύουν για καθεμία.
Σύμφωνα με τον Ευρωπαϊκό Γενικό Κανονισμό για την Προστασία Δεδομένων (GDPR), τα προσωπικά δεδομένα είναι πληροφορίες που σχετίζονται με ένα «αναγνωριζόμενο φυσικό πρόσωπο» (που σημαίνει άνθρωπο, όχι εταιρεία). Τα ονόματα, οι φωτογραφίες και οι αριθμοί αναγνώρισης, όπως οι άδειες οδήγησης, είναι όλα προσωπικά δεδομένα, αλλά και τα λιγότερο προφανή είδη δεδομένων όπως οι πληροφορίες τοποθεσίας. Τα μη προσωπικά δεδομένα, αντίθετα, δεν σχετίζονται με ταυτοποιημένο φυσικό πρόσωπο. Είναι επίσης λιγότερο περίπλοκο, επομένως θα ξεκινήσουμε να εξηγούμε πρώτα τα μη προσωπικά δεδομένα.
1. Δημιουργικά και «ουσιαστικά επενδυτικά» δικαιώματα
Στην πρόσφατη έρευνά μας σχετικά με τις ανισότητες στο διαδίκτυο, συγκεντρώσαμε μεγάλες ποσότητες πληροφοριών για τις τιμές για το ευρυζωνικό Διαδίκτυο στις γειτονιές των ΗΠΑ. Αν αντ' αυτού είχαμε συγκεντρώσει δεδομένα για τις γειτονιές της ΕΕ, θα θεωρούνταν μη προσωπικά, επειδή δεν σχετίζονται με κανένα αναγνωρισμένο άτομο. Επομένως, ο πιο άμεσα σχετικός νόμος ονομάζεται Οδηγία για τις Βάσεις Δεδομένων , την οποία ψήφισε η ΕΕ το 1996. Η Οδηγία για τις Βάσεις Δεδομένων παρέχει προστασία πνευματικών δικαιωμάτων σε βάσεις δεδομένων που «αποτελούν πνευματική δημιουργία του ίδιου του δημιουργού». Η δημιουργικότητα θα μπορούσε να περιλαμβάνει τον τρόπο οργάνωσης της βάσης δεδομένων, το είδος των στηλών που διατηρεί ή τον τρόπο ευρετηρίασής της. Η Οδηγία δημιουργεί επίσης κάτι που ονομάζεται sui generis (ή μοναδικό) δικαίωμα σε βάσεις δεδομένων που συνεπάγονται «σημαντική επένδυση είτε για την απόκτηση, την επαλήθευση ή την παρουσίαση του περιεχομένου, ακόμη και αν δεν υπάρχει πρωτοτυπία σε αυτή τη βάση δεδομένων. Τα δημιουργικά και ουσιαστικά επενδυτικά δικαιώματα αναφέρονται μερικές φορές συλλογικά ως δικαιώματα βάσης δεδομένων. Αποδεικνύεται ότι αυτά τα δικαιώματα είναι στην πραγματικότητα αρκετά περιορισμένα στην πράξη. Είναι δύσκολο να είσαι πραγματικά δημιουργικός με ένα σχήμα βάσης δεδομένων και τα δικαστήρια θέτουν ένα αρκετά υψηλό όριο για «σημαντικές επενδύσεις». Για παράδειγμα, μια πρόσφατη απόφαση του Δικαστηρίου της Ευρωπαϊκής Ένωσης (βασικά, του Ανώτατου Δικαστηρίου του) έκρινε ότι η απόξεση πληροί την απαίτηση ουσιαστικής επένδυσης μόνο εάν ανταγωνίζεται ή θέτει σε κίνδυνο την ικανότητα του ιστότοπου να συλλέγει εισόδημα και να αποζημιώνει την επένδυσή του.
2. Τα ερευνητικά ιδρύματα έχουν ειδικές άδειες
Η οδηγία για την ψηφιακή ενιαία αγορά (η οποία είναι διαφορετική από τον νόμο για τις ψηφιακές υπηρεσίες και τον νόμο για τις ψηφιακές αγορές) τέθηκε σε ισχύ το 2021 και τροποποίησε την οδηγία για τις βάσεις δεδομένων. Δημιούργησε ασφαλή λιμάνια για εξόρυξη κειμένου και δεδομένων από ερευνητικά ιδρύματα ή «οργανισμούς πολιτιστικής κληρονομιάς». Ένα ερευνητικό ίδρυμα μπορεί να περιλαμβάνει μια οντότητα που διεξάγει επιστημονική έρευνα «σύμφωνα με αποστολή δημοσίου συμφέροντος που αναγνωρίζεται από ένα κράτος μέλος». Τα ερευνητικά ιδρύματα και οι οργανισμοί πολιτιστικής κληρονομιάς πρέπει να εξακολουθούν να έχουν «νόμιμη πρόσβαση» στα δεδομένα, π.χ. ο οργανισμός πληρώνει για μια συνδρομή ή τα δεδομένα είναι δημόσια διαθέσιμα στο Διαδίκτυο. Δεν είναι σαφές εάν οι δημοσιογράφοι πληρούν τις προϋποθέσεις εδώ, ακόμα κι αν εργάζονται για έναν μη κερδοσκοπικό οργανισμό όπως το The Markup. Ένας πιθανός τρόπος για να αντιμετωπιστεί αυτό μπορεί να είναι η συνεργασία με ένα ερευνητικό ίδρυμα, όπως ορισμένα πανεπιστήμια, καθώς οι συμπράξεις δημόσιου και ιδιωτικού τομέα επιτρέπεται από το νόμο να διεξάγουν έρευνα που ευθυγραμμίζεται με ένα από τα Προγράμματα Πλαίσιο της ΕΕ για Έρευνα και Τεχνολογική Ανάπτυξη .
3. Οι εταιρείες μπορούν να περιορίσουν την απόξεση στους όρους παροχής υπηρεσιών τους
Το περιορισμένο πεδίο εφαρμογής της Οδηγίας για τις Βάσεις Δεδομένων σημαίνει ότι πολλά δεδομένα της ΕΕ δεν προστατεύονται από το νόμο και είναι θεωρητικά δίκαιο παιχνίδι για απόξεση. Υπάρχει, όμως, ένα πιάσιμο. Στην υπόθεση Ryanair Ltd εναντίον PR Aviation BV , η PR Aviation ήταν μια υπηρεσία συγκέντρωσης πτήσεων όπως η Kayak.com και αποκόμιζε τη Ryanair για να εμφανίσει τις πτήσεις της στα δικά της αποτελέσματα αναζήτησης. Η Ryanair μήνυσε για να σταματήσει αυτή την πρακτική. Το δικαστήριο έκρινε ότι τα δεδομένα της Ryanair δεν πληρούν τις προϋποθέσεις για προστασία ούτε βάσει πνευματικών δικαιωμάτων ούτε από δικαίωμα sui generis , αλλά ότι η εταιρεία θα μπορούσε να περιορίσει την απόξεση μέσω των όρων της υπηρεσίας. Φυσικά, όπως ανακαλύψαμε κατά τη δημιουργία του συνόλου τιμολόγησης του παρόχου υπηρεσιών διαδικτύου (ISP), οι φορείς εκμετάλλευσης ιστοτόπων μπορούν επίσης να χρησιμοποιήσουν τεχνικά μέτρα όπως ο περιορισμός των τιμών για να αποτρέψουν την απόξεση ακόμα και όταν δεν ασκούν τα προαναφερθέντα νομικά δικαιώματα βάσης δεδομένων.
Οι καταστάσεις όπου η απόξεση περιορίζεται από τους όρους υπηρεσίας μιας πλατφόρμας είναι οι πιο σκοτεινές νομικά. Τα καλά νέα είναι ότι στην ΕΕ δεν είναι έγκλημα η παραβίαση των όρων υπηρεσίας ενός ιστότοπου, όπως συνέβαινε στις ΗΠΑ μέχρι την απόφαση του Ανώτατου Δικαστηρίου του Van Buren το 2021. Εάν υπάρχει ένας Όρος που απαγορεύει το ξύσιμο, η ανάλυση δεν τελειώνει με το «δεν μπορείς να πας φυλακή, οπότε δεν είναι κάτι σπουδαίο». Ο ιστότοπος θα μπορούσε να ασκήσει αγωγή είτε για αδικοπραξία είτε για παραβίαση της σύμβασης, αν και πιθανότατα θα δυσκολεύονται να αποδείξουν αποζημίωση σε τέτοιου είδους περιπτώσεις.
Μπορούν επίσης να ζητήσουν από ένα δικαστήριο να απαγορεύσει τη συμπεριφορά απόξεσης. Αυτό συνέβη στην υπόθεση της Ryanair παραπάνω. Εάν θέλετε να ξύσετε έναν ιστότοπο και οι Όροι ασφάλειας του απαγορεύουν την απόξεση και δεν ισχύουν εξαιρέσεις, είναι πιθανώς καλύτερο να συμβουλευτείτε έναν δικηγόρο σχετικά με την ακριβή σας κατάσταση και να αξιολογήσετε την ανοχή σας στον κίνδυνο.
4. Μην κάνετε έγκλημα στον κυβερνοχώρο
Φυσικά, εάν η δραστηριότητά σας απόξεσης βλάπτει τον ιστότοπο με κάποιο άλλο τρόπο, όπως με το να τον επισκέπτεστε τόσο συχνά ώστε το scraper σας υπερφορτώνει τον ιστότοπο , μπορεί να είστε πολύ υπεύθυνοι σύμφωνα με τη νομοθεσία της ΕΕ για το έγκλημα στον κυβερνοχώρο , οπότε μην το κάνετε.
Συνοψίζοντας, όταν διαγράφετε μη προσωπικά δεδομένα από μια πηγή της ΕΕ, δυνητικά ενεργοποιείτε τις προστασίες της Οδηγίας για τις Βάσεις Δεδομένων, αλλά αυτές οι προστασίες είναι συχνά αρκετά περιορισμένες. Όπου δεν ισχύει η Οδηγία, ενδέχεται να αντιμετωπίσετε περιορισμούς από τους όρους παροχής υπηρεσιών και τυχόν τεχνικές κατά της απόξεσης που χρησιμοποιούν για την επιβολή αυτών των περιορισμών. Εάν συνεργάζεστε με ένα ερευνητικό ίδρυμα όπως ένα πανεπιστήμιο, μπορεί να καταφέρετε να παρακάμψετε τα δικαιώματα της βάσης δεδομένων, αν και η τεχνολογία κατά της απόξεσης μπορεί να εξακολουθεί να αποτελεί πρακτικό εμπόδιο. Εάν δεν ισχύει εξαίρεση, μπορεί να υπάρχει κάποιος κίνδυνος πολιτικής αγωγής, επομένως είναι καλύτερο να συμβουλευτείτε έναν δικηγόρο.
Συλλογή προσωπικών δεδομένων: Ο GDPR μπορεί να μετατρέψει την απόξεση σε μεγάλη ταλαιπωρία συμμόρφωσης
Φυσικά, ο γορίλας των 800 κιλών στο δωμάτιο είναι ο GDPR. Ο νόμος της ΕΕ για την προστασία δεδομένων ορόσημο εμπλέκεται στην απόξεση ιστού μόνο εάν κάνετε scraping προσωπικά δεδομένα. Για αναφορά, ο GDPR ορίζει τα προσωπικά δεδομένα ως:
Κάθε πληροφορία που σχετίζεται με ταυτοποιημένο ή ταυτοποιήσιμο φυσικό πρόσωπο («υποκείμενο δεδομένων»)· ταυτοποιήσιμο φυσικό πρόσωπο είναι εκείνο που μπορεί να αναγνωριστεί, άμεσα ή έμμεσα, ιδίως με αναφορά σε ένα αναγνωριστικό όπως όνομα, αριθμό αναγνώρισης, δεδομένα τοποθεσίας, διαδικτυακό αναγνωριστικό ή σε έναν ή περισσότερους παράγοντες που αφορούν τη φυσική, φυσιολογική, γενετική, ψυχική, οικονομική, πολιτιστική ή κοινωνική ταυτότητα αυτού του φυσικού προσώπου.
Υπάρχουν πρόσθετες διασφαλίσεις για « ειδικές κατηγορίες » προσωπικών δεδομένων, συμπεριλαμβανομένων της φυλής, της θρησκείας και του σεξουαλικού προσανατολισμού που ο GDPR θεωρεί ιδιαίτερα ευαίσθητους. Τα ψευδώνυμα δεδομένα, τα οποία είναι πληροφορίες με ορισμένα αναγνωριστικά που έχουν αφαιρεθεί, εξακολουθούν να θεωρούνται ταυτοποιητικά και επομένως προσωπικά, αλλά τα ανώνυμα δεδομένα δεν είναι επειδή δεν ταυτοποιούν ένα άτομο. Ωστόσο, πρέπει να προσέξουμε ότι τα δεδομένα είναι πραγματικά ανώνυμα, επειδή τα κακώς ανώνυμα δεδομένα ενδέχεται να μην πληρούν τις προϋποθέσεις για αυτήν την εξαίρεση.
Ας υποθέσουμε ότι πρέπει να διαγράψετε ορισμένα δεδομένα και περιέχει προσωπικά δεδομένα—για παράδειγμα, ερευνάτε καταχωρίσεις ενοικίασης που μερικές φορές περιλαμβάνουν ονόματα και στοιχεία επικοινωνίας ιδιοκτητών ή διαχειριστών. Σε αυτήν την περίπτωση, θα ενεργείτε ως «υπεύθυνος επεξεργασίας δεδομένων» και οι διατάξεις του GDPR που διέπουν τη συλλογή και την επεξεργασία θα ισχύουν για τα προσωπικά δεδομένα. Αρχικά, θα χρειαστεί να αιτιολογήσετε τη συλλογή δεδομένων ως μία από τις έξι νόμιμες βάσεις που ορίζονται από τον GDPR. Ως δημοσιογράφος ή ερευνητής, μπορεί να πιστεύετε ότι η επιχειρηματολογία «για το δημόσιο συμφέρον» θα λειτουργούσε, αλλά αυτή η διάταξη προορίζεται κυρίως για κρατικούς φορείς ή ιδιωτικούς οργανισμούς που εκτελούν τους νόμους ενός κράτους μέλους.
Το πιο ασφαλές στοίχημα είναι να συλλέξετε και να αναλύσετε δεδομένα με βάση το «νόμιμο συμφέρον» σας, αλλά ακόμη και αυτή η αρχή δεν είναι μια λευκή επιταγή για τη συλλογή όλων των προσωπικών δεδομένων. Η δημοσιογραφική ή μη κερδοσκοπική έρευνα υπεράσπισης θα μπορούσε πιθανότατα να χαρακτηριστεί ως έννομο συμφέρον, αλλά αυτό πρέπει να εξισορροπηθεί με τα θεμελιώδη δικαιώματα των δεδομένων που υπόκεινται στην προστασία της ιδιωτικής ζωής και των δεδομένων. Η απόσυρση προσωπικών δεδομένων θα είναι νόμιμη μόνο όταν τα συμφέροντα του υπευθύνου επεξεργασίας δεδομένων (εσείς, σε αυτήν την περίπτωση) υπερτερούν των συμφερόντων του υποκειμένου των δεδομένων. Η ανάλυση πρέπει να γίνει προσεκτικά και να τεκμηριωθεί επίσημα, επομένως είναι καλύτερο να ζητήσετε μια επαγγελματική γνώμη πριν προχωρήσετε σε αυτήν την πορεία.
Μόλις ξεκινήσετε τη συλλογή προσωπικών δεδομένων, πρέπει να τηρείτε τις αρχές του GDPR για την επεξεργασία δεδομένων , συμπεριλαμβανομένης της ελαχιστοποίησης δεδομένων, της λογικής διατήρησης δεδομένων και της ασφάλειας . Ως υπεύθυνος επεξεργασίας δεδομένων, θα έχετε ορισμένες υποχρεώσεις συμμόρφωσης για την αποθήκευση και το χειρισμό των δεδομένων και ακόμη περισσότερες υποχρεώσεις εάν τα μεταφέρετε σε τρίτους. Θα πρέπει επίσης να ενημερώσετε τα υποκείμενα των δεδομένων ότι επεξεργάζεστε τα δεδομένα τους με μια ειδοποίηση απορρήτου και να τους παρέχετε ορισμένα δικαιώματα, όπως το δικαίωμα διαγραφής ή αντίρρησης στην επεξεργασία. Τέλος, μπορεί να χρειαστεί να διενεργήσετε Αξιολόγηση Επιπτώσεων Προστασίας Δεδομένων (DPIA) εάν η επεξεργασία εμπεριέχει «υψηλό κίνδυνο» για το υποκείμενο. Η χρήση τεχνικών όπως η ψευδωνυμοποίηση μπορεί να σας βοηθήσει να ικανοποιήσετε τις απαιτήσεις συμμόρφωσής σας.
Ο GDPR απαιτεί επίσης από κάθε κράτος μέλος να εφαρμόζει νόμους που συνδυάζουν το δικαίωμα στην ιδιωτική ζωή με την ελευθερία έκφρασης και την επεξεργασία δεδομένων για δημοσιογραφικούς σκοπούς. Αυτές οι εθνικές νομοθεσίες μπορεί να διαφέρουν δραματικά και συχνά υπάρχουν λιγότερες οδηγίες για τον τρόπο πλοήγησής τους. Μπορεί επίσης να είναι πολύ δύσκολο να καταλάβουμε ποια έθνη ισχύουν οι νόμοι όταν εξετάζουμε πού ενσωματώνεται ο ιστότοπος, την τοποθεσία των διακομιστών και την υπηκοότητα των υποκειμένων των δεδομένων. Είναι καλύτερο να συμβουλευτείτε έναν δικηγόρο εάν πιστεύετε ότι αυτή η εξαίρεση θα ισχύει για εσάς.
Αν όλα αυτά φαίνονται πολλά, αυτό είναι καλό γιατί υποτίθεται ότι είναι! Ο GDPR δημιουργεί ένα ισχυρό πλαίσιο για την προστασία των προσωπικών πληροφοριών, επομένως θα πρέπει να συλλέγετε τέτοια δεδομένα μόνο εάν τα χρειάζεστε πραγματικά. Επιστρέφοντας στο παράδειγμα της καταχώρισης ενοικίασης, εξετάστε εάν τα ονόματα και τα στοιχεία επικοινωνίας είναι απαραίτητα για τη συλλογή και εάν συλλέξετε προσωπικά δεδομένα κατά λάθος, προσπαθήστε να τα διαγράψετε το συντομότερο δυνατό.
Το 2022, η ΕΕ θέσπισε τον Νόμο για τη Διακυβέρνηση Δεδομένων , ο οποίος θα τεθεί σε ισχύ τον Σεπτέμβριο του 2023. Ο νόμος στοχεύει στο άνοιγμα των κρατικών δεδομένων, κυρίως με την ίδρυση « διαμεσολαβητών δεδομένων » και την απαγόρευση αποκλειστικών συμφωνιών κοινής χρήσης δεδομένων στις οποίες εμπλέκεται η κυβέρνηση. Φαίνεται να είναι μια κάπως πιο εξελιγμένη εκδοχή των νόμων για τα ανοιχτά δεδομένα που έχουν ψηφίσει ορισμένες πολιτείες και τοποθεσίες στις ΗΠΑ Επειδή είναι τόσο νέο, δεν είναι ακόμη σαφές πώς η πράξη θα επηρεάσει την απόξεση ιστού, αλλά αν πρόκειται να διαγράψετε μια κυβερνητική πηγή, θα ήταν καλό να προσέχετε αυτήν την εξέλιξη.
Το κοινοβούλιο της ΕΕ εξετάζει επίσης προτάσεις για τον Νόμο για τα Δεδομένα και για έναν νέο Κανονισμό για την Ιδιωτικότητα των ηλεκτρονικών επικοινωνιών , επομένως είναι πιθανό ο νόμος να αλλάξει τα επόμενα χρόνια. Ορισμένες από τις γλώσσες στον προτεινόμενο νόμο για τα δεδομένα θα τροποποιούσαν το sui generis δικαίωμα, αλλά οι λεπτομέρειες είναι ακόμη υπό συζήτηση. Ωστόσο, ως έχει τώρα, η απόσυρση ιστού δημόσιων εμπορικών δεδομένων που δεν υπόκεινται σε νόμους περί πνευματικών δικαιωμάτων ή απορρήτου είναι νόμιμη στην ΕΕ. Τέλος, η Οδηγία για την Ψηφιακή Ενιαία Αγορά που συζητήσαμε παραπάνω περιέχει μια διάταξη που υποδηλώνει ότι ακόμη και οι ToS μπορεί να μην εμποδίζουν εντελώς τους ερευνητές από το απόξεση, αλλά το πεδίο εφαρμογής της είναι ασαφές και πιθανότατα θα πρέπει να δοκιμαστεί σε δικαστήριο.
Ξέρουμε. Είναι περίπλοκο
Το νομικό καθεστώς της απόξεσης ιστού στην ΕΕ είναι ένα εκπληκτικά περίπλοκο και διαφοροποιημένο θέμα. Οι περισσότεροι από τους δευτερεύοντες πόρους και ένα μεγάλο μέρος της εφαρμοστέας νομολογίας απευθύνονται σε εταιρείες που δραστηριοποιούνται στο διαδίκτυο για να προωθήσουν ένα επιχειρηματικό ενδιαφέρον. Αυτές οι επιχειρήσεις πιθανότατα έχουν διαφορετικούς πόρους και ανοχές κινδύνου από τους περισσότερους δημοσιογράφους, ερευνητές ή υποστηρικτές.
Εάν είστε δημοσιογράφος ή ερευνητής που αναζητάτε το web scraping στην ΕΕ, θυμηθείτε:
- Οι όροι παροχής υπηρεσιών είναι το πιο πιθανό εμπόδιο για τη διαγραφή μη προσωπικών δεδομένων.
- Εάν πρέπει να συλλέξετε προσωπικά δεδομένα, ελαχιστοποιήστε και απορρίψτε τα όσο το δυνατόν περισσότερο.
Υποθέτουμε, επίσης, ότι οι συνάδελφοι δημοσιογράφοι και ερευνητές ενδιαφέρονται περισσότερο για δεδομένα που θα προστατεύονται από την Οδηγία για τις Βάσεις Δεδομένων ή τον GDPR, παρά για κείμενο που προστατεύεται από πνευματικά δικαιώματα. Εταιρείες όπως το OpenAI απορροφούν τεράστιες ποσότητες κειμένου για να τροφοδοτήσουν τα μοντέλα μηχανικής εκμάθησης τους, θέτοντας σε δοκιμασία πολλούς υπάρχοντες νόμους.
Ελπίζουμε ότι αυτή η επισκόπηση της νομοθεσίας της ΕΕ για την απόξεση θα αποδειχθεί χρήσιμη σε δημοσιογράφους δεδομένων και άλλους ερευνητές που προσπαθούν να συλλέξουν πληροφορίες για το δημόσιο συμφέρον. Χρησιμοποιήστε το για να κατανοήσετε το σύμπαν των δυνατοτήτων σε αυτόν τον τομέα - αλλά ρωτήστε έναν δικηγόρο εάν χρειάζεστε καθοδήγηση σχετικά με τη συγκεκριμένη κατάστασή σας - επειδή τίποτα από αυτά δεν είναι νομική συμβουλή.
Ενημέρωση, 24 Αυγούστου 2023
Αυτή η ιστορία έχει ενημερωθεί με πληροφορίες σχετικά με τους εθνικούς νόμους που σχετίζονται με την επεξεργασία προσωπικών δεδομένων για δημοσιογραφικούς σκοπούς.
Πιστώσεις
Εικόνα
Σύμπλεξη
Επιμέλεια και Παραγωγή αντιγράφων
Τεχνική Επιθεώρηση
Επεξεργασία
Δημοσιεύτηκε επίσηςεδώ
Φωτογραφία από το Krakograff Textures στο Unsplash