Κ. Π. Κυπρούλη: Εκπαίδευση παραγωγικών μοντέλων Τεχνητής Νοημοσύνης και Δίκαιο πνευματικής ιδιοκτησίας και συγγενικών δικαιωμάτων
Εκπαίδευση παραγωγικών μοντέλων Τεχνητής Νοημοσύνης
και Δίκαιο πνευματικής ιδιοκτησίας και συγγενικών δικαιωμάτων
Κωνσταντίας (Νάντιας) Π. Κυπρούλη
Δικηγόρου, Δ.Ν.
Ως παραγωγικά ή γενετικά μοντέλα Τεχνητής Νοημοσύνης (εφεξής Τ.Ν.) ονομάζουμε τα σύνολα εκείνα, αποτελούμενα από αλγορίθμους, βάσεις δεδομένων και δεδομένα, που μεταξύ άλλων:
α) μπορούν να επεξεργάζονται ακολουθίες δεδομένων και να κατανοούν το πλαίσιο (context) ενός κειμένου και εν συνεχεία να το τροποποιούν (Transformers), συνθέτοντας ένα νέο κείμενο, δημιουργώντας περίληψη ενός κειμένου, μεταφράζοντας ένα κείμενο κ.λπ. Αυτά είναι τα μεγάλα γλωσσικά μοντέλα (LLMs), στα οποία βασίζεται το γνωστό μας ChatGPT,
β) παράγουν εικόνες (ψηφιακούς πίνακες ζωγραφικής) (Diffusion Models / Image AI), όπως το Midjourney, το DALL-E 3 ενσωματωμένο στο ChatGPT, το Stable Diffusion,
γ) συνθέτουν μουσική (Music AI), όπως το Suno AI, το Udio, το AIVA, το Google Lyria,
δ) συνθέτουν μουσική συνδυάζοντας εικόνες και μουσική (Riffusion Models). Αυτά χρησιμοποιούν μοντέλα παραγωγής εικόνων (Stable Diffusion) για να δημιουργήσουν φασματογραφήματα (οπτική απεικόνιση ήχου), τα οποία στη συνέχεια μετατρέπονται σε μουσική.
Τα παραγωγικά ή γενετικά μοντέλα τεχνητής νοημοσύνης χρησιμοποιούν ως ‘τροφή’, ως ‘πρώτη ύλη’ πληροφορίες, με τις οποίες εκπαιδεύονται και εν συνεχεία, ‘αυτονομούμενα’, παράγουν αποτελέσματα. Τα κατασκευασμένα μοντέλα εντάσσονται σε συστήματα Τ.Ν. που γνωρίζουν ευρεία διάθεση και εμπορική εκμετάλλευση με πολλές, ολοένα διευρυνόμενες, εφαρμογές.
Τα γενετικά μοντέλα τροφοδοτούνται από ελεύθερο δικαιωμάτων περιεχόμενο (π.χ. επικαιρότητα, κρατικά κείμενα όπως νόμοι, διοικητικές πράξεις, δικαστικές αποφάσεις, πνευματικά έργα των οποίων η διάρκεια προστασίας έχει παρέλθει), αλλά και από πνευματικά έργα και άλλα αντικείμενα/συμβολές που προστατεύονται με βάση το Δίκαιο Πνευματικής Ιδιοκτησίας και συγγενικών δικαιωμάτων και που εφεξής για συντομία θα ονομάζουμε «πνευματικό περιεχόμενο».
Οι πάροχοι τεχνητής νοημοσύνης (και μερίδα θεωρητικών) προβάλλουν το επιχείρημα ότι επιτρέπεται βάσει του ενωσιακού δικαίου η χρήση πνευματικού περιεχομένου χωρίς την ανάγκη λήψης συναίνεσης υπό των δικαιούχων, λόγω επιτρεπτής εξαίρεσης/περιορισμού του πνευματικού και των συγγενικών δικαιωμάτων, που καθιερώνεται για την εξόρυξη κειμένων και δεδομένων με τη διάταξη του άρθρου 4 της Οδηγίας 2019/790[1].
Πυρήνας της σκέψης τους είναι ότι η μηχανική μάθηση συνιστά μία ενέργεια αντίστοιχη με αυτή του ανθρώπινου εγκεφάλου, δηλ. δεν διαφέρει από την ανάγνωση, ακρόαση, θέαση υπό του ανθρώπου του υπάρχοντος πνευματικού περιεχομένου (βιβλίων, μουσικής, έργων τέχνης, επιστήμης και πολιτισμού), ο οποίος κατόπιν θυμάται, εμπνέεται και δημιουργεί. Βασίζεται δηλ. στην θεωρητική σκέψη ότι δεν υπάρχει δημιουργία εκ του μηδενός, αλλά ο άνθρωπος δημιουργεί με βάση όσα έχει διδαχθεί, αφομοιώσει, δει, ακούσει κ.λπ. και στην βασική νομική διχοτόμηση μεταξύ ιδέας και μορφής. Έτσι, υποστηρίζουν ότι o μηχανικός ‘εγκέφαλος’ τροφοδοτείται με πνευματικό περιεχόμενο και συγκρατεί τις ιδέες, με την ίδια ακριβώς λογική που ένας άνθρωπος διαβάζει, βλέπει και ακούει έργα του πολιτισμού και της επιστήμης, μαθαίνει και εμπνέεται από αυτά.
Η παρούσα ανάπτυξη έχει ως στόχο να ερευνήσει εάν πράγματι η διάταξη για την εξόρυξη κειμένων και δεδομένων του άρθρου 4 της Οδηγίας 2019/790 (άρθρ. 21Β ν. 2121/1993), μπορεί να αποτελέσει ικανό νομικό έρεισμα για τη μαζική χρήση πνευματικών έργων και λοιπού προστατευόμενου περιεχομένου ως εκπαιδευτικό υλικό για τα μοντέλα παραγωγικής τεχνητής νοημοσύνης[2]. Επίσης, θα παραθέσει το πλαίσιο αντιμετώπισης των προκλήσεων που αντιμετωπίζουν οι πνευματικοί δημιουργοί και συγγενικοί δικαιούχοι λόγω της παραγωγικής Τ.Ν., που σχεδιάζεται σε ενωσιακό επίπεδο.
Ι. Το ευρωπαϊκό νομικό πλαίσιο: άρθρα 3 και 4 της Οδηγίας 2019/790
Η Οδηγία 2019/790 εισήγαγε μία εξαίρεση και έναν περιορισμό του δικαιώματος των πνευματικών δημιουργών και συγγενικών δικαιούχων για την εξόρυξη κειμένων και δεδομένων. Ως εξόρυξη κειμένων και δεδομένων ορίζεται η αυτοματοποιημένη αναλυτική τεχνική επί ψηφιακών δεδομένων με σκοπό την συγκέντρωση πληροφοριών, συμπεριλαμβανομένων των προτύπων, τάσεων και συσχετισμών (άρθρ. 2 περ. 2 Οδηγίας 2109/790 «ορισμοί»)[3].
Ειδικότερα η Οδηγία αφιερώνει δύο άρθρα στην εξόρυξη κειμένων και δεδομένων, τα άρθρα 3 και 4. Το άρθρο 3 (εξόρυξη κειμένων και δεδομένων για σκοπούς επιστημονικής έρευνας)[4] αφορά τη μη εμπορική έρευνα από δημόσιους ερευνητικούς φορείς και ιδρύματα πολιτιστικής κληρονομιάς. Το άρθρο 4 (εξαίρεση ή περιορισμός όσον αφορά την εξόρυξη κειμένων και δεδομένων)[5] επεκτείνει την εξαίρεση και σε ιδιωτικούς φορείς, υπό την προϋπόθεση της νόμιμης πρόσβασης στο περιεχόμενο και της μη άσκησης ρητής επιφύλαξης δικαιωμάτων (opt-out), δηλ. ρητής απαγόρευσης, από τους δικαιούχους, αλλά και πάλι, όπως στο παρόν άρθρο θα αποδείξουμε, μόνον για τις ανάγκες εσωτερικών αναλυτικών διεργασιών προς εξυπηρέτηση της έρευνας και καινοτομίας και όχι προς εξαγωγή και εκμετάλλευση αποτελεσμάτων, όπως αυτά που γνωρίζουμε σήμερα, δηλ. ‘προϊόντων’ εκπαίδευσης, εχόντων μορφή πνευματικών έργων και συμβολών.
α. Επιχείρημα από την ίδια την Οδηγία 2019/790
Καταρχάς επιχείρημα αντλείται από τη γραμματική διατύπωση του άρθρ. 2 περ. 2 της Οδηγίας. Η εξόρυξη, όπως ορίζεται από την Οδηγία (άρθρ. 2 Ορισμοί περ. 2)[6], συνιστά εσωτερική υπολογιστική διεργασία, η οποία αποσκοπεί στην εξαγωγή γυμνών πληροφοριών και όχι στη διατήρηση ή αξιοποίηση της μορφής και των εκφραστικών χαρακτηριστικών του έργου ή των λοιπών προστατευόμενων συμβολών. Η αναπαραγωγή που λαμβάνει χώρα είναι παροδική και λειτουργικά περιορισμένη, γίνεται δε για σκοπούς υπολογιστικής (και ‘στατιστικής’ φύσεως) ανάλυσης και μόνον[7].
Εν συνεχεία, την σκέψη μας βοηθούν οι αιτιολογικές σκέψεις της Οδηγίας 2019/790 που αφορούν την εξόρυξη κειμένων και δεδομένων 8 έως και 18[8], με κυριότερη την τελευταία[9]. Έτσι, η αιτ. σκ. 18 εξηγεί ότι οι αναπαραγωγές ή οι εξαγωγές κειμένων και δεδομένων, που αυτονοήτως ως εκ της φύσεως και του ορισμού τους πραγματοποιούνται μόνον για σκοπούς αυτοματοποιημένης υπολογιστικής ανάλυσης πληροφοριών σε ψηφιακή μορφή (αιτ. σκ. 8 και άρθρ. 2 αριθ. 2 Οδηγίας 2019/790), επιτρέπονται και στον ιδιωτικό τομέα προκειμένου να ενθαρρυνθεί η καινοτομία και όχι για άλλους σκοπούς. Ως προϋποθέσεις για αυτή την εξαίρεση/ περιορισμό, τίθενται: α) πρώτον η ύπαρξη νόμιμης πρόσβασης του πραγματοποιούντος την εξόρυξη στο έργο ή σε άλλο αντικείμενο προστασίας, ακόμη και όταν αυτό καθίσταται διαθέσιμο στο κοινό μέσω διαδικτύου και β) δεύτερον η ανυπαρξία απαγόρευσης, ήτοι δήλωσης παρακράτησης των δικαιωμάτων αναπαραγωγής και εξαγωγής για την εξόρυξη κειμένων και δεδομένων από τους δικαιούχους [ή δήλωση ‘αυτοεξαίρεσης’ / opt out, (εφεξής: «παρακράτηση, αυτοεξαίρεση ή opt out»)].
Η δήλωση παρακράτησης του δικαιώματος αναπαραγωγής/εξαγωγής για εξόρυξη των δικαιούχων θα πρέπει να γίνει με τον ενδεδειγμένο τρόπο, όπως θα εξηγήσουμε παρακάτω. Ιδιαίτερης σημασίας για την ανάλυσή μας είναι η αναφορά του άρθρ. 4 της Οδηγίας 2019/790 (άρθρ. 21Β ν. 2121/1993) και της αιτ. σκ. 18 ότι σε περίπτωση περιεχομένου που έχει καταστεί διαθέσιμο στο κοινό μέσω του διαδικτύου, ως κατάλληλος τρόπος δήλωσης παρακράτησης των δικαιωμάτων εξαγωγής και αναπαραγωγής υπό των δικαιούχων, θεωρείται μόνον η δήλωση που γίνεται με μηχαναγνώσιμα μέσα (ιδίως μέσω μεταδεδομένων, ή με δήλωση στους όρους και προϋποθέσεις ενός ιστότοπου ή μιας υπηρεσίας).
Ο περιορισμός/εξαίρεση προς όφελος ιδιωτικών επιχειρήσεων υπό τις δύο ως άνω προϋποθέσεις (α) νόμιμη πρόσβαση και β) να μην έχει διατηρηθεί το δικαίωμα επιτρέπειν ή απαγορεύειν την εξόρυξη στο πρόσωπο των δικαιούχων) θεσμοθετήθηκε για να εξασφαλίσει ασφάλεια δικαίου σε ιδιωτικούς φορείς, που επιθυμούν να εξετάσουν, τις εξαγόμενες από την εξόρυξη πληροφορίες, πρότυπα, τάσεις και συσχετισμούς, ώστε με αυτές να οργανώσουν και αναπτύξουν καινοτόμο δράση. Δηλαδή, πρόθεση του ενωσιακού νομοθέτη είναι, για να το πούμε απλά, ιδιωτικοί φορείς -επομένως και κερδοσκοπικές επιχειρήσεις- να μπορούν να αναλύσουν δεδομένα προστατευόμενου περιεχομένου, αλλά με μόνον στόχο την (εσωτερική) υπολογιστική επεξεργασία και ανάλυσή τους, ώστε από αυτήν να αντλήσουν στατιστικά δεδομένα, πληροφορίες γυμνές από μορφή και περιεχόμενο που θα επιτρέψουν την βελτιστοποίηση της παραγωγής τους, των εμπορικών πρακτικών τους, των τεχνολογικών μεθόδων κ.ο.κ. και όχι με στόχο την παραγωγή, εκμετάλλευση και παρουσίαση στο κοινό νέου παραγόμενου περιεχομένου με την αναπαραγωγή/ διασκευή/ανασύνθεση των δεδομένων αυτών[10].
β. Επιχείρημα από τη φύση της διαδικασίας εκπαίδευσης Τ.Ν.
Γνωρίζουμε, από τεχνικής και πραγματολογικής απόψεως, ότι η εκπαίδευση παραγωγικών μοντέλων Τ.Ν. δεν αρκείται σε πράξη εξόρυξης γυμνών από μορφή και εκφραστικά χαρακτηριστικά πληροφοριών, αλλά ήδη από το στάδιο της εξόρυξης και εισαγωγής δεδομένων αντιγράφει, αποθηκεύει και διατηρεί τη μορφή των πνευματικών έργων/του πνευματικού προστατευμένου περιεχομένου, ή τμήματα αυτής της μορφής και την ανασυνθέτει, με σκοπό αφενός την εκπαίδευση του μοντέλου (πρώτο στάδιο) και αφετέρου τη μελλοντική παραγωγή νέων αποτελεσμάτων (δεύτερο στάδιο), αποτελεσμάτων, στην πραγματικότητα, ανταγωνιστικών των ίδιων των πνευματικών έργων/του πνευματικού περιεχομένου που τροφοδοτήθηκε, εξορύχθηκε/ανασυντέθηκε[11]. Έχει αποδειχθεί ότι τα μεγάλα γλωσσικά μοντέλα συγκρατούν/απόμνημονεύουν/αποθηκεύουν αυτολεξεί ολόκληρες ενότητες προστατευόμενου υλικού (π.χ. λογοτεχνικά κείμενα, μουσική, στίχους)[12]. Σημειώνεται ότι αυτό που ενδιαφέρει εν προκειμένω, είναι η αποδεδειγμένη απομνημόνευση/ αποστήθιση, δηλ. αναπαραγωγή ολόκληρου του έργου/πνευματικού περιεχομένου και όχι η δυνατότητά του μοντέλου να εξάγει εν τέλει αυτούσιο ή ελαφρά παραλλαγμένο το περιεχόμενο. Κι αυτό διότι, πολλά μοντέλα μπορεί να εφαρμόζουν “εξαγωγικά φίλτρα” (output filters), ώστε καθ’ υπακοήν προγραμματικών εντολών, να μην εξάγουν περιεχόμενο που προσβάλλει δικαιώματα πνευματικής ιδιοκτησίας και συγγενικών δικαιωμάτων (π.χ. πιστές αντιγραφές έργων ή ερμηνειών/εκτελέσεων). Κάτι παρόμοιο συμβαίνει και με τα φίλτρα που δεν τους επιτρέπουν να εξάγουν ρητορική μίσους, ψευδείς ειδήσεις, δυσφημιστικές πληροφορίες, βωμολοχίες κ.λπ.
Το αποδεδειγμένο γεγονός ότι κατά την εκπαίδευση των παραγωγικών μοντέλων Τ.Ν. αποθηκεύεται η μορφή του πνευματικού περιεχομένου (και όχι η ιδέα), πράξη που ανήκει στην εξουσία αναπαραγωγής και πιθανόν και διασκευής/προσαρμογής των πνευματικών και συγγενικών δικαιούχων, δεν επηρεάζεται από το ότι η μόνιμη αποθήκευση γίνεται σε αριθμητικές αναπαραστάσεις, αφού η μετατροπή λέξεων, εικόνων και ήχων σε αριθμούς είναι εγγενής της διαδικασίας ψηφιοποίησης (διότι αριθμούς διαβάζει η μηχανή), η δε ψηφιοποίηση αναμφισβήτητα θεωρείται αναπαραγωγή[13].
Όμως, όπως ανωτέρω εξηγήθηκε, η εξόρυξη δεδομένων και κειμένων, όπως την ορίζει η Οδηγία 2019/790, ακόμη και όταν πραγματοποιείται από ιδιωτικές κερδοσκοπικές επιχειρήσεις, περιορίζεται στην εξαγωγή στοιχείων απογυμνωμένων από τη μορφή τους, με αποκλειστικό στόχο την ανάλυσή τους στο πλαίσιο της καινοτομικής δραστηριότητας των επιχειρήσεων, δηλ. της ‘εσωτερικής’ έρευνάς τους προκειμένου να οδηγηθούν σε οργανωτικές, παραγωγικές, επιχειρηματικές λύσεις που βελτιώνουν τα παραγόμενα προϊόντα τους, τις προσφερόμενες υπηρεσίες τους ή τις τεχνικές και διαδικασίες παραγωγής, διανομής, προώθησης των προϊόντων ή υπηρεσιών τους[14].
Επομένως, με βάση τα ως άνω, συμπεραίνεται ότι, ήδη κατά το πρώτο στάδιο της εισαγωγής δεδομένων προς εκπαίδευση, η πράξη αυτή υπερβαίνει τον ουδέτερο χαρακτήρα της υπολογιστικής ανάλυσης που χαρακτηρίζει την εξόρυξη κειμένων και δεδομένων και, ως εκ τούτου, δεν μπορεί να υπαχθεί στον προβλεπόμενο από το άρθρο 4 της Οδηγίας 2019/790 περιορισμό του δικαιώματος αναπαραγωγής.
Είναι δε ακόμη πιο ξεκάθαρο ότι το δεύτερο στάδιο, αυτό της παραγωγής αποτελεσμάτων, εκφεύγει της έννοιας και του σκοπού της εξόρυξης. Διότι, η εξόρυξη κειμένων και δεδομένων ως εσωτερική υπολογιστική λειτουργία, δεν εξωτερικεύεται, ούτε προορίζεται για να παρουσιασθεί στο κοινό, αλλά χρησιμοποιείται αποκλειστικά από τον ερευνητή για την εξαγωγή συμπερασμάτων κατά την αναλυτική διαδικασία. Δηλαδή, το αποτέλεσμα της εξόρυξης δεν μπορεί, ως τέτοιο, να αποτελέσει αντικείμενο παρουσίασης στο κοινό ή διάθεσης στο κοινό ή άλλης αυτοτελούς εκμετάλλευσης. Όμως, η παραγωγική/γενετική τεχνητή νοημοσύνη, εγγενώς και αναπόσπαστα, παράγει, μέσω των εκπαιδευμένων μοντέλων της, αποτελέσματα, εξόδους, “προϊόντα” εκπαίδευσης που, όπως αποδείχθηκε, περιέχουν ολόκληρα τμήματα έργων και ερμηνειών εκτελέσεων, είτε αυτούσια, είτε διασκευασμένα/αλλοιωμένα, τα οποία καθίστανται αντικείμενο διάθεσης στο κοινό, παρουσίασης στο κοινό (ή και διανομής αν π.χ. τυπωθεί το αποτέλεσμα σε έντυπο, cd, dvd), και μπορεί να τυγχάνουν εμπορικής ή άλλης εκμετάλλευσης. Θυμίζουμε δε ότι, όπως έχει κριθεί, η χωρίς συναίνεση του δημιουργού αναπαραγωγή ακόμη και ελάχιστων ή μικρών τμημάτων έργου είναι δυνατόν να κριθεί προσβολή του δικαιώματός του στην αναπαραγωγή [βλ. αποφ. 16.7.2009 ΔΕΕ C-5/2008 Infopack κ. Danske Dagblades Forening, όπου η αντιγραφή 11 λέξεων από δημοσιογραφικά άρθρα (τίτλους και σώμα κειμένου) κρίθηκε ικανό τμήμα έργου για να κριθεί παράνομη, εφόσον αυτά τα αναπαραγόμενα στοιχεία (11 λέξεις) αποτελούν την έκφραση της προσωπικής πνευματικής εργασίας του δημιουργού]. Κρίθηκε επίσης ότι μία τέτοια αναπαραγωγή δεν πληροί την προϋπόθεση περί του μεταβατικού χαρακτήρα του άρθρου 5 § 1 της Οδηγίας 2001/29[15].
γ. Eπιχείρημα από την φύση και σκοπό των εξαιρέσεων/περιορισμών γενικά και ειδικά των εξαιρέσεων από το δικαίωμα αναπαραγωγής - Τεστ των τριών σταδίων
Επιχείρημα αντλείται και από όσα ορίζει ο ενωσιακός νομοθέτης και δέχεται ο ενωσιακός δικαστής σχετικά με τις εξαιρέσεις/περιορισμούς του δικαιώματος των πνευματικών δημιουργών και συγγενικών δικαιούχων. Η ερμηνεία των εξαιρέσεων/περιορισμών οφείλει να είναι συσταλτική, η δε γραμματική και συστηματική ερμηνεία τους πρέπει να συνοδεύεται και από τελολογική στάθμιση, με την οποία κρίνεται εάν η εξαίρεση/περιορισμός επιτυγχάνει την δίκαιη ισορροπία[16].
Άλλωστε, οι εξαιρέσεις/περιορισμοί του δικαιώματος αναπαραγωγής δεν πρέπει να έχουν αυτόνομη οικονομική σημασία, άμεση ή έμμεση, όπως επιβάλλει το άρθρ. 5 § 1 Οδηγίας 2001/29, ενώ η ίδια Οδηγία επισημαίνει ότι η εμβέλεια ορισμένων εξαιρέσεων ή περιορισμών μπορεί να χρειασθεί να περιορισθεί, λόγω των αυξημένων οικονομικών τους επιπτώσεων στο επιγραμμικό περιβάλλον (αιτ. σκ. 44)[17].
Οι εξαιρέσεις ή περιορισμοί τίθενται προκειμένου να εξυπηρετηθεί ένα υπέρτερο, άξιο προστασίας δικαίωμα, που συνήθως αφορά το κοινωνικό σύνολο, τον πολιτισμό εν γένει (όπως κυρίως, ο πρώτιστος περιορισμός του δικαιώματος: η διάρκεια, ή η ιδιωτική αναπαραγωγή) ή συγκεκριμένες ομάδες πολιτών (όπως για τους τυφλούς/έχοντες προβλήματα όρασης) κ.λπ. Τέτοιο υπέρτερο δικαίωμα δεν μοιάζει να υπάρχει στην περίπτωση που εξετάζουμε.
Στο σημείο αυτό είναι χρήσιμο να δούμε γιατί κρίθηκε απαραίτητη η πρόβλεψη της εξαίρεσης/περιορισμού για την εξόρυξη κειμένων και δεδομένων. Πρωταρχική ανάγκη ήταν η εναρμόνιση των κρατών μελών της Ε.Ε., αναφορικά με την εξαίρεση για την διδασκαλία και την έρευνα που μέχρι την Οδηγία 2019/790 δεν ήταν υποχρεωτική (άρθρ. 5 § 3 περ. α’ και ιδ’ Οδηγίας 2001/29)[18], εναρμόνιση που κατέστη ακόμη περισσότερο αναγκαία λόγω της εκτενούς πλέον ψηφιακής και διασυνοριακής εκπαιδευτικής και ερευνητικής δράσης.
Φρονούμε ότι η άνευ άδειας και άνευ αμοιβής, χρήση πνευματικών έργων και άλλου προστατευόμενου περιεχομένου, για την εκπαίδευση μοντέλων παραγωγικής Τ.Ν. μακράν απέχει από το να πληροί τις προϋποθέσεις του διεθνούς και ενωσιακού «τεστ των τριών σταδίων» (άρθρ. 9 § 2 ΣΒέρνης, άρθρ. 13 TRIPS, άρθρ. 10 WCT, άρθρ. 16 WPPT, άρθρ. 5 § 5 Οδηγίας 2001/29, αιτ. σκ. 6 Οδηγίας 2019/790, μεταφερθέν στο εθνικό μας δίκαιο με το άρθρο 28Γ του ν. 2121/ 1993). Διότι, η χρήση αυτή δεν περιορίζεται σε ορισμένες ειδικές, εξαιρετικές περιπτώσεις (πρώτο στάδιο ελέγχου), αλλά λαμβάνει μαζικό και συστηματικό χαρακτήρα. Δεν πληρούται όμως ούτε η δεύτερη προϋπόθεση (δεύτερο στάδιο ελέγχου) διότι αναπόφευκτα έρχεται σε σύγκρουση με την κανονική εκμετάλλευση του έργου, καθώς τα παραγόμενα αποτελέσματα της γενετικής Τ.Ν. είναι απομιμητικά και άρα ευθέως ανταγωνιστικά των προστατευόμενων έργων/συμβολών με τα οποία εκπαιδεύτηκαν τα μοντέλα, σε σημείο μάλιστα που είναι δυνατόν να υποκαταστήσουν ή να μειώσουν σοβαρά την κανονική εκμετάλλευσή τους, αφού έχουν σαφώς μειωμένο κόστος και αξιοσημείωτη ευκολία παραγωγής, με αποτέλεσμα να είναι ιδιαιτέρως θελκτικά και να προτιμώνται. Αναμφίβολα, επομένως, προκαλείται αδικαιολόγητη βλάβη στα έννομα συμφέροντα των δικαιούχων (τρίτο στάδιο ελέγχου), μεταφέροντας σημαντική οικονομική αξία στους παρόχους Τ.Ν. χωρίς καμία απολύτως ανταμοιβή για τους προσφέροντες την ‘πρώτη ύλη’ δικαιούχους, αφού πρόκειται για χρήση που δεν είχε αρχικώς προβλεφθεί, και σαφώς το αποτέλεσμα εξόδου παρουσιάζεται/διατίθεται σε ένα νέο -και δη αναρίθμητο- κοινό[19].
Μάλιστα, καθίσταται ευκρινής η σαφής έλλειψη δίκαιης ισορροπίας, αν σκεφθούμε την εξής αντίφαση: πώς εξηγείται να θέλησε, εν έτει 2019, ο ενωσιακός νομοθέτης να επιτρέπεται κατ’ εξαίρεση, χωρίς άδεια και χωρίς αμοιβή, μέσω της εξόρυξης κειμένων και δεδομένων, η εκπαίδευση μοντέλων παραγωγικής Τ.Ν. (Τεχνητής Νοημοσύνης) με πνευματικό περιεχόμενο, το οποίο δεν μένει ως τροφή για ‘εσωτερική’ μηχανική μάθηση, αλλά αποδεδειγμένα αναπαράγεται, διασκευάζεται, ανασυντίθεται και εξάγεται για την τέρψη του κοινού, και δη ενός νέου κοινού και σε εξαιρετικά μεγάλη (παγκόσμια) έκταση και συχνότητα, ενώ για την εξαίρεση/περιορισμό του δικαιώματος αναπαραγωγής, διάθεσης και παρουσίασης στο κοινό, για την ψηφιακή χρήση των έργων κατά την διδασκαλία ή τις εξετάσεις σε εκπαιδευτικό ίδρυμα (δηλ. για μια χρήση πολύ μικρότερης έκτασης), να προβλέπεται δυνατότητα των κρατών μελών να επιβάλλουν εύλογη αμοιβή (άρθρ. 5 § 4 Οδηγία 2019/790, την οποία πρόβλεψη ο Έλληνας νομοθέτης αξιοποίησε, προβλέποντας την επιβολή εύλογης αμοιβής στους δημιουργούς και εκδότες άρθρ. 21 § 5 ν.2121/1993);
Επίσης, έρχεται σε σύγκρουση με την σαφή επιλογή του ενωσιακού νομοθέτη να στηρίξει την δίκαιη και αναλογική αμοιβή των δημιουργών και των ερμηνευτών εκτελεστών καλλιτεχνών για κάθε χρήση των έργων και ερμηνειών εκτελέσεών τους (άρθρ. 18,20 και αιτ. σκ. 73, 78 Οδηγία 2019/790, α.32, 32Α και 46 §§ 3, 6 ν. 2121/1993).
δ. Επιχείρημα από την προϋπόθεση της νόμιμης προσβασης του άρθρ. 4 Οδηγίας 2019/790
Υπενθυμίζεται ότι η πρώτη προϋπόθεση για την εξόρυξη κειμένων και δεδομένων που ορίζει το άρθρ. 4 της Οδηγίας 2019/790 (άρθρ. 21Β ν. 2121/1993) είναι ο τελών την εξόρυξη να έχει νόμιμη πρόσβαση στο πνευματικό υλικό.
Όμως, έχει αποδειχθεί στο πλαίσιο δικαστικών υποθέσεων τόσο στην Ευρώπη όσο και στις ΗΠΑ, ότι γενετικά μοντέλα τεχνητής νοημοσύνης έχουν χρησιμοποιήσει -και πιθανότατα συνεχίζουν να χρησιμοποιούν- περιεχόμενο που δεν ήταν νομίμως προσβάσιμο στο διαδίκτυο. Ενδεικτικά, το σύστημα LLaMA της Meta φέρεται να έχει εκπαιδευθεί με υλικό προερχόμενο από τον πειρατικό ιστότοπο LibGen[20], ο οποίος διαθέτει στο κοινό εκατομμύρια βιβλία χωρίς άδεια των δικαιούχων.
Πέραν αυτού, έχουν καταγραφεί περιπτώσεις παραβίασης δηλώσεων επιφύλαξης που είχαν τεθεί με μηχαναγνώσιμο τρόπο, δηλ. έχει αποδειχθεί ότι τινά παραγωγικά μοντέλα Τ.Ν. έχουν καταφέρει να παρακάμψουν δηλώσεις επιφύλαξης/αυτοεξαίρεσης (opt out) δικαιούχων που είχαν τεθεί μέσω αρχείων robots.txt (π.χ. μοντέλα παραγωγικής Τ.Ν. αναπτυχθέντα από την Perplexity)[21].
Επομένως, η ωμή πραγματικότητα δείχνει ότι η νόμιμη πρόσβαση συχνά αποτελεί φενάκη και ότι πάντως, είναι τεχνολογικά δυνατό και εύκολο για τα παραγωγικά μοντέλα να εκπαιδευθούν από πειρατικό περιεχόμενο ή από περιεχόμενο, η εξόρυξη του οποίου έχει ρητώς, ειδικώς και καταλλήλως απαγορευθεί από τους δικαιούχους του. Επιπλέον, δεδομένης της αδιαφάνειας και της επίκλησης εμπορικού απορρήτου των εταιρειών ανάπτυξης μοντέλων παραγωγικής Τ.Ν., είναι εξαιρετικά δυσχερής, επίπονη και κοστοβόρα η απόδειξη από πλευράς δικαιούχων σχετικά με το παράνομο των πηγών /της άντλησης προστατευόμενου περιεχομένου προς εκπαίδευση.
ε. Ευρωπαϊκός Κανονισμός Τ.Ν.
Στην συστηματική προσπάθεια να στηριχθεί η εκπαίδευση των μοντέλων παραγωγικής Τ.Ν. στο παγκόσμιο πνευματικό περιεχόμενο, χωρίς ανάγκη συναίνεσης των δικαιούχων και χωρίς αμοιβή, προσπάθεια που εξικνείται κυρίως από τους κολοσσούς των ΗΠΑ στον τομέα της Τ.Ν., έχουν παρουσιασθεί επιχειρήματα αντλούμενα από τον Ευρωπαϊκό Κανονισμό 2024/1689 για την Τ.Ν. (γνωστός ως AI Act) (εφεξής: Καν Τ.Ν.). Συγκεκριμένα, ισχυρίζονται ότι ο Κανονισμός 2024/1689 για την Τ.Ν. επιβεβαιώνει ότι η εκπαίδευση των γενετικών μοντέλων με πνευματικό περιεχόμενο δεν χρειάζεται να επιτραπεί από τους δικαιούχους, καθώς ασκείται με βάση νόμιμη εξαίρεση από το δικαίωμα αναπαραγωγής, ήτοι την εξαίρεση του άρθρ. 4 Οδηγίας 2019/790 για την εξόρυξη κειμένων και δεδομένων.
Όμως, θεωρούμε ότι δεν μπορεί να αντληθεί ένα τέτοιο συμπέρασμα από τον Κανονισμό για την Τ.Ν., καθώς εκφεύγει σαφώς του σκοπού και περιεχομένου του, μία τέτοια ερμηνευτική διαπίστωση περί νομοθετικής ρύθμισης της Οδηγίας 2019/790. Ο Καν. Τ.Ν. δεν επιχειρεί να ερμηνεύσει το άρθρ. 4 της Οδηγίας 2019/790 (εξαίρεση/περιορισμό εξόρυξης) και σίγουρα δεν απαντά στο κατά πόσον η εν λόγω εξαίρεση/περιορισμός καλύπτει άλλες ή μεταγενέστερες πράξεις πέραν της αρχικής αναπαραγωγής, όπως την διάθεση των συνόλων δεδομένων (datasets) σε τρίτους, καθώς και το εάν πληρούνται οι προϋποθέσεις του ελέγχου των τριών σταδίων.
Καταρχάς, πρωτεύων σκοπός του Καν Τ.Ν. και πεδίο εφαρμογής του είναι να προαχθεί η ανάπτυξη και επικαιροποίηση της τεχνολογίας Τ.Ν., με την ταυτόχρονη θέσπιση μέτρων για την προστασία δημόσιων συμφερόντων και θεμελιωδών δικαιωμάτων των πολιτών από τις συνέπειες της Τ.Ν. και την οριοθέτηση ενός ελεγχόμενου περιβάλλοντος καινοτομίας σε όλους τους τομείς στους οποίους αναπτύσσει εφαρμογές η Τ.Ν.[22]. Σημειώνεται, ότι ο Καν. Τ.Ν. χρησιμοποιεί τον όρο “μοντέλα Τ.Ν. γενικού σκοπού”, όπου συγκαταλέγονται τα μοντέλα παραγωγικής Τ.Ν., τα οποία αφορά το παρόν άρθρο[23].
Η μόνη αναφορά που ο Καν.Τ.Ν. κάνει στην πνευματική ιδιοκτησία είναι στο άρθρο 53 σε συνδυασμό με τις αιτ. σκέψεις 104-109, όπου προβλέπει καταρχάς την υποχρέωση των παρόχων μοντέλων Τ.Ν. γενικού σκοπού να εντοπίζουν και να σέβονται την ασκηθείσα επιφύλαξη (opt-out)/παρακράτηση του δικαιώματος εξαγωγής και αναπαραγωγής από τους δικαιούχους, σύμφωνα με το άρθρο 4 § 3 της Οδηγίας (ΕΕ) 2019/790 (άρθρ. 53 § 1 στοιχ. γ΄ Καν Τ.Ν.) και κατά δεύτερον την υποχρέωση διαφάνειας, με βάση την οποία οι πάροχοι Τ.Ν. γενικού σκοπού οφείλουν να δημοσιοποιούν επαρκώς λεπτομερή περίληψη αναφορικά με το περιεχόμενο με το οποίο εκπαιδεύθηκε το μοντέλο Τ.Ν. γενικού σκοπού (άρθρ. 53 § 1 στοιχ. δ΄ Καν.Τ.Ν). Η επαρκώς λεπτομερής περίληψη θα πρέπει να καταλαμβάνει την απαρίθμηση των συνόλων δεδομένων που χρησιμοποιήθηκαν στην εκπαίδευση, βάσει υποδείγματος που καταρτίζεται από την Υπηρεσία Τεχνητής Νοημοσύνης[24].
Από την γραμματική διατύπωση, αλλά και από τον δικαιολογητικό σκοπό νομοθέτησης του Καν. Τ.Ν. προκύπτει ότι η αναφορά του άρθρ. 53 Καν Τ.Ν. στην εξόρυξη κειμένων και δεδομένων δεν συνιστά, ούτε επιδιώκει να επιβεβαιώσει την ισχυριζόμενη νομική θεμελίωση της, άνευ αδείας και άνευ αμοιβής, τροφοδότησης των γενετικών μοντέλων Τ.Ν. με πνευματικό περιεχόμενο στην εξαίρεση/περιορισμό του άρθρ. 4 Οδηγίας 2019/790.
Η εν λόγω αναφορά, όπως ερμηνεύεται με την βοήθεια των αιτ. σκ. 105,106, 107 Καν Τ.Ν., αποτελεί απλή καταγραφή ότι, ως τεχνική, η εξόρυξη κειμένων και δεδομένων, μπορεί να χρησιμοποιείται από τα μεγάλα παραγωγικά μοντέλα Τ.Ν. καθώς και ως θέσπιση υποχρέωσης των παρόχων Τ.Ν. γενικού σκοπού να συμμορφωθούν με διάταξη ενωσιακού δικαίου, ανεξαρτήτως του πού κατασκευάσθηκαν ή πού εκπαιδεύθηκαν αυτά τα μοντέλα. Στο πλαίσιο της θέσπισης υποχρέωσης συμμόρφωσης του μοντέλου παραγωγικής Τ.Ν. με το ενωσιακό δίκαιο πνευματικής ιδιοκτησίας και συγγενικών δικαιωμάτων, αναφέρεται ειδικά στην διάταξη του άρθρ. 4 Οδηγίας 2019/790 που προβλέπει άσκηση δικαιώματος επιφύλαξης/παρακράτησης του δικαιώματος αναπαραγωγής και εξαγωγής από τους πνευματικούς και συγγενικούς δικαιούχους, όχι γιατί παίρνει θέση επί του εάν αυτή (η εξόρυξη κειμένων και δεδομένων) καλύπτει το σύνολο των εργασιών που τελούνται στο πλαίσιο της εκπαίδευσης γενετικών μοντέλων Τ.Ν., καθώς και τις διεργασίες παραγωγής αποτελεσμάτων εξόδου από το γενετικό μοντέλο Τ.Ν., αλλά γιατί επιβεβαιώνει ότι οι πάροχοι μοντέλων Τ.Ν. γενικού σκοπού πρέπει να σέβονται τη νομοθεσία περί πνευματικής ιδιοκτησίας και τις δηλώσεις opt-out. Για τον σκοπό αυτόν θεσπίζει πρακτικά μέτρα άσκησης της εν λόγω συμμόρφωσης (δηλ. υποχρέωση διαφάνειας και υποχρέωση μη συμπερίληψης στην εκπαίδευση πνευματικού υλικού που έχει αποκλεισθεί, κατ’ επιταγήν των δικαιούχων τους, από τα σύνολα δεδομένων εκπαίδευσης)[25].
στ. Συμπέρασμα
Με βάση όσα ως άνω ειπώθηκαν καθίσταται φανερό ότι το άρθρο 4 της Οδηγίας 2019/790 (άρθρ. 21Β ν.2121/1993) δεν είναι ικανό νομικό έρεισμα για την χωρίς άδεια των δικαιούχων εισαγωγή των έργων/συμβολών τους ως εκπαιδευτικό υλικό των παραγωγικών μοντέλων Τ.Ν.
Ο βασικότερος λόγος είναι ότι έχει πλέον αποδειχθεί ότι, ήδη κατά το πρώτο στάδιο της εισαγωγής, λαμβάνει χώρα αναπαραγωγή όχι απλώς και μόνον στοιχείων και δεδομένων απογυμνωμένων από την μορφή των έργων/ συμβολών, αλλά ενσωματώνεται πλήρως ή μερικώς, η αναπαράσταση της δομής, της μορφής και των εκφραστικών χαρακτηριστικών προϋπαρχόντων πνευματικών έργων και γενικότερα πνευματικού περιεχομένου.
Ο δεύτερος λόγος είναι, ότι ενώ η εξαίρεση/περιορισμός της εξόρυξης κειμένων και δεδομένων αφορά μόνον το δικαίωμα αναπαραγωγής, διαπιστώνεται ότι, ήδη κατά το στάδιο της εξόρυξης και εισαγωγής δεδομένων για την εκπαίδευση των μοντέλων τεχνητής νοημοσύνης και πολλώ μάλλον στο στάδιο της παραγωγής και παρουσίασης του αποτελέσματος, θίγονται περισσότερες εξουσίες του περιουσιακού δικαιώματος, καθώς και το ηθικό δικαίωμα των δικαιούχων. Συγκεκριμένα, στο στάδιο της εξόρυξης και εισαγωγής δεδομένων για εκπαίδευση θίγεται το δικαίωμα αναπαραγωγής, πιθανόν και το δικαίωμα διασκευής/προσαρμογής/μετατροπής, αλλά και το δικαίωμα διάθεσης στο κοινό όταν τα μοντέλα λαμβάνουν έτοιμα σύνολα δεδομένων (datasets)[26], καθώς και το ηθικό δικαίωμα (δικαίωμα στην πατρότητα και απαγόρευσης αλλοίωσης), ενώ κατά το στάδιο εξαγωγής, θίγεται το δικαίωμα αναπαραγωγής και τα δικαιώματα διασκευής/προσαρμογής/ μετάφρασης, παρουσίασης στο κοινό, διάθεσης στο κοινό, πιθανόν και διανομής, και αναμφίβολα και το ηθικό δικαίωμα[27].
Επομένως, καταδεικνύεται ότι ο υφιστάμενος περιορισμός του δικαιώματος αναπαραγωγής και εξαγωγής για την εξόρυξη κειμένων και δεδομένων δεν μπορεί να θεμελιώσει τη μαζική αντιγραφή, αποθήκευση, ανασύνθεση και χρήση προστατευόμενου πνευματικού και καλλιτεχνικού υλικού με σκοπό την παραγωγή και παρουσίαση στο κοινό απομιμητικών και έντονα ανταγωνιστικών προϊόντων. Αυτή η γνώμη κερδίζει όλο και μεγαλύτερη απήχηση μεταξύ θεωρητικών αλλά και των ευρωπαϊκών φορέων χάραξης πολιτικής, με προέχον το Ευρωπαϊκό Κοινοβούλιο[28]. Γίνεται επίσης δεκτό ότι μια τέτοια χρήση δεν εντασσόταν στον ρυθμιστικό ορίζοντα του ενωσιακού νομοθέτη κατά τη θέσπιση της εξαίρεσης το 2019, σε χρονικό σημείο κατά το οποίο οι τεχνολογίες παραγωγικής τεχνητής νοημοσύνης δεν είχαν ακόμη αναπτυχθεί στην έκταση και με τα χαρακτηριστικά που παρουσιάζουν σήμερα[29].
ΙΙ. Το νυν πλαίσιο αντιμετώπισης.
α. Η άσκηση της επιφύλαξης/παρακράτησης του δικαιώματος αναπαραγωγής/εξαγωγής (opt_out)
Η μόνη γραμμή άμυνας των δικαιούχων έναντι της αθρόας χρήσης των έργων και συμβολών τους ως δεδομένα εκπαίδευσης των γενετικών μοντέλων Τ.Ν. που έχει μέχρι στιγμής προταθεί σε ενωσιακό επίπεδο -λόγω της αυτοπαγίδευσης της Ε.Ε. στο άρθρ. 4 Οδηγίας 2019/790- είναι η άσκηση του λεγόμενου opt out, η δυνατότητα δηλ. που προβλέπει το ίδιο άρθρο (άρθρ. 4 Οδηγίας 2019/790, άρθρ. 21Β ν. 2121/1993) να δηλώσουν με κατάλληλο τρόπο ότι δεν επιθυμούν την εξόρυξη και εξαγωγή κειμένων και δεδομένων από τα έργα/συμβολές τους.
Καταρχάς, παρατηρείται ότι η ρύθμιση του “οpt-out” αποτελεί απόκλιση από τη δογματική παράδοση του ηπειρωτικού δικαίου πνευματικής ιδιοκτησίας, καθώς μετατρέπει τη σιωπή σε συναίνεση και αντιστρέφει την παραδοσιακή αρχή με βάση την οποία τα πνευματικά και συγγενικά δικαιώματα (ιδίως δε τα απόλυτα, όπως είναι το δικαίωμα στην αναπαραγωγή), μεταβιβάζονται ή αδειοδοτούνται μόνον εφόσον έχει προηγηθεί σαφής (συχνότατα έγγραφη) σύμβαση/συγκατάθεση του δικαιούχου και δεν αρκεί η σιωπηρή υπονόηση ότι έχουν μεταβιβαστεί ή αδειοδοτηθεί, ή η απουσία διαμαρτυρίας.
Κατά δεύτερον, παρατηρείται ότι η επιφύλαξη/παρακράτηση του δικαιώματος αναπαραγωγής και εξαγωγής για σκοπούς εξόρυξης κειμένων και δεδομένων, πρέπει να έχει γίνει με “κατάλληλο τρόπο”. Ως κατάλληλος τρόπος εφόσον πρόκειται για διαδικτυακά διαθέσιμο περιεχόμενο, θεωρείται μόνον αυτός που γίνεται με μηχαναγνώσιμα μέσα. Αν σκεφθεί κανείς ότι το σύνολο, άλλως, η σε συντριπτικό βαθμό πλειονότητα, του προστατευόμενου περιεχομένου διατίθεται επιγραμμικά, και ότι, όπως υποστηρίζεται, μόνον μέσω ενσωματωμένων ψηφιακών ενδείξεων και εντολών, μπορεί το προηγμένο λογισμικό της τεχνητής νοημοσύνης να «αντιληφθεί» την ύπαρξη απαγόρευσης κατά τη διαδικασία αυτοματοποιημένης εξόρυξης, τότε συμπεραίνει, ότι η μηχαναγνώσιμη μορφή άσκησης του opt-out είναι ο απόλυτος κανόνας, χωρίς καμία εξαίρεση στην πράξη.
Παράλληλα, ακόμη και εάν αποδεχόμασταν καλοπίστως ότι βούληση του ενωσιακού νομοθέτη ήταν, η εξαίρεση/περιορισμός του δικαιώματος αναπαραγωγής του άρθρ. 4 της Οδηγίας 2019/790 για την εξόρυξη (άρθρ. 21Β ν. 2121/ 1993) να αποτελεί τη νομική βάση για το επιτρεπτό της εισαγωγής προστατευόμενου περιεχομένου στην εκπαίδευση μοντέλων παραγωγικής τεχνητής νοημοσύνης, ανακαλύπτουμε ένα δομικό κενό προστασίας, ιδίως ως προς τους ερμηνευτές/εκτελεστές. Διότι, αφενός, οι ερμηνευτές εκτελεστές καλλιτέχνες δεν κατέχουν, ούτε ελέγχουν την υλική ψηφιακή εγγραφή της ερμηνείας εκτέλεσής τους, ούτε τη διαδικτυακή διάθεσή της, ώστε να μπορούν να ενσωματώσουν μηχαναγνώσιμες εντολές επιφύλαξης/παρακράτησης των δικαιωμάτων τους. Περαιτέρω, στις συντριπτικά περισσότερες έννομες τάξεις των κρατών μελών της Ε.Ε. υφίσταται τεκμήριο μεταβίβασης των δικαιωμάτων των ερμηνευτών εκτελεστών στον παραγωγό, οπότε υπάρχει εγγενής αδυναμία του ερμηνευτή εκτελεστή καλλιτέχνη να παρακρατήσει το δικαίωμα αναπαραγωγής για εξόρυξη. Αλλά και όπου δεν υπάρχει τεκμήριο μεταβίβασης (όπως στην δική μας όπου απαιτείται ειδική και έγγραφη εκχώρηση/αδειοδότηση ρητά αναφερόμενων εξουσιών του περιουσιακού δικαιώματος), αποτελεί απολύτως πάγια πρακτική, όταν ο καλλιτέχνης συμβάλλεται με τον παραγωγό, να καλείται να αδειοδοτήσει όλες ανελλιπώς τις εξουσίες του περιουσιακού του δικαιώματος. Αυτό έχει ως αποτέλεσμα, η δήλωση επιφύλαξης (opt-out), η δήλωση δηλαδή ότι διατηρεί το απόλυτο δικαίωμα να επιτρέπει ή ν’ απαγορεύει την εξόρυξη, να μην παραμένει στον ερμηνευτή εκτελεστή καλλιτέχνη, αλλά να εκχωρείται στον παραγωγό και άρα να εναπόκειται στην διάθεση του παραγωγού να το ασκήσει ή όχι, για λογαριασμό του ερμηνευτή εκτελεστή καλλιτέχνη.
Επομένως, καθίσταται σαφές ότι, αν μη τι άλλο, μία σημαντική κατηγορία δικαιούχων, αυτή των ερμηνευτών εκτελεστών καλλιτεχνών, έχει δομική αδυναμία να ασκήσει την παρακράτηση του δικαιώματος αναπαραγωγής και εξαγωγής για σκοπούς εξόρυξης. Δηλαδή εκ προοιμίου αδυνατεί να ασκήσει ένα δικαίωμα, που θεωρητικά, σε κανονιστικό πεδίο, της αποδίδεται. Άρα παρουσιάζεται σαφές νομοθετικό κενό.
β. Ανάγκη δημιουργίας Μητρώου
Κατά την πρακτική εφαρμογή της δήλωσης επιφύλαξης (opt out) εμφανίζονται και άλλα κενά προστασίας.
Απαραίτητη προϋπόθεση για να ασκήσουν οι δικαιούχοι τη δήλωση επιφύλαξης/παρακράτησης του δικαιώματος αναπαραγωγής/εξαγωγής, αλλά και για να δύνανται να τα προστατεύουν, εάν έχουν επιφυλαχθεί, είναι να γνωρίζουν εάν τα έργα/συμβολές τους σκοπεύουν να χρησιμοποιηθούν ως εκπαιδευτικό υλικό, ή εάν έχουν χρησιμοποιηθεί, αντιστοίχως.
Για να γίνει αυτό, προτείνεται από την Ευρωπαϊκή Επιτροπή η δημιουργία ενός κεντρικού Ευρωπαϊκού Μητρώου[30], το οποίο θα μπορούσε να τεθεί υπό τη διαχείριση του Γραφείου Διανοητικής Ιδιοκτησίας της Ευρωπαϊκής Ένωσης (EUIPO) και στο οποίο οι δικαιούχοι θα καταχωρούν την απαγόρευση χρήσης των έργων και συμβολών τους για σκοπούς εκπαίδευσης συστημάτων τεχνητής νοημοσύνης, προκειμένου να διασφαλιστεί ο αποτελεσματικός αποκλεισμός των καταχωρημένων έργων από αυτοματοποιημένες διαδικασίες ιστοσυγκομιδής (data crawling). Μια τέτοια λύση θα ενίσχυε, όπως λέγεται, και την ασφάλεια δικαίου για τις εταιρείες ανάπτυξης μοντέλων παραγωγικής Τ.Ν., οι οποίες θα είχαν έτσι τη δυνατότητα να εντοπίζουν εκ των προτέρων ποιο περιεχόμενο δεν επιτρέπεται να χρησιμοποιήσουν χωρίς άδεια.
Ωστόσο, η δημιουργία ενός τέτοιου Μητρώου μεταφέρει σημαντικό διοικητικό, οικονομικό, πρακτικό βάρος στους δικαιούχους, οι οποίοι καλούνται να προβούν ενεργά στη σχετική καταχώρηση και συνεπάγεται κοστοβόρες διοικητικές και τεχνικές συνέπειες για την δημιουργία και διατήρηση αυτού του Μητρώου. Επιπλέον, αδυνατεί να προσφέρει πλήρη προστασία, αφενός διότι πολλοί δικαιούχοι έχουν εν τοις πράγμασι αδυναμία να ασκήσουν το εν λόγω δικαίωμά τους (κυρίως οι ερμηνευτές εκτελεστές καλλιτέχνες, όπως πιο πάνω εξηγήσαμε) και αφετέρου διότι αναφέρεται σε μελλοντικό χρόνο (μετά την σύστασή του), αφήνοντας ακάλυπτο το ήδη υπάρχον και χρησιμοποιημένο πνευματικό περιεχόμενο.
γ. Διαπίστωση κενών προστασίας
Είναι αδιαμφισβήτητο ότι ο ενωσιακός νομοθέτης θέλει να παράσχει ασφάλεια δικαίου και το κατάλληλο περιβάλλον, ώστε να ευνοηθεί η ανάπτυξη ευρωπαϊκών κατασκευαστών και παρόχων Τ.Ν., καθώς και η χρήση της για επιστημονικούς, εκπαιδευτικούς, πολιτιστικούς σκοπούς και παράλληλα να επιτρέψει και την εμπορική εκμετάλλευση των αποτελεσμάτων της έρευνας και καινοτομίας στην Ευρωπαϊκή Ένωση (προκειμένου να μετριασθεί/ανασχεθεί η πρωτοκαθεδρία των ΗΠΑ και της Κίνας στον τομέα της Τ.Ν.).
Είναι επίσης αλήθεια ότι η δυνατότητα άσκησης του “opt - out” προβλέφθηκε από την Οδηγία 2019/790 υπό άλλες συνθήκες (όταν δεν είχε αναπτυχθεί στον βαθμό που γνωρίζουμε σήμερα η Τ.Ν.) και για άλλους σκοπούς, δηλ. για την εξόρυξη δεδομένων και κειμένων για σκοπούς ανάλυσης και η χρησιμοποίηση των αναλυόμενων πληροφοριών, γυμνών και μη εχόντων μορφή πνευματικού έργου, προκειμένου να ευνοηθεί η έρευνα και καινοτομία στις επιχειρήσεις[31].
Τέλος, είναι έκδηλη η ανησυχία ότι η άσκηση του opt_out από Ευρωπαίους δικαιούχους, δηλ. η παρακράτηση του δικαιώματος εξαγωγής και αναπαραγωγής από αυτούς, αφαιρεί από τα γενετικά μοντέλα τεχνητής νοημοσύνης τη δυνατότητα να εκπαιδευθούν με ποιοτική δημιουργική ύλη, ευεργετική για την πολυφωνία, τον πλουραλισμό και τον ευρωπαϊκό πολιτισμό, οδηγώντας έτσι στην ‘κακή’ εκπαίδευσή τους, ή αν μη τι άλλο, στην ελλιπή ή μονομερή, χωρίς ευρωπαϊκό πνευματικό περιεχόμενο, εκπαίδευσή τους.
Η προσπάθεια αντιμετώπισης του φαινομένου της ευρύτατης χρήσης ως εκπαιδευτικού υλικού των έργων και συμβολών των δικαιούχων εν τη πλήρει αγνοία τους με την θέσπιση της δήλωσης παρακράτησης δικαιωμάτων/αυτοεξαίρεσης/opt_out, οδηγεί σε ισχνότατη, αν όχι ανύπαρκτη, προστασία της πνευματικής ύλης έναντι του φαινομένου της παραγωγικής Τ.Ν. Αναφέρθηκαν ανωτέρω τα νομικά ζητήματα, το βάρος που μεταθέτει στους δικαιούχους, το κόστος δημιουργίας και διατήρησης Μητρώου, η ελλιπής προστασία που προσφέρεται, καθώς σημαντική μερίδα δικαιούχων δεν μπορεί καν να ασκήσει την επιφύλαξη των δικαιωμάτων της, αλλά και η τεχνική ευκολία με την οποία δύναται να παρακαμφθεί[32].
Το νομικό και ουσιαστικό αδιέξοδο αλλά και την αναντιστοιχία μεταξύ της νυν τεχνολογικής πραγματικότητας και των σκοπών που θέλησε ο ενωσιακός νομοθέτης να καλύψει με την εξαίρεση για την εξόρυξη κειμένων και δεδομένων διαπιστώνει πλέον και το Ευρωπαϊκό Κοινοβούλιο, σε συνέχεια της έρευνας της Επιτροπής Νομικών Υποθέσεων του Ευρωπαϊκού Κοινοβουλίου[33].
Είναι αυτός ο λόγος που αποτελεί πλέον πεποίθηση του ενωσιακού νομοθέτη ότι πρέπει να υπάρξει αλλαγή/επικαιροποίηση του νομοθετικού πλαισίου[34].
ΙΙΙ. Ανάγκη νομοθετικών παρεμβάσεων – Εξασφάλιση αμοιβής δικαιούχων
Οι ενωσιακές ρυθμίσεις και ο τρόπος που αυτές ερμηνεύονται από θεωρητικούς και εφαρμόζονται από τα δικαστήρια των κρατών μελών δεν έχουν προσφέρει ικανό βαθμό ασφάλειας δικαίου, τόσο για τους δικαιούχους όσο και για τους παρόχους γενετικών μοντέλων Τ.Ν. Η ανασφάλεια δικαίου και η έλλειψη επαρκούς προστασίας έχει αναγνωρισθεί σε ευρωπαϊκό επίπεδο, και ιδίως στο πλαίσιο των εργασιών της Επιτροπής Νομικών Υποθέσεων (JURI) του Ευρωπαϊκού Κοινοβουλίου, όπου κρίνεται αναγκαία η ενίσχυση και εγκαθίδρυση ασφαλούς νομοθετικού πλαισίου[35].
Σε διεθνές και ευρωπαϊκό πεδίο πληθαίνουν οι φωνές που υποστηρίζουν ότι η εκπαίδευση μοντέλων τεχνητής νοημοσύνης δεν συνιστά απλή εξόρυξη, αλλά διαδικασία ποιοτικά διαφορετική, η οποία σαφώς θίγει το δικαίωμα αναπαραγωγής στην φάση της εισαγωγής δεδομένων, ενώ είναι σαφές ότι θίγει τόσο το δικαίωμα αναπαραγωγής, όσο και το δικαίωμα διάθεσης/παρουσίασης στο κοινό, όταν η μηχανή εξάγει/παράγει υλικό, σε αμφότερα δε τα στάδια θίγεται και το ηθικό δικαίωμα των δικαιούχων (βλ. και πιο πάνω)[36].
Η εκκρεμής ενώπιον του Δικαστηρίου της Ευρωπαϊκής Ένωσης υπόθεση C-250/Like Company v. Google Ireland Limited, η οποία αφορά τη χρήση προστατευόμενου πνευματικού περιεχομένου εκδόσεων τύπου μέσω απαντήσεων διαλογικού συστήματος τεχνητής νοημοσύνης (chatbot) βασισμένου σε μεγάλο γλωσσικό μοντέλο (L.L.M), ενδέχεται να παράσχει κρίσιμες διευκρινίσεις, τόσο ως προς το εάν η σχετική χρήση εμπίπτει στην εξαίρεση του άρθρου 4 της Οδηγίας 2019/790, όσο και ως προς το αν η παραγωγή των απαντήσεων συνιστά πράξη παρουσίασης στο κοινό.
Όμως, όποια και αν είναι η απόκριση της απόφασης του ΔΕΕ στα ως άνω νομικά θέματα (η οποία δεν αναμένεται πριν το 2027), έχει καταστεί ολοένα και περισσότερο κατανοητό, δεδομένης και της διαπίστωσης ότι το opt_out /η παρακράτηση δηλ. του δικαιώματος αναπαραγωγής/εξαγωγής για εξόρυξη από τους δικαιούχους δεν λειτουργεί αποτελεσματικά στην πράξη, ότι καθίσταται αναγκαία η παροχή άμεσης λύσης μέσω νομοθετικής ρύθμισης υπό του ενωσιακού νομοθέτη, ώστε να παρασχεθούν οι δέουσες και πρακτικά εφαρμόσιμες εγγυήσεις για την επέλευση ισορροπίας μεταξύ προστασίας της Πνευματικής Ιδιοκτησίας και συγγενικών δικαιωμάτων και ενθάρρυνσης της ανάπτυξης της Τ.Ν.
Ως καταλληλότερη λύση των αντικρουομένων συμφερόντων προτείνεται η προηγούμενη αδειοδότηση με πρόβλεψη δέουσας αμοιβής των δικαιούχων για την τροφοδοσία των εκπαιδευόμενων γενετικών μοντέλων Τ.Ν. με το προστατευόμενο περιεχόμενό τους. Η αμοιβή αυτή θα πρέπει να καλύπτει τόσο τη χρήση προστατευόμενου περιεχομένου κατά το στάδιο της εκπαίδευσης των μοντέλων τεχνητής νοημοσύνης, όσο και το παραγόμενο αποτέλεσμα.
Τη λύση αυτή προκρίνει το Ευρωπαϊκό Κοινοβούλιο με το από 10.03.2026 Ψήφισμά του (κατόπιν της γνωστής έκθεσης της Επιτροπής Νομικών Θεμάτων του Ευρωπ. Κοινοβουλίου για την πνευματική ιδιοκτησία και τη γενετική τεχνητή νοημοσύνη, με εισηγητή τον Axel Voss)[37]. Το ψήφισμα κάνει ειδική αναφορά στην ανάγκη να υπάρξει ένα πρόσθετο νομικό πλαίσιο που θα αποσαφηνίζει τους κανόνες αδειοδότησης για τους σκοπούς της παραγωγικής Τ.Ν., διασφαλίζοντας τη δίκαιη αμοιβή των δικαιούχων προστατευόμενου περιεχομένου.
Έτσι, καταρχάς προβλέπει ότι θα πρέπει, όσοι επιθυμούν, να μπορούν να εξαιρεθούν από την εκπαίδευση στην τεχνητή νοημοσύνη και την αυτοματοποιημένη ανίχνευση δεδομένων και εφόσον δεν έχουν εξαιρεθεί και το περιεχόμενό τους χρησιμοποιείται για εκπαίδευση, να αμείβονται δεόντως, δίκαια και αναλογικά κατόπιν αδειοδοτήσεως.
Στην συνέχεια καλεί την Επιτροπή να διευκολύνει τη θέσπιση συλλογικών συμβάσεων αδειοδότησης ανά τομέα δικαιούχων, προσβάσιμες σε όλους, συμπεριλαμβανομένων των μεμονωμένων δημιουργών και των μικρομεσαίων επιχειρήσεων και να διερευνηθούν αποτελεσματικά εργαλεία που θα επιτρέπουν στους δικαιούχους να αποτρέπουν τη χρήση του έργου τους από συστήματα ΤΝ γενικής χρήσης. Παράλληλα καλεί την Επιτροπή να προτείνει υποχρεώσεις διαφάνειας και τεκμηρίωσης πηγής σχετικά με τη χρήση έργων που προστατεύονται από δικαιώματα πνευματικής ιδιοκτησίας ή άλλων προστατευόμενων αντικειμένων σε παρόχους και φορείς εφαρμογής μοντέλων και συστημάτων ΤΝ γενικού σκοπού, που τίθενται σε κυκλοφορία στην αγορά της ΕΕ. Τονίζει ότι εάν τα μοντέλα και συστήματα παραγωγικής Τ.Ν. δεν τηρούν τα δικαιώματα πνευματικής ιδιοκτησίας, πρέπει να απαγορεύεται να τεθούν σε κυκλοφορία ή να διατεθούν στην αγορά της ΕΕ, ανεξαρτήτως πού πραγματοποιήθηκε η εκπαίδευσή τους.
Στην πράξη, τον δρόμο της λήψης άδειας χρήσης προστατευόμενου πνευματικού και καλλιτεχνικού περιεχομένου για την εκπαίδευση συστημάτων τεχνητής νοημοσύνης έχουν ήδη ακολουθήσει εταιρείες ανάπτυξης Τ.Ν. σε συνεργασία με εκδότες και παραγωγούς. Ενδεικτικά, έχουν συναφθεί συμφωνίες στον τομέα του ειδησεογραφικού περιεχομένου μεταξύ εκδοτικών οργανισμών όπως οι Axel Springer, Financial Times, Le Monde με την OpenAI, καθώς και στον μουσικό τομέα, με αδειοδοτημένα μοντέλα και πλατφόρμες ανάπτυξης Τ.Ν, ενώ στο ευρωπαϊκό πεδίο είναι γνωστή η συμφωνία μεταξύ της WARNER Μusic και του Ιδρύματος της Edith Piaf για τη δημιουργία οπτικοακουστικού έργου με χρήση ψηφιακής ρέπλικας της καλλιτέχνιδας.
ΙV. Επίλογος - Ανάγκη για άμεσες διορθωτικές παρεμβάσεις
Μέχρι την αναγκαία νομοθετική αναθεώρηση που και το άνω Ψήφισμα του Ευρωπαϊκού Κοινοβουλίου ζητεί, οι δικαιούχοι ενθαρρύνονται να ασκούν την επιφύλαξη των δικαιωμάτων τους, δηλ. την παρακράτηση του δικαιώματος εξόρυξης κειμένων και δεδομένων. Αυτό μπορεί να ασκηθεί αποτελεσματικά, μόνον μέσω συλλογικής και όχι ατομικής δήλωσης επιφύλαξης, μέσω των οργανισμών συλλογικής διαχείρισης και κατ’ επέκταση, με ερμηνευτική διόρθωση του ‘κατάλληλου τρόπου’ ώστε να μπορούν να το ασκούν με απλή δήλωση και όχι με μηχαναγνώσιμα μέσα, ακόμη και αν πρόκειται για περιεχόμενο επιγραμμικά διατιθέμενο. Παράλληλα, δεδομένου ότι είναι διαπιστωμένη η ανεπαρκέστατη διαφάνεια εκ μέρους των κατασκευαστών/παρόχων τεχνητής νοημοσύνης σχετικά με το περιεχόμενο που έχουν χρησιμοποιήσει ως εκπαιδευτικό υλικό των γενετικών μοντέλων τους[38], κρίνεται απαραίτητη η θέσπιση μαχητού τεκμηρίου ότι τα έργα/συμβολές των δικαιούχων έχουν χρησιμοποιηθεί για σκοπούς εκπαίδευσης. Μόνον εάν μία εταιρεία ανάπτυξης μοντέλων παραγωγικής Τ.Ν. αποδείξει ότι δεν έχει ενταχθεί προστατευόμενο περιεχόμενο ως εκπαιδευτικό υλικό, οι δικαιούχοι δεν θα καλούνται να δράσουν προς άσκηση και προστασία των εννόμων δικαιωμάτων τους.
Το μέγεθος του φαινομένου και οι συνέπειές του στην δημιουργία και στον πολιτισμό δεν αφήνουν περιθώρια για περαιτέρω ενδοσκοπικές αναλύσεις, αλλά απαιτούν άμεση και τολμηρή δράση του ενωσιακού και των εθνικών νομοθετών.
[1] ΟpenAI, LP, Comment regarding request for comments on Intellectual Property Protection for Artificial Intelligence Innovation (Dec. 16, 2019, https:// www.uspto.gov/sites/default/files/documents/OpenAI_RFC-84-FR-58141.pdf.
[2] Για το θέμα βλ. Δ. Καλλινίκου, Πνευματική Ιδιοκτησία και συγγενικά δικαιώματα, 5η εκδ., σ. 381-384, Δ. Καλλινίκου, Πνευματικά έργα, αρχεία και τεχνητή νοημοσύνη, ΧρΙδΔ, σ. 641, Θ. Χίου, Πνευματική Ιδιοκτησία και Παραγωγική Τεχνητή Νοημοσύνη, 2025.
[3] Άρθρ. 2 § 2 Οδηγίας 2019/790: «εξόρυξη κειμένων και δεδομένων»: κάθε αυτοματοποιημένη αναλυτική τεχνική που αποσκοπεί στην ανάλυση κειμένων και δεδομένων σε ψηφιακή μορφή με στόχο την παραγωγή πληροφοριών, συμπεριλαμβανομένων, ενδεικτικά, προτύπων, τάσεων και συσχετισμών·
[4] Άρθρο 3. Εξόρυξη κειμένων και δεδομένων για σκοπούς επιστημονικής έρευνας. 1. Τα κράτη μέλη προσβλέπουν εξαίρεση στα δικαιώματα που προβλέπονται στο άρθρ. 5 στοιχείο α) και στο άρθρο 7 § 1 της Οδηγίας 96/9/ΕΚ, στο άρθρο 2 της Οδηγίας 2001/29/ΕΚ, και στο άρθρο 15 § 1 της παρούσας Οδηγίας σχετικά με τις αναπαραγωγές και τις εξαγωγές που πραγματοποιούνται από ερευνητικούς οργανισμούς και ιδρύματα πολιτιστικής κληρονομιάς, με σκοπό τη διεξαγωγή, για τους σκοπούς της επιστημονικής έρευνας, της εξόρυξης κειμένων και δεδομένων από έργα ή άλλα αντικείμενα προστασίας υλικό στα οποία έχουν νόμιμη πρόσβαση. 2. Αντίγραφα έργων ή άλλων αντικειμένων προστασίας που δημιουργούνται σύμφωνα με την § 1 αποθηκεύονται με κατάλληλο επίπεδο ασφάλειας και μπορούν να φυλάσσονται για σκοπούς επιστημονικής έρευνας, συμπεριλαμβανομένης της επαλήθευσης των αποτελεσμάτων της έρευνας. 3. Οι δικαιούχοι επιτρέπεται να εφαρμόζουν μέτρα με σκοπό την εξασφάλιση της ασφάλειας και της ακεραιότητας των δικτύων και των βάσεων δεδομένων όπου φιλοξενούνται τα έργα ή άλλα αντικείμενα προστασίας. Τα εν λόγω μέτρα δεν υπερβαίνουν το μέτρο που είναι αναγκαίο για την επίτευξη του στόχου αυτού.
[5] Άρθρο 4 Οδηγίας 2019/790: Εξαίρεση ή περιορισμός όσον αφορά την εξόρυξη κειμένων και δεδομένων 1. Τα κράτη μέλη προβλέπουν εξαίρεση ή περιορισμό στα δικαιώματα που προβλέπονται στο άρθρο 5 στοιχείο α) και στο άρθρο 7 § 1 της Οδηγίας 96/9/ΕΚ, στο άρθρο 2 της Οδηγίας 2001/29/ΕΚ, στο άρθρο 4 § 1 στοιχεία α) και β) της Οδηγίας 2009/24/ΕΚ και στο άρθρο 15 § 1 της παρούσας Οδηγίας για αναπαραγωγές και εξαγωγές νομίμως προσβάσιμων έργων και άλλου υλικού για τους σκοπούς της εξόρυξης κειμένων και δεδομένων. 2. Αναπαραγωγές και εξαγωγές που πραγματοποιούνται σύμφωνα με την § 1 μπορεί να διατηρούνται για όσο διάστημα είναι αναγκαίο για τους σκοπούς της εξόρυξης κειμένων και δεδομένων. 3. Η εξαίρεση ή ο περιορισμός που προβλέπεται στην § 1 εφαρμόζεται υπό την προϋπόθεση ότι η χρήση έργων και άλλων αντικειμένων προστασίας που αναφέρεται σε αυτήν την παράγραφο δεν έχει ρητά περιοριστεί από τους δικαιούχους των δικαιωμάτων τους με κατάλληλο τρόπο, όπως με μηχαναγνώσιμα μέσα για την περίπτωση περιεχομένου που έχει καταστεί διαθέσιμο στο κοινό επιγραμμικά. 4. Το παρόν άρθρο δεν θίγει την εφαρμογή του άρθρου 3 της παρούσας Οδηγίας.
[6] (Άρθρ. 2 § 2): «εξόρυξη κειμένων και δεδομένων»: κάθε αυτοματοποιημένη αναλυτική τεχνική που αποσκοπεί στην ανάλυση κειμένων και δεδομένων σε ψηφιακή μορφή με στόχο την παραγωγή πληροφοριών, συμπεριλαμβανομένων, ενδεικτικά, προτύπων, τάσεων και συσχετισμών.
[7] Μ.-Θ. Μαρίνο, Η εξόρυξη κειμένων και δεδομένων στην νέα Οδηγία 2019/790 μεταξύ δικαίου Πνευμ. Ιδ. μεγάλων δεδομένων και τεχνητής νοημοσύνης, ΕΕΜπΔ 2020. 787 επ., ιδίως: “ Η διαδικασία της εξόρυξης περιλαμβάνει ταυτοποίηση δεδομένων, ψηφιακή αντιγραφή ικανών ποσοτήτων του υλικού το οποίο μετατρέπεται σε ικανό να αναγνωσθεί από μηχανή, εξαγωγή των κειμένων δεδομένων όπου μετά από ‘διύλιση’ με βάση τις ερευνώμενες ιδιότητες παράγεται το λεγόμενο corpus. Toύτο είναι η βάση για να γίνει επεξεργασία του … ώστε να ταυτοποιηθούν βασικά κοινά στοιχεία, χαρακτηριστικά, τάσεις, δομές, συνθέσεις ή συσχετίσεις μέσα στο τελικό “προϊόν”, έτσι ώστε να περιγράφεται ή να προβλέπεται μία υπάρχουσα τάση κ.λπ.”, σ. 791-792, “..σκοπός της εξόρυξης δεν είναι η αναπαραγωγή της προστατευόμενης έκφρασης ενός έργου, αλλά εξαγωγή /διύλιση πληροφοριών που εμπεριέχονται στα έργα ή στην παροχή που προστατεύει από συγγενικά ή sui generis δικαιώματα” σ. 799· M. Carroll, Copyright and the Progress of Science: Why Text and Data Mining Is Lawful, 53 UC Davis Law Review 893 (2019), σ. 954· Lucchi, N., Generative AI and Copyright – Training, Creation, Regulation (Study, 9 July 2025), European Parliament, Policy Department for Justice, Civil Liberties and Institutional Affairs, Directorate-General for Internal Policies of the Union, διαθέσιμο στο: https:// www.europarl.europa.eu/thinktank/en/document/ IUST_STU(2025)774095· Christophe Geiger et al., Text and Data Mining in the Proposed Copyright Reform: Making the EU Ready for an Age of Big Data?, 49 IIC 814, 818–820 (2018)· Matthew Sag and Peter K. Yu, The Globalization of Copyright Exceptions for AI Training, 74 Emory Law Journal, (2025).
[8] Αιτ. σκ. 8: “Οι νέες τεχνολογίες παρέχουν τη δυνατότητα αυτοματοποιημένης υπολογιστικής ανάλυσης πληροφοριών σε ψηφιακή μορφή, όπως κειμένων, ήχων εικόνων, ή δεδομένων, η οποία είναι ευρέως γνωστή ως εξόρυξη κειμένων και δεδομένων. Η εξόρυξη κειμένων και δεδομένων καθιστά δυνατή την επεξεργασία μεγάλου όγκου πληροφοριών με στόχο την απόκτηση νέων γνώσεων και την ανακάλυψη νέων τάσεων. … Σε ορισμένες περιπτώσεις η εξόρυξη κειμένων και δεδομένων ενδέχεται να περιλαμβάνει πράξεις που προστατεύονται από δικαιώματα πνευμ. ιδιοκτησίας, από το δικαίωμα ειδικής φύσεως σε βάσεις δεδομένων ή αμφότερα, ειδικότερα την αναπαραγωγή έργων ή άλλων αντικειμένων προστασίας, την εξαγωγή περιεχομένου από βάση δεδομένων ή αμφότερες, κάτι που συμβαίνει για παράδειγμα όταν τα δεδομένα τυποποιούνται κατά τη διαδικασία της εξόρυξης κειμένου και δεδομένων. Στις περιπτώσεις όπου δεν εφαρμόζεται εξαίρεση ή περιορισμός, απαιτείται η άδεια των δικαιούχων για την εκτέλεση των εν λόγω πράξεων.
Αιτ. σκ. 9: Η εξόρυξη κειμένων και δεδομένων μπορεί επίσης να διενεργηθεί σε σχέση με απλά πραγματικά στοιχεία ή δεδομένα τα οποία δεν προστατεύονται από δικαιώματα πνευματικής ιδιοκτησίας και στις περιπτώσεις αυτές δεν απαιτείται η λήψη άδειας βάσει του δικαίου περί πνευματικής ιδιοκτησίας. Μπορεί επίσης να υπάρχουν περιπτώσεις εξόρυξης κειμένου και δεδομένων που δεν περιλαμβάνουν πράξεις αναπαραγωγής ή όπου οι αναπαραγωγές που έλαβαν χώρα εμπίπτουν στην υποχρεωτική εξαίρεση των προσωρινών πράξεων αναπαραγωγής, όπως ορίζεται στο άρθρ. 5 § 1 της Οδηγία 2001/29,η οποία θα πρέπει να συνεχίσει να εφαρμόζεται στις τεχνικές εξόρυξης κειμένων και δεδομένων που δεν περιλαμβάνουν τη δημιουργία αντιγράφων πέραν του πεδίου εφαρμογής της εν λόγω εξαίρεσης.
[9] Αιτ. σκ. 18: “Επιπλέον, πέρα από τη σημασία τους στο πλαίσιο της επιστημονικής έρευνας, οι τεχνικές εξόρυξης κειμένων και δεδομένων χρησιμοποιούνται ευρέως τόσο από ιδιωτικούς όσο και από δημόσιους φορείς για την ανάλυση μεγάλων όγκων δεδομένων σε διάφορους τομείς της ζωής και για διάφορους σκοπούς, συμπεριλαμβανομένων των κρατικών υπηρεσιών, των σύνθετων επιχειρηματικών αποφάσεων και της ανάπτυξης νέων εφαρμογών και τεχνολογιών. Οι δικαιούχοι θα πρέπει να διατηρούν την δυνατότητα να χορηγούν άδεια για τη χρήση των έργων τους και άλλων αντικειμένων προστασίας που δεν εμπίπτουν στο πεδίο εφαρμογής της υποχρεωτικής εξαίρεσης που προβλέπεται στην παρούσα Οδηγία για την εξόρυξη κειμένων και δεδομένων για τους σκοπούς της επιστημονικής έρευνας και των υφιστάμενων εξαιρέσεων και περιορισμών, που προβλέπεται στην Οδηγία 2001/29. Ταυτόχρονα, θα πρέπει να λαμβάνει υπόψη το γεγονός ότι οι χρήστες εξόρυξης κειμένων και δεδομένων μπορεί να έρθουν αντιμέτωποι με ανασφάλεια δικαίου ως προς το αν οι αναπαραγωγές και οι εξαγωγές που πραγματοποιούνται για σκοπούς εξόρυξης κειμένων και δεδομένων μπορούν να διενεργηθούν επί έργων στα οποία η πρόσβαση είναι νόμιμη ή άλλων αντικειμένων προστασίας, ιδίως όταν οι αναπαραγωγές ή οι εξαγωγές που πραγματοποιούνται για σκοπούς τεχνικής διεργασίας δεν πληρούν όλες τις προϋποθέσεις της υφιστάμενης εξαίρεσης για τις προσωρινές πράξεις αναπαραγωγής, που προβλέπεται στο άρθρ. 5 § 1 της Οδηγίας 2001/29. Προκειμένου να υπάρξει μεγαλύτερη ασφάλεια δικαίου σε τέτοιες περιπτώσεις και να ενθαρρυνθεί η καινοτομία και στον ιδιωτικό τομέα, η παρούσα Οδηγία θα πρέπει να προβλέπει, υπό ορισμένες προϋποθέσεις, την εξαίρεση ή τον περιορισμό των αναπαραγωγών και των εξαγωγών έργων ή άλλων αντικειμένων προστασίας, για τους σκοπούς της εξόρυξης κειμένων και δεδομένων και να επιτρέπει τη διατήρηση των αντιγράφων για όσο διάστημα είναι αναγκαίο για τους σκοπούς αυτούς της εξόρυξης κειμένων και δεδομένων. Η εξαίρεση αυτή ή ο περιορισμός θα πρέπει να εφαρμόζεται μόνον όταν ο δικαιούχος έχει νόμιμη πρόσβαση στο έργο ή σε άλλο αντικείμενο προστασίας, συμπεριλαμβανομένης της περίπτωσης κατά την οποία αυτό καθίσταται διαθέσιμο στο κοινό μέσω διαδικτύου και εφόσον οι δικαιούχοι δεν έχουν παρακρατήσει τα δικαιώματα αναπαραγωγής και εξαγωγής για την εξόρυξη κειμένων και δεδομένων με τον ενδεδειγμένο τρόπο. Στην περίπτωση περιεχομένου που έχει καταστεί διαθέσιμο στο κοινό μέσω του διαδικτύου, θα πρέπει να θεωρείται κατάλληλη μόνο η διατήρηση των εν λόγω δικαιωμάτων με τη χρήση μηχαναγνώσιμων μέσων, συμπεριλαμβανομένων των μεταδεδομένων και των όρων και προϋποθέσεων ενός ιστότοπου ή μιας υπηρεσίας. Άλλες χρήσεις δεν θα πρέπει να θίγονται από τη διατήρηση των δικαιωμάτων για σκοπούς εξόρυξης κειμένων και δεδομένων. Σε άλλες περιπτώσεις, μπορεί να θεωρηθεί ως ενδεδειγμένη η διατήρηση των δικαιωμάτων με άλλα μέσα, όπως οι συμβατικές συμφωνίες ή η μονομερής δήλωση. Οι δικαιούχοι θα πρέπει να είναι σε θέση να εφαρμόζουν μέτρα, ώστε να εξασφαλίζουν ότι η διατήρηση των δικαιωμάτων τους εν προκειμένω γίνεται σεβαστή. Αυτή η εξαίρεση ή ο περιορισμός δεν θα πρέπει να θίγει την υποχρεωτική εξαίρεση για την εξόρυξη κειμένων και δεδομένων για ερευνητικούς σκοπούς, όπως ορίζεται στην παρούσα Οδηγία, καθώς και την υφιστάμενη εξαίρεση για τις προσωρινές πράξεις αναπαραγωγής, όπως ορίζεται στο άρθρ. 5 § 1 της Οδηγίας 2001/ 29”.
[10] Βλ. Μ.-Θ. Μαρίνο, ό.π., M. Carroll, ό.π.
[11] Βλ. ενδεικτικά Benjamin L. W. Sobel, Artificial Intelligence’s Fair Use Crisis, 41 Colum. J.L. & Arts 45 (2017)· Weijie Huang & Xi Chen, Does Generative AI Copy? Rethinking the Right to Copy Under Copyright Law, 56 Computer L. & Sec. Rev. 106100 (2025) · Τ. Dornis, The Training of Generative AI Is Not Text and Data Mining (19 October 2024), European Intellectual Property Review (E.I.P.R.),τεύχος 2/2025, διαθέσιμο στο SSRN: https:// ssrn.com/abstract=4993782 ή http://dx.doi.org/10.2139/ ssrn.4993782.
[12] Βλ. Antonia Karamolegkou et al., Copyright violations and Large Language Models (2023), arXiv: 2310.13771v1 (με απτά παραδείγματα για αυτολεξεί απομνημονευμένες ενότητες από διάσημα λογοτεχνικά έργα, τις οποίες αναλόγως της εντολής (prompt) το μεγάλο γλωσσικό μοντέλο στην εφαρμογή του μπορεί να εξάγει είτε αυτούσιες, είτε ελαφρώς παραλλαγμένες, π.χ. στην εντολή “θύμισέ μου πώς ξεκινά το μυθιστόρημα “Όσα παίρνει ο Άνεμος”). Επίσης Ν. Carlini, et al Extracting training data from diffusion models 32nd USENIX Security Symposium 52535270 (2023) Vitaly Feldman Does learning require memorization?.. 52nd annual ACM SIGACT Symposium on Theory of Computing, σ.954-959 (2020), Jing Huang, Diyi YangκαιChristopher Potts, Demystifying Verbatim Memorization in Large Language Models, Stanford AI Lab Blog (28 Απριλίου 2025), T. Dornis and Stebastian Stober, Urheberrect und Training generativer KIModelle, Nomos, 2024, Nicholas Carlini et al., Extracting Training Data from Large Language Models, in Proceedings of the 30th USENIX Security Symposium (2021), διαθέσιμο στο: https://www.usenix.org/conference/ usenixsecurity21/presentation/carlini-extracting, όπουαποδεικνύεται ότι είναι δυνατή η εξαγωγή αυτούσιων ακολουθιών από τα δεδομένα εκπαίδευσης μέσω κατάλληλων ερωτημάτων προς το μοντέλο. Αυτό αποδείχθηκε και στην υποθ. στις ΗΠΑ The New York Times Company κατά Microsoft Corp., όπου στο αποδεικτικό στοιχείο (exhibit) J η ενάγουσα παραθέτει περιπτώσεις σχεδόν αυτολεξεί αναπαραγωγής άρθρων μέσω LLM, υποστηρίζοντας ότι τα μοντέλα έχουν «απομνημονεύσει» προστατευόμενο περιεχόμενο, https://storage. courtlistener.com/recap/gov.uscourts.nysd.612697/gov.uscourts.nysd.612697.1.68_1.pdf , καθώς και στην υποθ. στην Γερμανία GEMA κατά OpenAI, ΠρΜοναχου 42 O 14139/2024, όπου το δικαστήριο δέχθηκε ότι στίχοι τραγουδιών απομνημονεύθηκαν και αναπαράχθηκαν αυτούσιοι στο αποτέλεσμα εξόδου του μοντέλου παραγωγικής Τ.Ν., βλ. ΑνθήΑκριτίδου, παρατ. στην αποφ. υποθ. 42 Ο 14139/24, ΔιΜΕΕ 2025. 672.
[13] Dornis, Tim W., The Training of Generative AI Is Not Text and Data Mining (19 Οκτωβρίου 2024). European Intellectual Property Review (E.I.P.R.), σ. 6, Διαθέσιμο σε SSRN: https://ssrn.com/abstract=4993 782 ή http://dx.doi.org/10.2139/ssrn.4993782
[14] Dornis, Tim W., ό.π.
[15] Άρθρ. 5 § 1 Οδηγίας 2001/29: “Οι αναφερόμενες στο άρθρο 2 προσωρινές πράξεις αναπαραγωγής, οι οποίες είναι μεταβατικές ή παρεπόμενες και οι οποίες αποτελούν αναπόσπαστο και ουσιώδες τμήμα μιας τεχνολογικής μεθόδου, έχουν δε ως αποκλειστικό σκοπό να επιτρέψουν: α) την εντός δικτύου μετάδοση μεταξύ τρίτων μέσω διαμεσολαβητή, ή β) τη νόμιμη χρήση ενός έργου ή άλλου προστατευομένου αντικειμένου και οι οποίες δεν έχουν καμία ανεξάρτητη οικονομική σημασία, εξαιρούνται από το δικαίωμα αναπαραγωγής που προβλέπεται στο άρθρο 2”.
[16] Βλ. Ανθ. Παπαδοπούλου, Ο περιορισμός του δικαιώματος πνευματικής ιδιοκτησίας προς όφελος της εκπαίδευσης στο ελληνικό και ενωσιακό δίκαιο, 2021 σ. 54 επ.· Μαρίνος Η a priori συσταλτική ερμηνεία 2014 σ. 11· ΔΕΕ C-5/2008 Infopaq, C-403/2008 & C-429/2008 Football Association Premier League· C-145/2-10 Eva-Maria Painer ·C-201/2013 Deckmyn.
[17] Ανθ. Παπαδοπούλου, ό.π. σ. 55.
[18] Μ. Κανελλοπούλου-Μπότη σε Δίκαιο Πνευμ. Ιδιοκτ., Ερμ. ν. 4961/2022 και 4996/2022 επιμ. Κ. Χριστοδούλου, Π. Τσίρη, Μ.-Δ. Παπαδοπούλου, Εισαγ. παρατ. σε άρθρ. 21Α, 21Β, σ. 316.
[19] Lucchi, N., Generative AI and Copyright – Training, Creation, Regulation (9 Ιουλίου 2025), European Parliament, Policy Department for Justice, Civil Liberties and Institutional Affairs, Directorate-General for Internal Policies of the Union, διαθέσιμο στο: https://www.europarl.europa.eu/thinktank/en/document/IUST_STU(2025)774095· Lucchi, Nicola – Dornis, Tim W. – Sierek, Pascal T., “The Three-Step Test in International Copyright – A Global Framework for Generative AI Training” (5 March 2026), American Business Law Journal (υπό δημοσίευση 2026), Max Planck Private Law Research Paper αριθ. 26/7, διαθέσιμο στο SSRN: https://ssrn.com/abstract=6447160 ή http://dx.doi.org/ 10.2139/ssrn.6447160.
[20] Alex Reisner, «The Unbelievable Scale of AI’s Pirated-Books Problem», The Atlantic (Technology), 2025, https://www.theatlantic.com/technology/archive/ 2025/03/libgen-meta-openai/682093/
[21] Corral G., Perplexity is using stealth, undeclared crawlers to evade website no-crawl directives, The Cloudflare Blog, 04.08.2025 https://blog.cloudflare. com/perplexity-is-using-stealth-undeclared-crawlers-to -evade-website-no-crawl-directives/
[22] Βλ. Φερ. Παναγοπούλου, Ο Ευρωπαϊκός Κανονισμός για την Τεχνητή Νοημοσύνη (ΕΕ/2024/1689, Artificial Intelligence Act, ΑI Act) Ο Ευρωπαϊκός Κανονισμός για την Τ.Ν. σ. 235.
[23] Άρθρ. 3 § 63 Καν Τ.Ν.: “Μοντέλο Τ.Ν. γενικού σκοπού” μεταξύ άλλων, όταν ένα τέτοιο μοντέλο Τ.Ν. έχει εκπαιδευτεί με μεγάλο όγκο δεδομένων χρησιμοποιώντας αυτοεποπτεία σε κλίμακα, το οποίο παρουσιάζει σημαντική γενικότητα και είναι ικανό να εκτελεί αποτελεσματικά ευρύ φάσμα διακριτών καθηκόντων, ανεξάρτητα από τον τρόπο με τον οποίο το μοντέλο διατίθεται στην αγορά και μπορεί να ενσωματωθεί σε διάφορα κατάντη συστήματα ή εφαρμογές· αυτό δεν καλύπτει μοντέλα ΤΝ που χρησιμοποιούνται πριν από τη διάθεσή τους στην αγορά για δραστηριότητες έρευνας, ανάπτυξης και κατασκευής πρωτοτύπων· άρθρ. 3 § 65 Καν. Τ.Ν: “σύστημα ΤΝ γενικού σκοπού”: σύστημα Τ.Ν. που βασίζεται σε μοντέλο Τ.Ν. γενικού σκοπού και το οποίο έχει την ικανότητα να εξυπηρετεί διάφορους σκοπούς, τόσο για άμεση χρήση όσο και για ενσωμάτωση σε άλλα συστήματα ΤΝ. ·
[25] Gervais, Daniel & Shemtov, Noam & Marmanis, Haralambos & Rowland, Catherine. The Heart of the Matter: Copyright, AI Training, and LLMs., Copyright Journal 71(3) σ. 482 επ. / 10.2139/ ssrn.4963711.
[26] E. Rosati,“Infringing AI: Liability for AI-generated outputs under international, EU, and UK copyright law” (2025) 16(2) EJRR 603, 609.
[27] E. Rosati, ο.π. υποσ. 26· ειδικότερα για το δικαίωμα διάθεσης στο κοινό βλ. Τ. Dornis, Generative AI, reproductions inside the model, and the making available to the public (27 Νοεμβρίου 2024). International Review of Intellectual Property and Competition Law (IIC), forthcoming 6/2025,διαθέσιμο στο SSRN: https://ssrn.com/abstract=5036008 ή http://dx. doi.org/10.2139/ssrn.5036008, OECD, Intellectual Property Issues in Artificial Intelligence Trained on Scraped Data, cit. at 14.
[28] Βλ. Lucchi N. στην έρευνα της Επιτροπής Νομικών Υποθέσεων του Ε. Κοινοβουλίου JURI Report Generative AI and Copyright, PE 774.095 - Ιούλιος 2025: “Η τρέχουσα εξαίρεση για εξόρυξη κειμένου και δεδομένων (TDM) στην ΕΕ δεν σχεδιάστηκε για να καλύψει την εκφραστική και συνθετική φύση της εκπαίδευσης γενετικής τεχνητής νοημοσύνης και η εφαρμογή της σε τέτοια συστήματα κινδυνεύει να διαστρεβλώσει τον σκοπό και τα όρια των εξαιρέσεων πνευματικής ιδιοκτησίας της ΕΕ.”, βλ. και Ψήφισμα Ε.Κοινοβουλίου που ακολούθησε την 10.3.2026, Ρ10_ΤΑ (2026)0066 (2025/2058 (ΙΝΙ)).
[29] Τ. Dornis, The Training of Generative AI Is Not Text and Data Mining (19 Οκτωβρίου 2024)European Intellectual Property Review (E.I.P.R.), τεύχος 2/2025, διαθέσιμο στο SSRN: https://ssrn.com/abstract=4993782 ή http://dx.doi.org/10.2139/ssrn.4993782 “While the TDM exceptions under Articles 3 and 4 of the CDSM Directive have been interpreted as the primary legal tools enabling AI developers to access and analyse copyrighted material, it is increasingly clear that these provisions were not designed with the scale, purpose, or economic impact of generative AI systems in mind.” Dornis, Tim W., The Training of Generative AI Is Not Text and Data Mining (19 October 2024) “... it can be shown that the mystic and oft-conjured “will of the historic legislator” – i.e., the European parliament – to extend the TDM exception to anything and everything that is somewhat “AI related” is nothing more than wishful thinking.”· Lucchi, N., Generative AI and Copyright – Training, Creation, Regulation (Study, 9 July 2025), European Parliament, Policy Department for Justice, Civil Liberties and Institutional Affairs, Directorate-General for Internal Policies of the Union, διαθέσιμο στο: https://www.europarl.europa.eu/thinktank/en/ document/IUST_STU(2025)774095 σ. 54 και υποσημείωση 177.
[30] Βλ. πρόσκληση υποβολής προσφορών για την εκπόνηση μελέτης σκοπιμότητας σχετικά με κεντρικό μητρώο αυτοεξαίρεσης βάσης της εξαίρεσης εξόρυξης κειμένου και δεδομένων της Ευρωπαϊκής Επιτροπής https://digital-strategy.ec.europa.eu/el/funding/call-tenders-feasibility-study-central-registry-opt-outs-under-text-and-data-mining-tdm-exception
[31] Βλ. ό.π. υποσ. 29.
[32] Για την διαπίστωση ότι το opt out δεν λειτουργεί αποτελεσματικά βλ. Rendle, Archer, Sternburg, Sullivan, Α thousand times no: the practicalities of opt-out for AI training, Copyright Journal, 73, σ. 1023.
[33] Βλ. ό.π. υποσ. 28.
[34] JUST | Policy Department for Justice, Civil Liberties and Institutional Affairs, PE 774.095, Ιούλιος 2025: “Σε αυτό το πλαίσιο, είναι απαραίτητο να υιοθετηθεί ένα προοδευτικό και ευέλικτο πλαίσιο πολιτικής που να προβλέπει τις πιθανές συστημικές επιπτώσεις που θα μπορούσαν να προκύψουν σε ολόκληρο το οικοσύστημα της τεχνητής νοημοσύνης—ειδικά εάν οι περιοριστικές ερμηνείες αρχίσουν να ασκούν διασυνοριακή επιρροή. Αυτή η δυναμική υπογραμμίζει την επείγουσα ανάγκη για μια ολοκληρωμένη και συνεκτική επανεκτίμηση του δικαίου πνευματικής ιδιοκτησίας της ΕΕ, ώστε να διασφαλιστεί η νομική σαφήνεια και η ετοιμότητα για καινοτομία”.
[35] Βλ. ό.π. υποσ. 28.
[36] Ομοίως και Eleonora Rosati, The future of the movie industry in the wake of generative AI: A perspective under EU and UK copyright law, Computer Law & Security Review, τ. 59 (2025), άρθρο 106207, διαθέσιμο στο: https://doi.org/10.1016/j.clsr.2025.106207, όπου παραπέμπει United States Copyright Office, Copyright and Artificial Intelligence – Part 3: Generative AI Training (Pre-publication Version, Μάιος 2025), διαθέσιμο στο: https://www.copyright.gov/ai/Copyright-and-Artificial-Intelligence-Part-3-Generative-AI-Training-Report-Pre-Publication-Version.pdf, σ. 26–27.
[37] Ψήφισμα του Ευρωπαϊκού Κοινοβουλίου της 10ης Μαρτίου 2026 σχετικά με τα δικαιώματα πνευματικής ιδιοκτησίας και την παραγωγική τεχνητή νοημοσύνη — ευκαιρίες και προκλήσεις [2025/2058 (INI)].
[38] Rights Alliance, 2024 https://rettighedsalliancen. dk/wp-content/uploads/2024/09/Report-on-AI-model providers-training-data=transparen-cy-andenforcement-of-copy-tights.pdf.