Σύνταξη – επιμέλεια: Στέλιος Βασιλούδης

Χάρη στη μηχανική εκμάθηση και την τεχνητή νοημοσύνη (AI), η επιλογή γλωσσών για το «Squid Game» και για άλλες (παρόμοιες) ξένες σειρές θα μπορεί σύντομα να γίνει τόσο απλή όσο και η αλλαγή του καναλιού. Επιπρόσθετα – μέσω των καινοτόμων νέων τεχνολογιών – πολλά περισσότερα θα μεταμορφωθούν στην πορεία.

ΔΙΑΦΗΜΙΣΤΙΚΟΣ ΧΩΡΟΣ

Λίγες πολιτιστικές εμπειρίες είναι τόσο σουρεαλιστικές όσο το να ανακαλύπτει κανείς μια μεταγλωττισμένη Χολιγουντιανή ταινία. Πρώτον, υπάρχουν οι καρτουνίστικες κινήσεις των χειλιών (των ηθοποιών) που δεν είναι συγχρονισμένες με το ακουστικό περιεχόμενο. Έπειτα, πολύ συχνά ηθοποιοί μεταγλώττισης (με χαρακτηριστικές φωνές) δεν ταιριάζουν καθόλου με τους διάσημους αστέρες του σινεμά που υποδύονται στην οθόνη – κάτι που μπερδεύει και αποπροσανατολίζει τους θεατές. 

Αποδεικνύεται ότι μετά από όλες αυτές τις δεκαετίες, μια νέα κατηγορία νεοσύστατων επιχειρήσεων ελπίζει να αντιμετωπίσει αυτές τις ακούσιες δυσλειτουργίες. Χρησιμοποιώντας τεχνητή νοημοσύνη και μηχανική μάθηση, στοχεύουν να κάνουν τη διαδικασία μεταγλώττισης πιο αποτελεσματική και πιο φυσική, ως μέρος ενός αναδυόμενου κινήματος γνωστού ως «αυτόματη μεταγλώττιση».

ΔΙΑΦΗΜΙΣΤΙΚΟΣ ΧΩΡΟΣ

Οι επιπτώσεις θα μπορούσαν να είναι σαρωτικές. Στο ευρύτερο μεγάλο όραμα των αυτόματων μετατροπέων, οποιοδήποτε περιεχόμενο βίντεο θα είναι μια μέρα διαθέσιμο σε μια γλώσσα επιλογής, με το πάτημα ενός κουμπιού. Ακόμα πιο σημαντικό όμως: θα είναι απόλυτα σαν το πρωτότυπο. Ο κόσμος ψυχαγωγίας που θα προκύψει θα είναι αδιάλειπτα εναλλάξιμος: μια ταινία η μια σειρά δεν θα προέρχονται από ένα συγκεκριμένο μέρος, αλλά θα εμφανίζονται απροσδόκητα ως η φαινομενική δημιουργία οποιασδήποτε γλώσσας στην οποία θα ήθελε να την παρακολουθήσει ο θεατής.

«Οι δυνατότητες εδώ είναι απεριόριστες», δηλώνει ο Scott Mann, σκηνοθέτης του Χόλιγουντ που ίδρυσε μία από αυτές τις νεοσύστατες επιχειρήσεις, την Flawless. «Οι περισσότεροι από εμάς δεν γνωρίζουμε καν πόσο περιεχόμενο υπάρχει στον κόσμο. Τώρα μπορούμε να το εντοπίσουμε και να το παρακολουθήσουμε».

Ωστόσο, παρ ’όλη τη λαμπερή διαπολιτισμικότητα της, υπάρχουν πολλές κρυφές και συχνά σκοτεινές κοινωνικές επιπτώσεις. Η ψυχαγωγία που προσφέρεται με έναν εύκολο χρόνο μετατροπής μπορεί να χάσει όλη την τοπική της γεύση. Οι καταναλωτές σε όλο τον κόσμο, ίσως να μην εκτεθούν ποτέ στους ήχους μιας ξένης γλώσσας. 

Η μεταγλώττιση ήταν πάντα μια επίπονη πρακτική, προτού μπορέσει κανείς να δει καλά – καλά τις πρώτες σκηνές. Η παραδοσιακή μεταγλώττιση λειτουργεί συχνά ως εξής: ένα στούντιο ή ένας τοπικός διανομέας, έχοντας αποφασίσει ότι θέλει μια κυκλοφορία σε τοπική γλώσσα, πληρώνει για να μεταφράσει ένα σενάριο, να προσλάβει ένα σύνολο ηθοποιών για να παίξουν τους ρόλους, να νοικιάσει μηχανικό εξοπλισμό, να βάλει τους ηθοποιούς σε πολλές φωνητικές λήψεις, να τους ηχογραφήσει και μετά να ταιριάξει τις αναγνώσεις τους στο αρχικό βίντεο – μια τεράστια διαδικασία προκειμένου να επιτευχθεί ένα ομαλό τελικό προϊόν. Η όλη προσπάθεια μπορεί να διαρκέσει μήνες.

Η αυτόματη μεταγλώττιση θα λειτουργεί διαφορετικά. Ο αρχικός ηθοποιός ηχογραφεί πέντε λεπτά τυχαίου κειμένου στη γλώσσα του. Στη συνέχεια, αναλαμβάνουν δράση οι μηχανές: ένα νευρωνικό δίκτυο μαθαίνει τη φωνή του ηθοποιού και ένα πρόγραμμα ενσωματώνει αυτές τις φωνητικές πληροφορίες και τις εφαρμόζει σε μια ψηφιακή μετάφραση του σεναρίου. Στη συνέχεια, η τεχνητή νοημοσύνη διαβάζει τέλεια χρονομετρημένες γραμμές από την ταινία και μετατρέποντας τες στην ξένη γλώσσα τις ρίχνει στη δράση. Η όλη διαδικασία μπορεί να διαρκέσει εβδομάδες.

«Έχουμε την τεχνολογία για να καλύψουμε ένα μεγάλο κενό», λέει ο Oz Krakowski, επικεφαλής μάρκετινγκ του Deepdub, μιας νεοσύστατης εταιρείας από το Ντάλας και το Τελ Αβίβ, που χρησιμοποιεί αυτή τη διαδικασία. «Μπορούμε να δώσουμε στα στούντιο αυτό που θέλουν και στους καταναλωτές μια εντελώς μοναδική εμπειρία», προσθέτει. Η εταιρεία πρόκειται να θέσει σε δοκιμασία τον ισχυρισμό της, σύντομα. Κυκλοφορεί το «Κάθε Φορά Που Πεθαίνω», ένα θρίλερ του 2019, του οποίου η αγγλική έκδοση βρίσκεται στο Netflix, σε ισπανικές και πορτογαλικές εκδόσεις, μεταγλωττισμένες εξ ολοκλήρου από την AI.

Οι εταιρείες αυτόματης μεταγλώττισης ακολουθούν μια σειρά από προσεγγίσεις. Το Deepdub επικεντρώνεται στον ήχο, επανατοποθετώντας ψηφιακά τη φωνή του αρχικού ηθοποιού από μια αυτόματη μετάφραση, αλλά αφήνοντας το βίντεο αμετάβλητο. Μια άλλη εταιρεία, η Papercup με έδρα το Λονδίνο, εστιάζεται στην ίδια τακτική, χρησιμοποιώντας τις λεγόμενες συνθετικές φωνές. Η Flawless πηγαίνει αντίστροφα, στηριζόμενη σε ζωντανή – και επίπονη – ηχογράφηση φωνής ηθοποιών, αλλά επεξεργάζεται τα χείλη και τα πρόσωπα στην οθόνη έτσι ώστε να μοιάζουν σαν να μιλούν πραγματικά τη γλώσσα.  Και οι τρεις εταιρείες χρησιμοποιούν ανθρώπους στη διαδικασία σε διάφορα σημεία, για ποιοτικό έλεγχο.

Επιπρόσθετα, υπάρχει κάποια σχετική έρευνα από τεχνολογικούς γίγαντες όπως η Amazon, αλλά δεν υπάρχει ακόμη εμπορικό προϊόν. Αρκετές άλλες εταιρείες, όπως η Synthesia που εστιάζει στο βίντεο και η Respeecher με επίκεντρο τη φωνή, εργάζονται επίσης σε σχετικές τεχνολογίες. 

Αν και όλες οι υπηρεσίες χρησιμοποιούν κάποια μορφή χειραγώγησης, οι περισσότερες λένε ότι δεν εμπλέκονται σε deepfakes, όντας προσεκτικές ώστε να μη κάνουν το υλικό τους ευάλωτο σε πολιτικούς χειρισμούς ούτε να εμπλακούν σε διαμάχες όπως αυτή που αντιμετώπισε ένα πρόσφατο ντοκιμαντέρ του CNN για τον αείμνηστο Anthony Bourdain, πως χρησιμοποίησε την AI φωνή του. Φυσικά, το deepfake για κάποιους είναι η ψηφιακή βελτίωση για άλλους.

Οι εταιρείες επιχειρηματικών κεφαλαίων στοιχηματίζουν στην αυτόματη μεταγλώττιση. Τα στελέχη της Papercup δήλωσαν ότι τον Δεκέμβριο συγκέντρωσαν 10,5 εκατ δολ από μια ομάδα επενδυτών που περιλάμβανε και εταιρείες μέσων όπως η Guardian, πέρα ​​από πολλά άλλα εκατομμύρια που είχαν συγκεντρωθεί προηγουμένως.

Είναι εύκολο να καταλάβει κανείς το ενδιαφέρον τους. Το ξενόγλωσσο περιεχόμενο είναι ένα τεράστιο ανεξερεύνητο σύνορο για το Χόλιγουντ, ακόμη και σε εκδόσεις με υποτίτλους. Ένα παράδειγμα είναι το «Squid Game» του Netflix, το οποίο έχει γίνει η Νο 1 σειρά της υπηρεσίας σε πολλές χώρες, συμπεριλαμβανομένων των Ηνωμένων Πολιτειών. Εάν το κορεάτικο δράμα επιβίωσης μπορεί να το κάνει σε τέτοιο βαθμό (με υπότιτλους), λένε οι αυτόματοι μεταγλωττιστές, φανταστείτε τι θα συνέβαινε με διάλογο on-demand. Δεν είναι δύσκολο να φανταστεί κανείς μια ατελείωτη παρέλαση ξενόγλωσσων εμπορικών επιτυχιών.

Σαν μια νέα έκφανση του Πύργου της Βαβέλ – όπου όλοι μιλούν διαφορετικές γλώσσες αλλά εξακολουθούν να καταλαβαίνουν ο ένας τον άλλον – η αυτόματη μεταγλώττιση σημαίνει επίσης ότι οι μη αγγλόφωνοι δεν θα χρειαστεί να μάθουν αγγλικά για να κατανοήσουν τον διάλογο σε μια ταινία του Χόλιγουντ και οι υπότιτλοι πιθανότατα, θα εξαφανίζονταν. Αλλά αυτές οι πλούσιες δυνατότητες πάνε χέρι-χέρι με κάποιες ανησυχίες. Ένας κόσμος χωρίς ξένο διάλογο στην ψυχαγωγία του, σημαίνει έναν κόσμο στον οποίο εκατομμύρια θεατές μπορεί να μην εκτίθενται ποτέ σε κάποια γλώσσα έξω από τη δική τους. «Αν όλα όσα ακούτε μεταγλωτίζονται, χάνετε όλη τη φωνητική, όλες τις πληροφορίες, όλη την ενσυναίσθηση», λέει η Siva Reddy, επίκουρη καθηγήτρια γλωσσολογίας και πληροφορικής στο Πανεπιστήμιο McGill. «Μπορεί να έχετε έναν μονολιθικό τρόπο να βλέπετε τους πάντες», προσθέτει.

Η ιδέα της ατάκας –  σημείου αναφοράς – θα μπορούσε επίσης να τεθεί υπό αμφισβήτηση. Μερικές από τις πιο διάσημες φράσεις του κινηματογράφου όπως: «You talking to me?» του Taxi Driver η το «I’ll be back» του Terminator, καθιερώθηκαν επειδή ακούστηκαν και τελικά επαναλήφθηκαν (ατελείωτα) με αυτόν τον μοναδικό τρόπο. Ένα τέλειο κομμάτι σεναριογραφίας που εμφανίζεται στην οθόνη σε 30 διαφορετικές γλώσσες από την αρχή, μπορεί να μην μετατραπεί ποτέ σε κάτι κλασικό.

Ο συνιδρυτής της Papercup, Jesse Shemen, η εταιρεία του οποίου έχει συνεργαστεί με το Discovery και το Sky, λέει ότι τα οφέλη θα υπερτερούν αυτών των ανησυχιών. «Πιστεύω ότι η ακρόαση σκέψεων και φιλοσοφιών που δεν θα είχαμε ακούσει χωρίς την μεταγλώττιση, είναι πολύ πιο παραγωγική και ενδιαφέρουσα από το να περιορίζεται κανείς στη δική σου γλώσσα» λέει, επικαλούμενος τα πάντα – από έναν οικονομικό εμπειρογνώμονα στη Νιγηρία έως έναν σχολιαστή του ΝΒΑ στη Νότια Αμερική.

Η παρακολούθηση αυτόματης μεταγλώττισης μπορεί πάντως να είναι εκνευριστική. Είναι σχεδόν σαν οι μικρές ατέλειες της κανονικής μεταγλώττισης να εξυπηρετούν τον σκοπό να μας υπενθυμίσουν ότι μια ταινία ήρθε από (κάπου) αλλού. Ελαφρώς ενοχλητικό, για παράδειγμα, θα ήταν να παρακολουθεί την ερμηνεία του Jack Nicholson στο «A Few Good Men», όταν ξεσπάει στο εδώλιο μάρτυρα, ενώ το στόμα του εκφωνεί (τέλεια συγχρονισμένα γαλλικά).

Όπως και να έχει, πολλές από τις τεχνικές δυσκολίες δεν έχουν επιλυθεί ακόμη. Η επίτευξη ψηφιακών φωνών που να ακούγονται ανθρώπινες, με όλες τις απαιτούμενες αυξομειώσεις και αποχρώσεις, είναι κάτι που η τεχνητή νοημοσύνη δεν μπορεί να καταφέρει ακόμη. Επίσης, οι αυτόματες μεταφράσεις τείνουν να είναι κατά γράμμα, χάνοντας το περιεχόμενο.

«Πρέπει να είμαστε ειλικρινείς για το πού βρίσκεται η τεχνολογία αυτή τη στιγμή», λέει ο Shemen. «Η αντιστοίχιση των επιδόσεων των ανθρώπων δεν είναι μια απλή δουλειά. Πόσο μάλλον η μίμηση της υψηλής ποιότητας φωνής ενός διάσημου καλλιτέχνη».

Άλλοι στο κίνημα αυτόματης μεταγλώττισης, ωστόσο, λένε ότι αυτή θα μπορούσε να οδηγήσει σε νέες ευκαιρίες, όπως συνθετικές φωνές με στυλ «σήμα κατατεθέν». «Δεν χρειάζεται να επαναλάβουμε αυτό που έκανε το Χόλιγουντ μέχρι τώρα», λέει ο συνιδρυτής της Flawless, Mann. «Νομίζω ότι μπορούμε να δημιουργήσουμε πολλούς νέους κανόνες και οδούς για το πώς θα μοιάζουν οι ξένες ταινίες στο μέλλον», προσθέτει – αναφερόμενος φυσικά στην εμβληματική ατάκα του Doc Brown στον Marty McFly στο «Back To The Future»: «Εκεί που πάμε, δεν θα χρειαζόμαστε δρόμους».

Πηγή: The Washington Post 

 

σχόλια αναγνωστών
oδηγός χρήσης