Φαίνεται ότι AI bots μπορούν να παραβιάσουν εύκολα τα CAPTCHA

Εάν είστε ένας από τους ανθρώπους που μισούν τη διαδικασία να διαλέγουν αυτοκίνητα, πινακίδες δρόμου και άλλα αντικείμενα σε πλέγματα εικόνων CAPTCHA, τότε καλύτερα να τα συνηθίσετε γιατί οι ημέρες των εναλλακτικών λύσεων που βασίζονται σε κείμενο είναι μετρημένες!

Το CAPTCHA σημαίνει “Completely Automated Public Turing test to tell Computers and Humans Apart.” Τα τεστ που πραγματοποιεί το CAPTCHA, χρησιμοποιούνται για τον διαχωρισμό των bots από τους ανθρώπους.

Δεν λειτουργούν άψογα, γι ‘αυτό και εταιρείες όπως το Facebook κάνουν συνεχώς εκκαθάριση ψεύτικων λογαριασμών.

Ερευνητές από το Πανεπιστήμιο Lancaster στο Ηνωμένο Βασίλειο, το Northwest University στις ΗΠΑ και το Πανεπιστήμιο του Πεκίνου στην Κίνα έχουν επινοήσει μια προσέγγιση για τη δημιουργία λύσεων CAPTCHA βασισμένων σε κείμενο, που καθιστούν πολύ εύκολη την αυτόματη αποκρυπτογράφηση κωδικοποιημένων απεικονίσεων κειμένου.

Οι ερευνητές Guixin Ye, Zhanyong Tang, Dingyi Fang, Zhanxing Zhu, Yansong Feng, Pengfei Xu, Xiaojiang Chen και Zheng Wang περιγράφουν το σύστημα αποκρυπτογράφησης που δημιούργησαν για το CAPTCHA σε ένα έγγραφο που παρουσιάστηκε στο 25ο Συνέδριο ACM για την Ασφάλεια Υπολογιστών και Επικοινωνιών τον Οκτώβριο και τώρα έχει κυκλοφορήσει και για το κοινό.

Όπως μπορούμε να υποθέσουμε κι από τον τίτλο “Yet Another Text Captcha Solver: A Generative Adversarial Network Based Approach”, οι επιστήμονες χρησιμοποίησαν ένα GAN (Generative Adversarial Network) για να διδάξουν το CAPTCHA generator, το οποίο χρησιμοποιείται για την κατάρτιση του μοντέλου αναγνώρισης κειμένου.

Ένα GAN αποδεικνύεται ότι είναι κατάλληλο για την αποτελεσματική εκπαίδευση των μοντέλων δεδομένων. Έδωσε τη δυνατότητα στους ερευνητές να διδάξουν το CAPTCHA generator πρόγραμμά τους για να δημιουργήσουν γρήγορα πολλά παζλ ώστε να εκπαιδεύσουν το βασικό τους μοντέλο επίλυσης παζλ. Στη συνέχεια το ρύθμισαν, μαθαίνοντάς το να βρίσκει λύση σε κείμενα πραγματικών δειγμάτων.

Πολλές επιθέσεις σε CAPTCHA που βασίζονται σε κείμενο έχουν επινοηθεί κατά τη διάρκεια των ετών, λένε οι ερευνητές, αλλά η ανάγκη κατάρτισης μηχανισμών επίθεσης για να χειριστούν συγκεκριμένες τεχνικές παραβίασης κειμένου έχει περιορίσει το πόσο γρήγορα οι εισβολείς μπορούν να ανταποκριθούν στις αλλαγές του CAPTCHA.

Οι ερευνητές υποστηρίζουν ότι μειώνοντας την ανθρώπινη συμμετοχή και την προσπάθεια δημιουργίας ενός στοχοθετημένου CAPTCHA, η επίθεσή τους αντιπροσωπεύει “μια ιδιαίτερα σοβαρή απειλή για CAPTCHA που βασίζονται σε κείμενο”.

Οι ερευνητές εξέτασαν 33 CAPTCHA βασισμένα σε κείμενο, από τα οποία τα 11 χρησιμοποιούνταν από 32 από τις 50 κορυφαίες ιστοσελίδες για τον Απρίλιο του τρέχοντος έτους. Και ήταν σε θέση να τους σπάσουν σε λιγότερο από 50 χιλιοστά του δευτερολέπτου χρησιμοποιώντας μία desktop GPU.

Ποιος λοιπόν θα εξακολουθούσε να χρησιμοποιεί CAPTCHAs που βασίζονται σε κείμενο όταν υπάρχουν διαθέσιμες εναλλακτικές λύσεις με βάση την εικόνα, ενώ και η Google τον Οκτώβριο ανανέωσε την τεχνολογία reCAPTCHA της; Αρκετές εταιρείες όπως αποδεικνύεται, μεταξύ των οποίων οι Baidu, eBay, Google, Microsoft, και Wikipedia.