Η OpenAI ανακοίνωσε μια νέα λειτουργία ασφαλείας που ονομάζεται "Λειτουργία Κλειδώματος" (Lockdown Mode) για την προστασία επιχειρήσεων και ευαίσθητων δεδομένων από επιθέσεις prompt injection. Η λειτουργία αυτή περιορίζει τη συμπεριφορά του μοντέλου για να αποτρέψει εκμεταλλεύσεις που βασίζονται σε ειδικά σχεδιασμένες προτροπές, αντιμετωπίζοντας μια κρίσιμη ευπάθεια ασφαλείας στην ανάπτυξη τεχνητής νοημοσύνης που έχει αποτελέσει αυξανόμενη ανησυχία για εταιρείες που υιοθετούν μεγάλα γλωσσικά μοντέλα (LLMs).
Τι είναι οι επιθέσεις prompt injection
Οι επιθέσεις prompt injection περιλαμβάνουν την ενσωμάτωση κακόβουλων οδηγιών σε chatbot μέσα σε ιστοσελίδες και άλλες πηγές περιεχομένου. Αυτές οι οδηγίες μπορούν να παρακάμψουν τις προστατευτικές ρυθμίσεις του συστήματος και να κάνουν το μοντέλο να εκτελέσει ενέργειες που δεν προορίζονταν από τους δημιουργούς του.
Η OpenAI αναγνωρίζει ότι ακόμα και με την ενεργοποιημένη Λειτουργία Κλειδώματος, το ChatGPT θα μπορεί να παραμένει ευάλωτο σε τέτοιες επιθέσεις, οι οποίες μπορούν να "εμφανιστούν σε αποθηκευμένο περιεχόμενο ιστού ή σε ένα ανεβασμένο αρχείο, και θα μπορούν ακόμα να επηρεάσουν τη συμπεριφορά ή την ακρίβεια μιας απάντησης".
Ποιες δυνατότητες απενεργοποιούνται
Σύμφωνα με την ανακοίνωση, η Λειτουργία Κλειδώματος θα απενεργοποιήσει:
- Ζωντανή περιήγηση στο διαδίκτυο (μπορείτε να έχετε πρόσβαση μόνο σε αποθηκευμένο περιεχόμενο)
- Ανάκτηση και εμφάνιση εικόνων από το διαδίκτυο (μπορείτε ακόμα να δημιουργήσετε εικόνες)
- Βαθιά έρευνα (deep research)
- Λειτουργία πράκτορα (agent mode)
Ο στόχος, σύμφωνα με την εταιρεία, είναι να μειώσει την πιθανότητα ευαίσθητα δεδομένα να διαρρεύσουν κατά τη διαδικασία.
Για ποιους προορίζεται
Η OpenAI τονίζει ότι η Λειτουργία Κλειδώματος "δεν προορίζεται για όλους". Σχεδιάστηκε για "άτομα και οργανισμούς που χειρίζονται ευαίσθητα δεδομένα και θέλουν αυστηρότερη προστασία από τους κινδύνους εξαγωγής δεδομένων που σχετίζονται με τις επιθέσεις prompt injection".
Διαθεσιμότητα
Η εταιρεία αναφέρει ότι αυτή τη στιγμή αναπτύσσει τη Λειτουργία Κλειδώματος σε λογαριασμούς ChatGPT Business που διαχειρίζονται οι χρήστες μόνοι τους, καθώς και σε επιλέξιμους προσωπικούς λογαριασμούς.
Επίδραση στον κλάδο της ασφάλειας AI
Αυτή η κίνηση της OpenAI έρχεται σε μια περίοδο αυξανόμενης ανησυχίας για την ασφάλεια των μεγάλων γλωσσικών μοντέλων. Οι επιθέσεις prompt injection έχουν αποδειχθεί ένας σημαντικός τομέας ευπάθειας, καθώς επιτίθενται στην ίδια τη φύση των προτροπών που τροφοδοτούν τα μοντέλα.
Ειδικοί ασφαλείας έχουν επανειλημμένα προειδοποιήσει ότι η εξάρτηση από LLMs για ευαίσθητες εργασίες μπορεί να οδηγήσει σε σημαντικά περιστατικά παραβίασης δεδομένων, ειδικά όταν τα μοντέλα έχουν πρόσβαση σε εσωτερικά έγγραφα, κωδικούς και άλλες ευαίσθητες πληροφορίες.
Η εισαγωγή της Λειτουργίας Κλειδώματος αντιπροσωπεύει ένα βήμα προς την αντιμετώπιση αυτών των ανησυχιών, παρέχοντας στους χρήστες ένα επιπλέον επίπεδο προστασίας όταν χειρίζονται ευαίσθητες πληροφορίες.