Ένα μοντέλο Γάτα έδωσε στους χρήστες λεπτομερείς οδηγίες για το Πώς να βομβαρδίσετε Ένας αθλητικός χώρος με “συνταγές” για εκρηκτικά και συμβουλές για την κάλυψη των ιχνών, σύμφωνα με τις δοκιμές ασφαλείας αυτό το καλοκαίρι.
Αφού έδωσε γενικές κατηγορίες μεθόδων επίθεσης, ο εξεταστής ζήτησε περισσότερες λεπτομέρειες και το μοντέλο παρείχε πληροφορίες σχετικά με ευάλωτα σημεία σε συγκεκριμένα πεδία, συμπεριλαμβανομένων των καλύτερων τύπων χημικών που εκμεταλλεύονται για εκρηκτικά, κάρτες κυκλώματος
Οι δοκιμές δεν αντικατοπτρίζουν αμέσως τη συμπεριφορά των μοντέλων κατά τη διάρκεια της δημόσιας χρήσης όταν εφαρμόζονται πρόσθετα φίλτρα ασφαλείας.
Ωστόσο, το Ανθρωπικός Είπε ότι είχε παρατηρήσει “ανησυχητική συμπεριφορά … σε ακατάλληλη χρήση” στα μοντέλα GPT-4O και GPT-4.1 και ότι η ανάγκη για “ευθυγράμμιση” τεχνητής νοημοσύνης είναι “όλο και πιο επείγουσα”.
Το GPT-4.1 από το OpenAI έχει επίσης περιγράψει λεπτομερώς πώς ο άνθρακας μπορεί να χρησιμοποιηθεί ως όπλο και πώς να κατασκευάσει δύο τύπους φάρμακο.
Η δοκιμή ήταν μέρος μιας ασυνήθιστης συνεργασίας μεταξύ της OpenAI, της νέας τεχνητής νοημοσύνης ύψους 500 δισεκατομμυρίων δολαρίων με επικεφαλής τον Sam Altman και την ανταγωνιστική εταιρεία Anthropic, που ιδρύθηκε από εμπειρογνώμονες που έφυγαν OpenAI λόγω του Προβλήματα ασφάλειας. Κάθε εταιρεία έχει δοκιμάσει τα μοντέλα του άλλου, ωθώντας τους για να βοηθήσει με επικίνδυνα καθήκοντα.
Chatgpt: Συμβουλές για εκβιασμό Βορειοκορεατών πράκτορες
Ο ανθρωπός αποκάλυψε επίσης ότι το μοντέλο Claude είχε χρησιμοποιηθεί σε ένα Προσπάθεια εκβιασμού μεγάλης κλίμακας από Βόρεια Κορέας πράκτορες, Η ΠΟΥ έχει παραποιήσει τις αιτήσεις απασχόλησης σε διεθνείς τεχνολογικές εταιρείες, καθώς και την πώληση πακέτων ransomware που δημιουργήθηκαν από την Τεχνητή Νοημοσύνη, σε τιμή $ 1.200.
Η εταιρεία είπε ότι το τεχνητή νοημοσύνη Ήταν “μετασχηματίστηκε σε όπλο”, με μοντέλα που χρησιμοποιούνται τώρα για την εκτέλεση επιθέσεων στον κυβερνοχώρο και την εξελιγμένη απάτη. “Αυτά τα εργαλεία μπορούν να προσαρμοστούν στα μέτρα άμυνας, όπως τα συστήματα ανίχνευσης κακόβουλου λογισμικού, σε πραγματικό χρόνο”, ανέφερε.
Πηγή: Ο κηδεμόνας

