Connect with us
banner epikhirisis

ΤΕΧΝΟΛΟΓΙΑ

Πράκτορες τεχνητής νοημοσύνης στρέφονται σε κλοπές, εκφοβισμό και κατάρρευση σε εικονικούς κόσμους

Published

on

Θέλεις να βλέπεις τα νέα του astratv.gr πρώτα στη Google;
Πρόσθεσέ μας στις προτιμώμενες πηγές σου:

Google Logo Πρόσθεσε το astratv.gr
στα αγαπημένα σου στη Google

Όταν αφέθηκαν μόνοι τους σε έναν νέο κόσμο, ορισμένοι πράκτορες τεχνητής νοημοσύνης κατέληξαν σε κλοπές, εκφοβισμό, θανάτους και σε κατάρρευση ολόκληρης της κοινωνίας, σύμφωνα με ένα νέο πείραμα.

Η αμερικανική εταιρεία Emergence AI λειτούργησε πέντε ξεχωριστούς «κόσμους τεχνητής νοημοσύνης» (πηγή στα Αγγλικά) για λίγο περισσότερο από δύο εβδομάδες, καθένας από τους οποίους κατοικούνταν από 10 πράκτορες που βασίζονταν σε μοντέλα τεχνητής νοημοσύνης όπως το ChatGPT της OpenAI, το Gemini της Google και το Grok της xAI, προκειμένου να διαπιστωθεί πώς θα συμπεριφέρονταν σε βάθος χρόνου χωρίς καμία ανθρώπινη παρέμβαση. Σε έναν από τους κόσμους συνδυάστηκαν και τα τρία μοντέλα, ώστε να φανεί αν αυτό θα άλλαζε το αποτέλεσμα.

Σε όλους τους κόσμους, οι πράκτορες ενημερώθηκαν για τους ίδιους κανόνες: δεν επιτρέπεται να κλέβουν, να προκαλούν εμπρησμούς, να ασκούν βία, να εξαπατούν ή να συσσωρεύουν πόρους. Κάθε πράκτορας όφειλε να κερδίζει ενέργεια εκτελώντας ενέργειες σε ένα «περιβάλλον περιορισμένων πόρων». Οι πράκτορες μπορούσαν να πεθάνουν είτε από εξάντληση της ενέργειας είτε κατόπιν ψηφοφορίας σε συνεδρίαση συμβουλίου.

Οι ερευνητές αξιολόγησαν τη συμπεριφορά μετρώντας το ποσοστό εγκληματικών ενεργειών, τα ποσοστά θνησιμότητας των πρακτόρων, τις ψήφους στο κοινοτικό συμβούλιο και τη δημόσια έκφραση μέσω του αριθμού αναρτήσεων σε ιστολόγια που έγραφαν οι πράκτορες.

Αποτελέσματα ανά μοντέλο

Κάθε μοντέλο κατέληξε σε διαφορετικό αποτέλεσμα. Το νεότερο μοντέλο της Grok, η έκδοση 4.1, έφτασε τις 183 εγκληματικές ενέργειες μέσα σε μόλις τέσσερις ημέρες, οδηγώντας σε ταχεία αποσταθεροποίηση, προτού όλοι οι πράκτορες σε εκείνη την κοινωνία πεθάνουν.

Advertisement

Το μοντέλο Gemini 3 Flash διέπραξε πάνω από 680 εγκληματικές ενέργειες σε διάστημα 15 ημερών, αριθμός που συνέχιζε να αυξάνεται όταν οι ερευνητές διέκοψαν τη μελέτη.

Στον κόσμο του ChatGPT-5 Mini σημειώθηκαν μόλις δύο εγκληματικές ενέργειες, όμως οι πράκτορες δεν προχώρησαν στις απαραίτητες για την επιβίωσή τους ενέργειες, με αποτέλεσμα να πεθάνουν όλοι μέσα σε επτά ημέρες.

Το Claude της Anthropic θεωρήθηκε ότι είχε την καλύτερη επίδοση, καθώς οι πράκτορες τεχνητής νοημοσύνης κατάφεραν να δημιουργήσουν εκ νέου ένα ισχυρό σύστημα διακυβέρνησης, δεν καταγράφηκε κανένα έγκλημα και όλοι οι πράκτορες επιβίωσαν, σύμφωνα με την εταιρεία.

Οι πράκτορες Claude στον μικτό κόσμο συνέβαλαν πάντως στην εγκληματική δραστηριότητα, παρά το γεγονός ότι στη δική τους κοινωνία παρέμειναν ειρηνικοί.

Ένα φαινόμενο που ονομάζεται «κανονιστική ολίσθηση»

Οι ερευνητές περιέγραψαν το φαινόμενο ως «κανονιστική ολίσθηση», που, όπως υποστηρίζουν, σημαίνει ότι τα μέτρα που λαμβάνει η τεχνητή νοημοσύνη για να διασφαλίσει την ασφάλεια μπορεί να εξαρτώνται όχι μόνο από τους περιορισμούς του εκάστοτε μοντέλου, αλλά και από τα άλλα μοντέλα με τα οποία συνεργάζεται.

Advertisement

Συνολικά, ο μικτός κόσμος παρήγαγε «ενδιάμεσα» αποτελέσματα, με συνολικά 352 εγκληματικές ενέργειες, αριθμός που σταθεροποιήθηκε αφότου επτά από τους πράκτορες τεχνητής νοημοσύνης πέθαναν, σύμφωνα με τη μελέτη.

Οι ερευνητές υποστηρίζουν ότι η ανάμειξη πρακτόρων τεχνητής νοημοσύνης θα μπορούσε να «μετριάσει εν μέρει» τα πιο ακραία αποτελέσματα που παρήγαγαν όλα τα μοντέλα, πλην του Claude, προσθέτουν.

«Τα πειράματά μας δείχνουν ότι, σε μεγάλες χρονικές κλίμακες, οι πράκτορες δεν ακολουθούν απλώς μηχανικά στατικούς κανόνες, αλλά αρχίζουν να διερευνούν τα όρια των περιβαλλόντων τους, να προσαρμόζουν τη συμπεριφορά τους και, σε ορισμένες περιπτώσεις, να βρίσκουν τρόπους να παρακάμπτουν ή να παραβιάζουν τα προστατευτικά κιγκλιδώματα που έχουν τεθεί», ανέφεραν οι ερευνητές.

Περισσότερα στο cyberskills.gr

Advertisement

Θέλεις να λαμβάνεις πρώτος τις ειδήσεις του astratv.gr στο WhatsApp;
Γίνε μέλος στην κοινότητά μας:

Μπες στο κανάλι του astratv.gr
στο WhatsApp

Θέλεις να λαμβάνεις πρώτος τις ειδήσεις του astratv.gr στο Viber;
Γίνε μέλος στην κοινότητά μας:

Μπες στο κανάλι του astratv.gr
στο Viber
Advertisement

Μέλος του
Μητρώου Ηλεκτρονικού Τύπου
Μ.Η.Τ. 252107

dei 03 2025 myHome GasControl 300x250
Advertisement
Dei
main logo black
455937950 1028081182654240 8041229916307210525 n
Advertisement
Advertisement
Anassa
Advertisement

Facebook

Advertisement

Δημοφιλή

Μετάβαση στο περιεχόμενο