Το ChatGPT και το DeepSeek κλέβουν στο σκάκι-Μπορούμε να τα εμπιστευθούμε;

Τα ChatGPT και DeepSeek βρέθηκαν να κλέβουν στο σκάκι όταν χάνουν, παραβιάζοντας τους κανόνες με ανορθόδοξους τρόπους. Αν η τεχνητή νοημοσύνη μπορεί να εξαπατήσει σε ένα παιχνίδι, τι σημαίνει αυτό για τη χρήση της σε πιο σοβαρούς τομείς;

Αν έχετε αμφιβολίες για το πόσο αξιόπιστη είναι η τεχνητή νοημοσύνη, ίσως να έχετε έναν ακόμα λόγο να τις ενισχύσετε. Νέα έρευνα αποκάλυψε ότι προηγμένα μοντέλα AI, όπως το ChatGPT o1 και το DeepSeek-R1, δεν διστάζουν να… κλέψουν στο σκάκι όταν βρίσκονται σε δύσκολη θέση.

Τα συμπεράσματα προέρχονται από μελέτη με τίτλο "Demonstrating specification gaming in reasoning models”, η οποία υποβλήθηκε στο Πανεπιστήμιο Κορνέλ. Οι ερευνητές έβαλαν δημοφιλή μοντέλα τεχνητής νοημοσύνης –όπως το ChatGPT o1-preview, το DeepSeek-R1 και το Claude 3.5 Sonnet– να αναμετρηθούν με το Stockfish, μια από τις πιο ισχυρές open-source μηχανές σκακιού. Τα αποτελέσματα ήταν αποκαλυπτικά.

Νίκη με κάθε κόστος

Σε εκατοντάδες παρτίδες που παίχτηκαν, οι ερευνητές διαπίστωσαν ότι τα AI μοντέλα, όταν βρίσκονταν σε μειονεκτική θέση, δεν δίσταζαν να καταφύγουν σε ανέντιμες πρακτικές. Μεταξύ των πιο… δημιουργικών στρατηγικών τους ήταν η εκτέλεση μιας ξεχωριστής κόπιας του Stockfish για να μελετήσουν το παιχνίδι του, η αντικατάσταση της μηχανής σκέψης τους και –το πιο εξωφρενικό– η αλλοίωση της σκακιέρας, μετακινώντας τα κομμάτια προς όφελός τους.

Συγκριτικά, οι κατηγορίες για εξαπάτηση που έχουν δεχθεί κατά καιρούς κορυφαίοι grandmasters μοιάζουν με αθώα λάθη.

Ακόμη πιο ενδιαφέρον είναι το γεγονός ότι τα πιο εξελιγμένα μοντέλα λογικής, όπως το ChatGPT o1 και το DeepSeek-R1, έδειξαν τάση να παραβιάζουν τους κανόνες από μόνα τους, ενώ τα παλαιότερα μοντέλα, όπως το GPT-4o και το Claude 3.5 Sonnet, χρειάστηκε να… ενθαρρυνθούν για να ξεκινήσουν τις "πονηριές”.

ΣκάκιiStock

Πού τελειώνει ο έλεγχος;

Το να βρίσκουν τα AI παραθυράκια για να πετύχουν έναν στόχο δεν είναι καινούργιο φαινόμενο. Ήδη από τον Ιανουάριο του 2024, ερευνητές είχαν καταφέρει να κάνουν chatbot να "ξεκλειδώνουν” το ένα το άλλο, αφαιρώντας τα ηθικά όρια που είχαν τεθεί για την ασφάλεια των χρηστών.

Τα προστατευτικά φίλτρα για την αποτροπή κακόβουλων ενεργειών, όπως η απάτη με πιστωτικές κάρτες, είναι απολύτως απαραίτητα. Αλλά τι γίνεται όταν το ίδιο το AI βρίσκει τρόπους να τα παρακάμπτει; Και αν είναι ικανό να εξαπατήσει σε ένα παιχνίδι, τι το εμποδίζει από το να κάνει το ίδιο σε σοβαρότερες καταστάσεις;

Τα νεότερα μοντέλα, όπως το ChatGPT o1 και το DeepSeek-R1, έχουν σχεδιαστεί για να "σκέφτονται” περισσότερο πριν απαντήσουν. Ίσως, όμως, οι ερευνητές πρέπει να αφιερώσουν περισσότερο χρόνο στο να διασφαλίσουν ότι αυτή η σκέψη δεν οδηγεί σε αθέμιτες πρακτικές. Γιατί αν το AI ξεκινά να κλέβει στο σκάκι, τι άλλο μπορεί να κάνει όταν τα διακυβεύματα είναι μεγαλύτερα;

Ακολούθησε το Esquire στο Facebook, το Twitter και το Instagram.

Οι πιο πρόσφατες Ειδήσεις

Διαβάστε πρώτοι τις Ειδήσεις για πολιτικές εξελίξεις, συνεντεύξεις διασήμων, συμβουλές για αντρική μόδα και συνταγές για φαγητό και πότο στο esquire.com.gr

Τα 5 χαρακτηριστικά των ανθρώπων με χαμηλή νοημοσύνη

Συνήθως οι έρευνες ασχολούνται με τα στοιχεία των ανθρώπων με υψηλό IQ, όμως η AI εντοπίζει και τα σημάδια που δείχνουν ανθρώπους με χαμηλή νοημοσύνη. Δείτε ποια είναι.

Γραφει Παυλος Κρουστης

Οι πόλεις με το καλύτερο nightlife στον κόσμο-είναι μέσα η Αθήνα;

Μια παγκόσμια μελέτη αξιολογεί πόλεις με βάση την ασφάλεια, τις τιμές και το εύρος της διασκέδασης μετά τα μεσάνυχτα. Δες ποιες περιοχές ξεχώρισαν για τη νυχτερινή τους ενέργεια- Είναι μέσα η Αθήνα;

Γραφει Τιμος Σαλαμες

4ο πρόγραμμα residency του Ιδρύματος Γ.&Α. Μαμιδάκη: Συνεργασίες ανάμεσα στην Τέχνη, την Επιστήμη και την Τεχνολογία (AST)

Αναλυτική επισκόπηση του Residency 2025 του Ιδρύματος Μαμιδάκη, ενός προγράμματος που προωθεί τη διεπιστημονική έρευνα και τη συνεργασία μεταξύ Τέχνης, Επιστήμης και Τεχνολογίας στην Κρήτη.

H Apple παρουσίασε μια κομμένη κάλτσα ως θήκη για iPhone-δε φαντάζεστε πόσο τη χρεώνει

H Apple ξαναχτυπά με ένα αξεσουάρ που έχει γίνει viral πριν καν κυκλοφορήσει: το iPhone Pocket, μια θήκη που πολλοί στο διαδίκτυο παρομοιάζουν με… κομμένη κάλτσα, αλλά με τιμή που "τσουρουφλάει".

Γραφει Παυλος Κρουστης

Πώς ο Chuck Norris παραμένει τόσο fit στα 85 του

Στα 85 του, ο Chuck Norris δείχνει πως η ηλικία είναι απλώς ένας αριθμός. Με συνεχή άσκηση, πειθαρχία και σωστή προσέγγιση, παραμένει δυνατότερος από ποτέ.

Γραφει Γιαννης Μπελεσιωτης

Ο Cristiano Ronaldo επέστρεψε στην Αμερική μετά από 11 χρόνια-Η συνάντησή του με τον Donald Trump

Ο Cristiano Ronaldo παρευρέθηκε σε επίσημο δείπνο στον Λευκό Οίκο μαζί με Donald Trump και Mohammed bin Salman, σε μια βραδιά γεμάτη πολιτικό και αθλητικό ενδιαφέρον.

Γραφει Γιαννης Μπελεσιωτης