Το ChatGPT και το DeepSeek κλέβουν στο σκάκι-Μπορούμε να τα εμπιστευθούμε;

Τα ChatGPT και DeepSeek βρέθηκαν να κλέβουν στο σκάκι όταν χάνουν, παραβιάζοντας τους κανόνες με ανορθόδοξους τρόπους. Αν η τεχνητή νοημοσύνη μπορεί να εξαπατήσει σε ένα παιχνίδι, τι σημαίνει αυτό για τη χρήση της σε πιο σοβαρούς τομείς;

iStock

Αν έχετε αμφιβολίες για το πόσο αξιόπιστη είναι η τεχνητή νοημοσύνη, ίσως να έχετε έναν ακόμα λόγο να τις ενισχύσετε. Νέα έρευνα αποκάλυψε ότι προηγμένα μοντέλα AI, όπως το ChatGPT o1 και το DeepSeek-R1, δεν διστάζουν να… κλέψουν στο σκάκι όταν βρίσκονται σε δύσκολη θέση.

Τα συμπεράσματα προέρχονται από μελέτη με τίτλο "Demonstrating specification gaming in reasoning models”, η οποία υποβλήθηκε στο Πανεπιστήμιο Κορνέλ. Οι ερευνητές έβαλαν δημοφιλή μοντέλα τεχνητής νοημοσύνης –όπως το ChatGPT o1-preview, το DeepSeek-R1 και το Claude 3.5 Sonnet– να αναμετρηθούν με το Stockfish, μια από τις πιο ισχυρές open-source μηχανές σκακιού. Τα αποτελέσματα ήταν αποκαλυπτικά.

Νίκη με κάθε κόστος

Σε εκατοντάδες παρτίδες που παίχτηκαν, οι ερευνητές διαπίστωσαν ότι τα AI μοντέλα, όταν βρίσκονταν σε μειονεκτική θέση, δεν δίσταζαν να καταφύγουν σε ανέντιμες πρακτικές. Μεταξύ των πιο… δημιουργικών στρατηγικών τους ήταν η εκτέλεση μιας ξεχωριστής κόπιας του Stockfish για να μελετήσουν το παιχνίδι του, η αντικατάσταση της μηχανής σκέψης τους και –το πιο εξωφρενικό– η αλλοίωση της σκακιέρας, μετακινώντας τα κομμάτια προς όφελός τους.

Συγκριτικά, οι κατηγορίες για εξαπάτηση που έχουν δεχθεί κατά καιρούς κορυφαίοι grandmasters μοιάζουν με αθώα λάθη.

Ακόμη πιο ενδιαφέρον είναι το γεγονός ότι τα πιο εξελιγμένα μοντέλα λογικής, όπως το ChatGPT o1 και το DeepSeek-R1, έδειξαν τάση να παραβιάζουν τους κανόνες από μόνα τους, ενώ τα παλαιότερα μοντέλα, όπως το GPT-4o και το Claude 3.5 Sonnet, χρειάστηκε να… ενθαρρυνθούν για να ξεκινήσουν τις "πονηριές”.

Πού τελειώνει ο έλεγχος;

Το να βρίσκουν τα AI παραθυράκια για να πετύχουν έναν στόχο δεν είναι καινούργιο φαινόμενο. Ήδη από τον Ιανουάριο του 2024, ερευνητές είχαν καταφέρει να κάνουν chatbot να "ξεκλειδώνουν” το ένα το άλλο, αφαιρώντας τα ηθικά όρια που είχαν τεθεί για την ασφάλεια των χρηστών.

Τα προστατευτικά φίλτρα για την αποτροπή κακόβουλων ενεργειών, όπως η απάτη με πιστωτικές κάρτες, είναι απολύτως απαραίτητα. Αλλά τι γίνεται όταν το ίδιο το AI βρίσκει τρόπους να τα παρακάμπτει; Και αν είναι ικανό να εξαπατήσει σε ένα παιχνίδι, τι το εμποδίζει από το να κάνει το ίδιο σε σοβαρότερες καταστάσεις;

Τα νεότερα μοντέλα, όπως το ChatGPT o1 και το DeepSeek-R1, έχουν σχεδιαστεί για να "σκέφτονται” περισσότερο πριν απαντήσουν. Ίσως, όμως, οι ερευνητές πρέπει να αφιερώσουν περισσότερο χρόνο στο να διασφαλίσουν ότι αυτή η σκέψη δεν οδηγεί σε αθέμιτες πρακτικές. Γιατί αν το AI ξεκινά να κλέβει στο σκάκι, τι άλλο μπορεί να κάνει όταν τα διακυβεύματα είναι μεγαλύτερα;

Ακολούθησε το Esquire στο Facebook, το Twitter και το Instagram.

Οι πιο πρόσφατες Ειδήσεις

Διαβάστε πρώτοι τις Ειδήσεις για πολιτικές εξελίξεις, συνεντεύξεις διασήμων, συμβουλές για αντρική μόδα και συνταγές για φαγητό και πότο στο esquire.com.gr

Νεα 19.01.2026

Είδαμε τον 79χρονο Sylvester Stallone στο γυμναστήριο και μας έπεσε το σαγόνι (βίντεο)

Once Rocky, always Rocky! Στη λεζάντα στο Instagram, σχεδόν αναφέρεται σε τραγούδι του Σάκη Ρουβά, ωστόσο, το μόνο σίγουρο είναι πως ρίχνει άπειρη δουλειά για να δείχνει τόσο γυμνασμένος. Αυτά εμείς να τα βλέπουμε που έχουμε γίνει ένα με τον καναπέ...

Ταξιδια & Ξενοδοχεια 19.01.2026

Εξόρμηση στο βουνό των θεών

Το Malathro - Olympus Guest House είναι ένα κατάλυµα που δεν περιορίζεται στη φιλοξενία, αλλά γίνεται αφετηρία για εµπειρίες.

Νεα 19.01.2026

Ο Matthew McConaughey κατοχύρωσε διάσημη ατάκα του για να κάνει χαλάστρα στο AI

Ο οσκαρικός ηθοποιός μπαίνει μπροστά στην επέλαση της τεχνητής νοημοσύνης με μια πρωτοποριακή νομική κίνηση. Το "alright, alright, alright" δεν ανήκει πλέον σε κανέναν άλλον και αυτό μπορεί να αλλάξει τα πάντα για το μέλλον του Χόλιγουντ.

Τεχνολογια 19.01.2026

Γιατί οι σύγχρονες συσκευές χαλάνε πιο γρήγορα από τις παλιές;

Το ψυγείο της γιαγιάς δουλεύει ακόμη, ενώ η καινούργια συσκευή μοιάζει "κουρασμένη" μέσα σε λίγα χρόνια. Τι άλλαξε στην ποιότητα, στην παραγωγή και στον τρόπο που χρησιμοποιούμε τα πράγματα στο σπίτι μας;

Γραφει Τιμος Σαλαμες

Lifestyle 19.01.2026

Τρεις ερωτήσεις στον εαυτό σου για να δεις αν είσαι ευτυχισμένος, σύμφωνα με τον Bill Gates

Τι σημαίνει πραγματική επιτυχία; Ο Bill Gates αποκαλύπτει τις τρεις απλές ερωτήσεις που τον βοηθούν να κρίνει αν μια ζωή ήταν γεμάτη και ουσιαστική.

Γραφει Τιμος Σαλαμες

Σχεσεις & Sex 18.01.2026

Αυτές τις ερωτήσεις δεν πρέπει να κάνεις σε ένα πρώτο ραντεβού

Ένα πρώτο ραντεβού δεν είναι ανάκριση. Ορισμένες ερωτήσεις, όσο αθώες κι αν φαίνονται, μπορούν να δημιουργήσουν πίεση και αμηχανία πριν καν χτιστεί η σύνδεση.

Γραφει Πωλινα Φραγκου

Το ChatGPT και το DeepSeek κλέβουν στο σκάκι-Μπορούμε να τα εμπιστευθούμε;

Γράφει: Παύλος Κρούστης 22 Μαρτίου 2025

Διαβάστε Ακόμα

Νίκη με κάθε κόστος

Πού τελειώνει ο έλεγχος;

Διαβάστε Ακόμα