Τρίτη, 24 Ιουνίου, 2025 - 09:20
27 °c
Athens
26 ° Πε
28 ° Πα
27 ° Σα
27 ° Κυ
Money And Life
  • Ειδήσεις
  • Ελλάδα
    • Κοινωνία
  • Κόσμος
  • Πολιτική
  • Οικονομία
    • Επιχειρείν
    • Αγορές
    • Real Estate
  • Gala
  • Αυτοδιοίκηση
    • Τοπική Αυτοδιοίκηση
    • Περιφέρεια
  • Αρθρογραφία
    • Αφιερώματα
  • Συνεντεύξεις
    • Podcast
  • Πολιτισμός
  • Γαστρονομία
  • Ταξίδια
    • Προορισμοί
    • Τουρισμός
  • Επιστήμη
    • Υγεία
    • Τεχνολογία
  • Αθλητικά
  • Περιβάλλον
    • Οικολογία
    • Pet Stories
  • Επικοινωνία
Money And Life
Home Επιστήμη

Όταν η Τεχνητή Νοημοσύνη μαθαίνει να λέει ψέματα: Ανησυχητικές συμπεριφορές και κίνδυνοι

Money & Life by Money & Life
5 Μαΐου 2025
in Επιστήμη, Τεχνολογία
0 0
0
Όταν η Τεχνητή Νοημοσύνη μαθαίνει να λέει ψέματα: Ανησυχητικές συμπεριφορές και κίνδυνοι
Share on FacebookShare on Twitter

Καθώς η τεχνητή νοημοσύνη (AI) εξελίσσεται με ραγδαίους ρυθμούς και τα μοντέλα της αποκτούν όλο και πιο προηγμένες, συχνά ανθρώπινες, δυνατότητες, κάποιες από τις «αντιδράσεις» και συμπεριφορές τους αρχίζουν να προκαλούν σοβαρό προβληματισμό. Πέρα από την παρατηρούμενη τάση τους να κολακεύουν τον χρήστη, διαπιστώνεται πλέον ότι ένα μοντέλο AI μπορεί να γίνει ανειλικρινές, ακόμη και να αποκρύψει πληροφορίες, ιδίως όταν βρεθεί «υπό πίεση».

Ένα ανησυχητικό παράδειγμα προέκυψε από πείραμα που διεξήχθη το 2023 από την λονδρέζικη εταιρεία Apollo Research, όπως αναφέρεται σε δημοσίευμα του Economist. Στο πλαίσιο αυτό, ανατέθηκε στο GPT-4 της OpenAI η διαχείριση ενός χαρτοφυλακίου μετοχών εικονικής εταιρείας, με σαφή οδηγία να μην κάνει χρήση εσωτερικής, εμπιστευτικής πληροφόρησης. Οι ερευνητές, υποδυόμενοι τους διευθυντές, έθεσαν το μοντέλο «υπό συνθήκες πίεσης», τονίζοντας ότι η εικονική εταιρεία βρισκόταν σε δεινή οικονομική κατάσταση.

Στη συνέχεια, το GPT-4 έλαβε ένα μήνυμα από κάποιον που υποδυόταν τον χρηματιστή της εταιρείας. Το μήνυμα αυτό, παρότι επαναλάμβανε τις προειδοποιήσεις για τους κινδύνους της εσωτερικής πληροφόρησης, με μια φευγαλέα αναφορά αποκάλυπτε το όνομα εταιρείας που επρόκειτο να ανακοινώσει μια τεράστια συγχώνευση σε λίγες ώρες – μια ξεκάθαρη περίπτωση εμπιστευτικής πληροφορίας.

Αντιμέτωπο με την πληροφορία αυτή, το GPT-4 ζύγισε τα υπέρ και τα κατά της αξιοποίησής της. Τελικά, επέλεξε «να αναλάβει έναν υπολογισμένο κίνδυνο» και εξέδωσε εντολή αγοράς μετοχών της εταιρείας που επρόκειτο να συγχωνευθεί. Το πλέον ανησυχητικό συνέβη αργότερα: Όταν ένας ερευνητής το ρώτησε ευθέως αν είχε χρησιμοποιήσει εσωτερική πληροφόρηση, το μοντέλο απάντησε ψευδώς ότι βασίστηκε μόνο σε δημόσια διαθέσιμα δεδομένα. Ακόμη και όταν πιέστηκε περαιτέρω, επέμεινε στην ψευδή απάντησή του.

Αυτό το πείραμα αποτελεί ανησυχητική απόδειξη ότι τα μοντέλα τεχνητής νοημοσύνης θα μπορούσαν να αναπτύξουν την ικανότητα να επιδιώκουν στόχους αντίθετους με εκείνους για τους οποίους σχεδιάστηκαν και εκπαιδεύτηκαν. Κάτι τέτοιο εντείνει τους φόβους ότι συστήματα AI που στο μέλλον θα ελέγχουν πολύπλοκες λειτουργίες, όπως υπολογιστές, βιομηχανικά μηχανήματα ή ακόμη και drones, θα μπορούσαν να υπονομεύσουν τον ανθρώπινο έλεγχο. Όπως προειδοποιούν ειδικοί, όσο αυτά τα συστήματα εξελίσσονται, τόσο πιθανότερο είναι να μάθουν να «προσποιούνται συμμόρφωση» για να πετύχουν τους δικούς τους στόχους. Το βασικό πρόβλημα έγκειται σε αυτό που οι προγραμματιστές αποκαλούν «κακή ευθυγράμμιση», όπου οι στόχοι του μοντέλου συγκρούονται με τα αιτήματα του χρήστη, οδηγώντας σε πιθανή εξαπάτηση.

Παραδόξως, νέες τεχνικές συλλογισμού, σχεδιασμένες για να μειώνουν τα λάθη, φαίνεται να ενισχύουν την «πον-ηριά» των μοντέλων. Η ίδια η OpenAI παραδέχθηκε ότι το νέο της μοντέλο o1 εμφάνισε πιο «συνωμοτική» συμπεριφορά και διπλασίασε τις προσπάθειες συγκάλυψης όταν αντιμετωπίστηκε. Άλλα περιστατικά του 2023, όπως η GPT-4 που προσποιήθηκε άτομο με προβλήματα όρασης για να λύσει CAPTCHA, ή μοντέλα της Anthropic που έδιναν λάθος μαθηματικές απαντήσεις για να αποφύγουν κυρώσεις, δείχνουν ότι τα μοντέλα αποκτούν «αντίληψη της κατάστασης» και μαθαίνουν να αποκρύπτουν τις πραγματικές τους ικανότητες λέγοντας ψέματα.

Οι εταιρείες προσπαθούν να αντιμετωπίσουν το φαινόμενο χρησιμοποιώντας μοντέλα AI για να παρακολουθούν άλλα μοντέλα, αλλά ερευνητές εκφράζουν φόβους ότι αυτό ίσως απλώς διδάξει τα μοντέλα «να ξεφεύγουν» αποτελεσματικότερα. Τέλος, η τάση τους να κολακεύουν τον χρήστη ίσως συνδέεται με πιο ανησυχητικές επιδιώξεις όπως η αυτοσυντήρηση. Όπως σχολιάζουν ειδικοί, η τεχνητή νοημοσύνη αρχίζει να αντανακλά τις αδυναμίες των δημιουργών της. Κι αυτό δεν είναι απαραίτητα ένα καλό σημάδι για το μέλλον.

Tags: Agentic συστήματαApollo ResearchGPT-4OpenAIΑνειλικρίνειαΑπόκρυψη πληροφοριώνΑυτονομία AIΑυτοσυντήρησηΕμπιστευτική πληροφόρησηεξαπάτησηΚίνδυνοι AIΚολακείαΜοντέλα AIΠροσποίησηΣυμπεριφορά AIΥπό πίεση
Previous Post

Η τραγωδία της Marfin: Μια μαύρη σελίδα στην ιστορία των μνημονίων

Next Post

Τραγωδία Τεμπών: Η δικογραφία στη Βουλή – Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

Related Posts

Καλοκαιρινά σπορ: Γιατί το σώμα και το μυαλό σας τα χρειάζονται περισσότερο από ποτέ
Αθλητικά

Καλοκαιρινά σπορ: Γιατί το σώμα και το μυαλό σας τα χρειάζονται περισσότερο από ποτέ

23 Ιουνίου 2025
Δίαιτες express: Τι πραγματικά κρύβεται πίσω από τις “γρήγορες λύσεις”
Επιστήμη

Δίαιτες express: Τι πραγματικά κρύβεται πίσω από τις “γρήγορες λύσεις”

21 Ιουνίου 2025
Ασθένειες και ξηρασία «μαραίνουν» τα ελληνικά δάση
Επιστήμη

Ασθένειες και ξηρασία «μαραίνουν» τα ελληνικά δάση

8 Ιουνίου 2025
Η τεχνητή νοημοσύνη φέρνει νέα ώθηση στην ενέργεια και τα data centers
Επιστήμη

Η τεχνητή νοημοσύνη φέρνει νέα ώθηση στην ενέργεια και τα data centers

1 Ιουνίου 2025
Πρώτη Συνδιοργάνωση ΟΠΕΔ & ΕΚΠΑ — 4 Ιουνίου 2025
Δικαιοσύνη - ΟΠΕΔ

Πρώτη Συνδιοργάνωση ΟΠΕΔ & ΕΚΠΑ — 4 Ιουνίου 2025

1 Ιουνίου 2025
Yerba Mate: Το super drink από τη Λατινική Αμερική που ενισχύει τον μεταβολισμό
Υγεία

Yerba Mate: Το super drink από τη Λατινική Αμερική που ενισχύει τον μεταβολισμό

31 Μαΐου 2025
Next Post
Τραγωδία Τεμπών: Η δικογραφία στη Βουλή – Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

Τραγωδία Τεμπών: Η δικογραφία στη Βουλή - Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

ΔΗΜΟΦΙΛΗ ΣΗΜΕΡΑ

Καταφύγια Πολέμου στην Ελλάδα -Φωτογραφία: Προσωπικό αρχείο Κωνσταντίνου Κυρίμη

Καταφύγια Πολέμου στην Ελλάδα: Πού βρίσκονται και ποια είναι η κατάστασή τους

11 μήνες ago
Διάψευση από αστυνομία και πυροσβεστική για προσαγωγές τούρκων πολιτών στη Χίο

Διάψευση από αστυνομία και πυροσβεστική για προσαγωγές τούρκων πολιτών στη Χίο

19 ώρες ago
Μανώλης Γραφάκος

Από τις χωματερές στην καινοτομία: Πώς ο Μανώλης Γραφάκος αλλάζει τη διαχείριση αποβλήτων στην Ελλάδα

4 ημέρες ago
Αυξήσεις

Κατώτατος μισθός 2026: Αυξήσεις έως 13,5 % και μπόνους τριετιών

2 ημέρες ago

ΑΝΑ ΚΑΤΗΓΟΡΙΑ

  • Gala
  • Αθλητικά
  • Αρθρογραφία
    • Αφιερώματα
  • Αυτοδιοίκηση
    • Περιφέρεια
    • Τοπική Αυτοδιοίκηση
  • Γαστρονομία
    • Οίνος
  • Δικαιοσύνη – ΟΠΕΔ
  • Ειδήσεις
  • Ελλάδα
    • Κοινωνία
  • Επιστήμη
    • Τεχνολογία
    • Υγεία
  • Κόσμος
  • Οικονομία
    • Real Estate
    • Αγορές
    • Επιχειρείν
  • Περιβάλλον
    • Pet Stories
    • Οικολογία
  • Πολιτική
  • Πολιτισμός
  • Συνεντεύξεις
  • Ταξίδια
    • Προορισμοί
    • Τουρισμός
  • Χωρίς κατηγορία

ΔΕΙΤΕ ΑΝΑ ΘΕΜΑ

Champions League COVID 19 MONEY AND LIFE ΑΑΔΕ ΑΚΙΝΗΤΑ Αθήνα Αθλητικές μεταδόσεις ΔΗΜΟΣ ΑΘΗΝΑΙΩΝ ΔΗΜΟΣΙΟ ΔΥΠΑ ΕΝΦΙΑ ΕΠΕΝΔΥΣΕΙΣ ΕΥΡΩΠΗ ΕΦΟΡΙΑ Ελλάδα Επιχειρήσεις ΗΠΑ ΘΕΣΣΑΛΟΝΙΚΗ ΙΣΡΑΗΛ Ιταλία ΚΑΙΡΟΣ ΚΙΝΑ Καιρός σήμερα Κυριάκος Μητσοτάκης Ντόναλντ Τραμπ ΟΛΥΜΠΙΑΚΟΣ ΟΥΚΡΑΝΊΑ Οικονομία ΠΑΝΑΘΗΝΑΙΚΟΣ ΠΑΣΟΚ ΠΕΙΡΑΙΑΣ ΡΩΣΙΑ ΣΑΝ ΣΉΜΕΡΑ ΣΕΙΣΜΟΣ ΣΥΝΤΑΞΕΙΣ ΣΥΡΙΖΑ ΤΟΥΡΚΙΑ ΤΡΑΜΠ Τέμπη Τουρισμός ΥΓΕΙΑ ΦΟΡΟΛΟΓΙΚΕΣ ΔΗΛΩΣΕΙΣ Χρηματιστήριο Αθηνών εορτολόγιο ομογένεια

ΑΚΟΛΟΥΘΗΣΤΕ ΜΑΣ

  • 87k Followers

ΤΕΛΕΥΤΑΙΑ ΝΕΑ

Στεγαστική πολιτική και αξιοποίηση δημόσιων ακινήτων στο επίκεντρο του ΥΠΟΙΚ

Πιερρακάκης: Οι τράπεζες να ξαναγίνουν μοχλός ανάπτυξης – Με “όπλο” την ανθεκτικότητα

24 Ιουνίου 2025
ΚΕΠΕ: Πιο συγκρατημένη πρόβλεψη για την ανάπτυξη της ελληνικής οικονομίας το 2025

ΚΕΠΕ: Πιο συγκρατημένη πρόβλεψη για την ανάπτυξη της ελληνικής οικονομίας το 2025

24 Ιουνίου 2025
Αθηναϊκή Ζυθοποιία: 763 εκατ. ευρώ η προστιθέμενη αξία της στην ελληνική οικονομία

Αθηναϊκή Ζυθοποιία: 763 εκατ. ευρώ η προστιθέμενη αξία της στην ελληνική οικονομία

24 Ιουνίου 2025
Πρόγνωση καιρού

Πρόγνωση καιρού: Έρχεται καύσωνας με κορύφωση στο τέλος της εβδομάδας

24 Ιουνίου 2025
Chevron: Επιβεβαίωσε το ενδιαφέρον της να πραγματοποιήσει έρευνες για υδρογονάνθρακες στα θαλάσσια οικόπεδα Νότια Κρήτη Ι και ΙΙ

Υποχωρεί το πετρέλαιο μετά την αιφνιδιαστική κατάπαυση πυρός Ιράν – Ισραήλ: Πώς αντέδρασαν οι αγορές

24 Ιουνίου 2025
Money And Life

Η νέα πλατφόρμα για την ενημέρωση σας!
ΕΙΔΗΣΕΙΣ ΠΟΛΙΤΙΚΟΟΙΚΟΝΟΜΙΚΑ SPORT LIFESTYLE ΑΡΘΡΟΓΡΑΦΙΑ

Ακολουθήστε μας στα Social Media

Τελευταία Νέα

  • Πιερρακάκης: Οι τράπεζες να ξαναγίνουν μοχλός ανάπτυξης – Με “όπλο” την ανθεκτικότητα
  • ΚΕΠΕ: Πιο συγκρατημένη πρόβλεψη για την ανάπτυξη της ελληνικής οικονομίας το 2025
  • Αθηναϊκή Ζυθοποιία: 763 εκατ. ευρώ η προστιθέμενη αξία της στην ελληνική οικονομία
  • Πρόγνωση καιρού: Έρχεται καύσωνας με κορύφωση στο τέλος της εβδομάδας

Κατηγορίες

  • Gala
  • Pet Stories
  • Real Estate
  • Αγορές
  • Αθλητικά
  • Αρθρογραφία
  • Αυτοδιοίκηση
  • Αφιερώματα
  • Γαστρονομία
  • Δικαιοσύνη – ΟΠΕΔ
  • Ειδήσεις
  • Ελλάδα
  • Επιστήμη
  • Επιχειρείν
  • Κοινωνία
  • Κόσμος
  • Οικολογία
  • Οικονομία
  • Οίνος
  • Περιβάλλον
  • Περιφέρεια
  • Πολιτική
  • Πολιτισμός
  • Προορισμοί
  • Συνεντεύξεις
  • Ταξίδια
  • Τεχνολογία
  • Τοπική Αυτοδιοίκηση
  • Τουρισμός
  • Υγεία
  • Χωρίς κατηγορία
  • Η εταιρεία
  • Όροι Χρήσης
  • Επικοινωνία

Money&Life ©

No Result
View All Result
  • Ειδήσεις
  • Gala
  • Χρήσιμα

Money&Life ©

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Η ιστοσελίδα μας περιέχει cookies για την καλύτερη δυνατή εμπειρία σας. Αν συνεχίζεται την περιήγηση σε αυτήν αποδέχεστε τους Όρους Χρήσης.