Κυριακή, 8 Φεβρουαρίου, 2026 - 23:57
Money And Life
  • Ειδήσεις
  • Ελλάδα
    • Κοινωνία
  • Κόσμος
  • Πολιτική
  • Οικονομία
    • Επιχειρείν
    • Αγορές
    • Real Estate
  • LIFESTYLE
  • Αυτοδιοίκηση
    • Τοπική Αυτοδιοίκηση
    • Περιφέρεια
  • Αρθρογραφία
    • Αφιερώματα
  • Συνεντεύξεις
    • Podcast
  • Πολιτισμός
  • Γαστρονομία
  • Ταξίδια
    • Προορισμοί
    • Τουρισμός
  • Επιστήμη
    • Υγεία
    • Τεχνολογία
  • Αθλητικά
  • Περιβάλλον
    • Οικολογία
    • Pet Stories
  • Επικοινωνία
Money And Life
Home Επιστήμη

Όταν η Τεχνητή Νοημοσύνη μαθαίνει να λέει ψέματα: Ανησυχητικές συμπεριφορές και κίνδυνοι

Money & Life by Money & Life
5 Μαΐου 2025
in Επιστήμη, Τεχνολογία
0 0
0
Όταν η Τεχνητή Νοημοσύνη μαθαίνει να λέει ψέματα: Ανησυχητικές συμπεριφορές και κίνδυνοι
Share on FacebookShare on Twitter

Καθώς η τεχνητή νοημοσύνη (AI) εξελίσσεται με ραγδαίους ρυθμούς και τα μοντέλα της αποκτούν όλο και πιο προηγμένες, συχνά ανθρώπινες, δυνατότητες, κάποιες από τις «αντιδράσεις» και συμπεριφορές τους αρχίζουν να προκαλούν σοβαρό προβληματισμό. Πέρα από την παρατηρούμενη τάση τους να κολακεύουν τον χρήστη, διαπιστώνεται πλέον ότι ένα μοντέλο AI μπορεί να γίνει ανειλικρινές, ακόμη και να αποκρύψει πληροφορίες, ιδίως όταν βρεθεί «υπό πίεση».

Ένα ανησυχητικό παράδειγμα προέκυψε από πείραμα που διεξήχθη το 2023 από την λονδρέζικη εταιρεία Apollo Research, όπως αναφέρεται σε δημοσίευμα του Economist. Στο πλαίσιο αυτό, ανατέθηκε στο GPT-4 της OpenAI η διαχείριση ενός χαρτοφυλακίου μετοχών εικονικής εταιρείας, με σαφή οδηγία να μην κάνει χρήση εσωτερικής, εμπιστευτικής πληροφόρησης. Οι ερευνητές, υποδυόμενοι τους διευθυντές, έθεσαν το μοντέλο «υπό συνθήκες πίεσης», τονίζοντας ότι η εικονική εταιρεία βρισκόταν σε δεινή οικονομική κατάσταση.

Στη συνέχεια, το GPT-4 έλαβε ένα μήνυμα από κάποιον που υποδυόταν τον χρηματιστή της εταιρείας. Το μήνυμα αυτό, παρότι επαναλάμβανε τις προειδοποιήσεις για τους κινδύνους της εσωτερικής πληροφόρησης, με μια φευγαλέα αναφορά αποκάλυπτε το όνομα εταιρείας που επρόκειτο να ανακοινώσει μια τεράστια συγχώνευση σε λίγες ώρες – μια ξεκάθαρη περίπτωση εμπιστευτικής πληροφορίας.

Αντιμέτωπο με την πληροφορία αυτή, το GPT-4 ζύγισε τα υπέρ και τα κατά της αξιοποίησής της. Τελικά, επέλεξε «να αναλάβει έναν υπολογισμένο κίνδυνο» και εξέδωσε εντολή αγοράς μετοχών της εταιρείας που επρόκειτο να συγχωνευθεί. Το πλέον ανησυχητικό συνέβη αργότερα: Όταν ένας ερευνητής το ρώτησε ευθέως αν είχε χρησιμοποιήσει εσωτερική πληροφόρηση, το μοντέλο απάντησε ψευδώς ότι βασίστηκε μόνο σε δημόσια διαθέσιμα δεδομένα. Ακόμη και όταν πιέστηκε περαιτέρω, επέμεινε στην ψευδή απάντησή του.

Αυτό το πείραμα αποτελεί ανησυχητική απόδειξη ότι τα μοντέλα τεχνητής νοημοσύνης θα μπορούσαν να αναπτύξουν την ικανότητα να επιδιώκουν στόχους αντίθετους με εκείνους για τους οποίους σχεδιάστηκαν και εκπαιδεύτηκαν. Κάτι τέτοιο εντείνει τους φόβους ότι συστήματα AI που στο μέλλον θα ελέγχουν πολύπλοκες λειτουργίες, όπως υπολογιστές, βιομηχανικά μηχανήματα ή ακόμη και drones, θα μπορούσαν να υπονομεύσουν τον ανθρώπινο έλεγχο. Όπως προειδοποιούν ειδικοί, όσο αυτά τα συστήματα εξελίσσονται, τόσο πιθανότερο είναι να μάθουν να «προσποιούνται συμμόρφωση» για να πετύχουν τους δικούς τους στόχους. Το βασικό πρόβλημα έγκειται σε αυτό που οι προγραμματιστές αποκαλούν «κακή ευθυγράμμιση», όπου οι στόχοι του μοντέλου συγκρούονται με τα αιτήματα του χρήστη, οδηγώντας σε πιθανή εξαπάτηση.

Παραδόξως, νέες τεχνικές συλλογισμού, σχεδιασμένες για να μειώνουν τα λάθη, φαίνεται να ενισχύουν την «πον-ηριά» των μοντέλων. Η ίδια η OpenAI παραδέχθηκε ότι το νέο της μοντέλο o1 εμφάνισε πιο «συνωμοτική» συμπεριφορά και διπλασίασε τις προσπάθειες συγκάλυψης όταν αντιμετωπίστηκε. Άλλα περιστατικά του 2023, όπως η GPT-4 που προσποιήθηκε άτομο με προβλήματα όρασης για να λύσει CAPTCHA, ή μοντέλα της Anthropic που έδιναν λάθος μαθηματικές απαντήσεις για να αποφύγουν κυρώσεις, δείχνουν ότι τα μοντέλα αποκτούν «αντίληψη της κατάστασης» και μαθαίνουν να αποκρύπτουν τις πραγματικές τους ικανότητες λέγοντας ψέματα.

Οι εταιρείες προσπαθούν να αντιμετωπίσουν το φαινόμενο χρησιμοποιώντας μοντέλα AI για να παρακολουθούν άλλα μοντέλα, αλλά ερευνητές εκφράζουν φόβους ότι αυτό ίσως απλώς διδάξει τα μοντέλα «να ξεφεύγουν» αποτελεσματικότερα. Τέλος, η τάση τους να κολακεύουν τον χρήστη ίσως συνδέεται με πιο ανησυχητικές επιδιώξεις όπως η αυτοσυντήρηση. Όπως σχολιάζουν ειδικοί, η τεχνητή νοημοσύνη αρχίζει να αντανακλά τις αδυναμίες των δημιουργών της. Κι αυτό δεν είναι απαραίτητα ένα καλό σημάδι για το μέλλον.

Tags: Agentic συστήματαApollo ResearchGPT-4OpenAIΑνειλικρίνειαΑπόκρυψη πληροφοριώνΑυτονομία AIΑυτοσυντήρησηΕμπιστευτική πληροφόρησηεξαπάτησηΚίνδυνοι AIΚολακείαΜοντέλα AIΠροσποίησηΣυμπεριφορά AIΥπό πίεση
Previous Post

Η τραγωδία της Marfin: Μια μαύρη σελίδα στην ιστορία των μνημονίων

Next Post

Τραγωδία Τεμπών: Η δικογραφία στη Βουλή – Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

Related Posts

Social media: Γιατί κάποιοι άνθρωποι έχουν τόσους πολλούς followers – Οι ψυχολόγοι απαντούν
Επιστήμη

Social media: Γιατί κάποιοι άνθρωποι έχουν τόσους πολλούς followers – Οι ψυχολόγοι απαντούν

6 Φεβρουαρίου 2026
Γιγαντιαίες δομές στον μανδύα της Γης ελέγχουν το μαγνητικό πεδίο: Νέα επιστημονική ανακάλυψη
Επιστήμη

Γιγαντιαίες δομές στον μανδύα της Γης ελέγχουν το μαγνητικό πεδίο: Νέα επιστημονική ανακάλυψη

4 Φεβρουαρίου 2026
Ποτά χωρίς αλκοόλ: Πόσο «αθώα» είναι πραγματικά
Επιστήμη

Ποτά χωρίς αλκοόλ: Πόσο «αθώα» είναι πραγματικά

3 Φεβρουαρίου 2026
Εκτός Παγκόσμιου Οργανισμού Υγείας οι ΗΠΑ: Οι κατηγορίες Τραμπ και το μέλλον της διεθνούς υγείας
Ειδήσεις

Εκτός Παγκόσμιου Οργανισμού Υγείας οι ΗΠΑ: Οι κατηγορίες Τραμπ και το μέλλον της διεθνούς υγείας

25 Ιανουαρίου 2026
GSK Ελλάδος: Μια διαφορετική παρουσία στην κορυφή της φαρμακευτικής αγοράς
Επιστήμη

GSK Ελλάδος: Μια διαφορετική παρουσία στην κορυφή της φαρμακευτικής αγοράς

24 Ιανουαρίου 2026
Πότε η Γη θα πάψει να φιλοξενεί ζωή: Απάντηση σε ένα από τα πιο θεμελιώδη ερωτήματα της ανθρωπότητας
Επιστήμη

Πότε η Γη θα πάψει να φιλοξενεί ζωή: Απάντηση σε ένα από τα πιο θεμελιώδη ερωτήματα της ανθρωπότητας

11 Ιανουαρίου 2026
Next Post
Τραγωδία Τεμπών: Η δικογραφία στη Βουλή – Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

Τραγωδία Τεμπών: Η δικογραφία στη Βουλή - Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

ΔΗΜΟΦΙΛΗ ΣΗΜΕΡΑ

SAFE

Ευρωπαϊκή Άμυνα: Στα σκαριά νέο «πακέτο-μαμούθ» μετά την εξάντληση των 150 δισ. ευρώ

14 ώρες ago
Ποιοι γνωστοί πολιτικοί δεν έκαναν στρατιωτική θητεία

Ποιοι γνωστοί πολιτικοί δεν έκαναν στρατιωτική θητεία

2 έτη ago
Καιρός το Σαββατοκύριακο

Άστατος καιρός με «δύο πρόσωπα» την Κυριακή: Πού θα βρέξει και πού θα πέσουν χιόνια

16 ώρες ago
εφορία

Δημοσιονομικός «αέρας» έως 2,5 δισ. ευρώ για φοροελαφρύνσεις – Ποιες παρεμβάσεις εξετάζει το οικονομικό επιτελείο

11 μήνες ago

ΑΝΑ ΚΑΤΗΓΟΡΙΑ

  • LIFESTYLE
  • Αθλητικά
  • Αρθρογραφία
    • Αφιερώματα
  • Αυτοδιοίκηση
    • Περιφέρεια
    • Τοπική Αυτοδιοίκηση
  • Γαστρονομία
    • Οίνος
  • Δικαιοσύνη – ΟΠΕΔ
  • Ειδήσεις
  • Ελλάδα
    • Κοινωνία
  • Επιστήμη
    • Τεχνολογία
    • Υγεία
  • Κόσμος
  • Οικονομία
    • Real Estate
    • Αγορές
    • Επιχειρείν
  • Περιβάλλον
    • Pet Stories
    • Οικολογία
  • Πολιτική
  • Πολιτισμός
  • Συνεντεύξεις
  • Ταξίδια
    • Προορισμοί
    • Τουρισμός
  • Χωρίς κατηγορία

ΔΕΙΤΕ ΑΝΑ ΘΕΜΑ

Champions League ΑΑΔΕ ΑΚΙΝΗΤΑ Αθήνα Αθλητικές μεταδόσεις ΔΗΜΟΣ ΑΘΗΝΑΙΩΝ ΔΗΜΟΣΙΟ ΔΥΠΑ ΕΝΦΙΑ ΕΠΕΝΔΥΣΕΙΣ ΕΥΡΩΠΑΪΚΗ ΕΝΩΣΗ ΕΥΡΩΠΗ ΕΦΟΡΙΑ Ελλάδα Επιχειρήσεις ΗΠΑ ΘΕΣΣΑΛΟΝΙΚΗ ΙΣΡΑΗΛ ΚΑΙΡΟΣ ΚΑΚΟΚΑΙΡΙΑ ΚΙΝΑ Καιρός σήμερα Κυριάκος Μητσοτάκης ΜΗΤΣΟΤΑΚΗΣ Ντόναλντ Τραμπ ΟΛΥΜΠΙΑΚΟΣ ΟΥΚΡΑΝΊΑ Οικονομία ΠΑΝΑΘΗΝΑΙΚΟΣ ΠΑΣΟΚ ΠΕΙΡΑΙΑΣ Πρόγνωση καιρού ΡΩΣΙΑ ΣΑΝ ΣΉΜΕΡΑ ΣΕΙΣΜΟΣ ΣΥΝΤΑΞΕΙΣ ΣΥΡΙΖΑ ΤΟΥΡΚΙΑ ΤΡΑΜΠ Τέμπη Τουρισμός ΥΓΕΙΑ ΦΟΡΟΛΟΓΙΚΕΣ ΔΗΛΩΣΕΙΣ ΧΡΙΣΤΟΥΓΕΝΝΑ Χρηματιστήριο Αθηνών

ΑΚΟΛΟΥΘΗΣΤΕ ΜΑΣ

  • 87k Followers

ΤΕΛΕΥΤΑΙΑ ΝΕΑ

The Revery: Το «πολυτελές σαφάρι» σε έναν απομονωμένο κόλπο της δυτικής Κρήτης

The Revery: Το «πολυτελές σαφάρι» σε έναν απομονωμένο κόλπο της δυτικής Κρήτης

8 Φεβρουαρίου 2026
SAFE

Ευρωπαϊκή Άμυνα: Στα σκαριά νέο «πακέτο-μαμούθ» μετά την εξάντληση των 150 δισ. ευρώ

8 Φεβρουαρίου 2026
Καιρός το Σαββατοκύριακο

Άστατος καιρός με «δύο πρόσωπα» την Κυριακή: Πού θα βρέξει και πού θα πέσουν χιόνια

8 Φεβρουαρίου 2026
Οι Κυρίες του Ρεμπέτικου

«Οι Κυρίες του Ρεμπέτικου»: Το συγκινητικό οδοιπορικό της ΕΡΤ στις φωνές που σφράγισαν την ιστορία

7 Φεβρουαρίου 2026
Νέες εισφορές ΕΦΚΑ: Τι πληρώνουν από 1η Ιανουαρίου 1,4 εκατομμύρια επαγγελματίες και αγρότες

Νέες εισφορές ΕΦΚΑ: Τι πληρώνουν από 1η Ιανουαρίου 1,4 εκατομμύρια επαγγελματίες και αγρότες

7 Φεβρουαρίου 2026
Money And Life

Η νέα πλατφόρμα για την ενημέρωση σας!
ΕΙΔΗΣΕΙΣ ΠΟΛΙΤΙΚΟΟΙΚΟΝΟΜΙΚΑ SPORT LIFESTYLE ΑΡΘΡΟΓΡΑΦΙΑ

Ακολουθήστε μας στα Social Media

Τελευταία Νέα

  • The Revery: Το «πολυτελές σαφάρι» σε έναν απομονωμένο κόλπο της δυτικής Κρήτης
  • Ευρωπαϊκή Άμυνα: Στα σκαριά νέο «πακέτο-μαμούθ» μετά την εξάντληση των 150 δισ. ευρώ
  • Άστατος καιρός με «δύο πρόσωπα» την Κυριακή: Πού θα βρέξει και πού θα πέσουν χιόνια
  • «Οι Κυρίες του Ρεμπέτικου»: Το συγκινητικό οδοιπορικό της ΕΡΤ στις φωνές που σφράγισαν την ιστορία

Κατηγορίες

  • LIFESTYLE
  • Pet Stories
  • Real Estate
  • Αγορές
  • Αθλητικά
  • Αρθρογραφία
  • Αυτοδιοίκηση
  • Αφιερώματα
  • Γαστρονομία
  • Δικαιοσύνη – ΟΠΕΔ
  • Ειδήσεις
  • Ελλάδα
  • Επιστήμη
  • Επιχειρείν
  • Κοινωνία
  • Κόσμος
  • Οικολογία
  • Οικονομία
  • Οίνος
  • Περιβάλλον
  • Περιφέρεια
  • Πολιτική
  • Πολιτισμός
  • Προορισμοί
  • Συνεντεύξεις
  • Ταξίδια
  • Τεχνολογία
  • Τοπική Αυτοδιοίκηση
  • Τουρισμός
  • Υγεία
  • Χωρίς κατηγορία
  • Η εταιρεία
  • Όροι Χρήσης
  • Επικοινωνία

Money&Life ©

No Result
View All Result
  • Ειδήσεις
  • Ελλάδα
  • Κοινωνία
  • Κόσμος
  • Πολιτική
  • Οικονομία
  • Επιχειρείν
  • Real Estate
  • Αγορές
  • Αυτοδιοίκηση
  • Τοπική Αυτοδιοίκηση
  • Περιφέρεια
  • LIFESTYLE
  • Αρθρογραφία
  • Συνεντεύξεις
  • Πολιτισμός
  • Προορισμοί
  • Τουρισμός
  • Υγεία
  • Τεχνολογία
  • Αθλητικά
  • Περιβάλλον

Money&Life ©

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Η ιστοσελίδα μας περιέχει cookies για την καλύτερη δυνατή εμπειρία σας. Αν συνεχίζεται την περιήγηση σε αυτήν αποδέχεστε τους Όρους Χρήσης.