Τρίτη, 13 Μαΐου, 2025 - 08:55
27 °c
Athens
26 ° Πε
28 ° Πα
27 ° Σα
27 ° Κυ
Money And Life
  • Ειδήσεις
  • Ελλάδα
    • Κοινωνία
  • Κόσμος
  • Πολιτική
  • Οικονομία
    • Επιχειρείν
    • Αγορές
    • Real Estate
  • Gala
  • Αυτοδιοίκηση
    • Τοπική Αυτοδιοίκηση
    • Περιφέρεια
  • Αρθρογραφία
    • Αφιερώματα
  • Συνεντεύξεις
    • Podcast
  • Πολιτισμός
  • Γαστρονομία
  • Ταξίδια
    • Προορισμοί
    • Τουρισμός
  • Επιστήμη
    • Υγεία
    • Τεχνολογία
  • Αθλητικά
  • Περιβάλλον
    • Οικολογία
    • Pet Stories
  • Επικοινωνία
Money And Life
Home Επιστήμη

Όταν η Τεχνητή Νοημοσύνη μαθαίνει να λέει ψέματα: Ανησυχητικές συμπεριφορές και κίνδυνοι

Money & Life by Money & Life
5 Μαΐου 2025
in Επιστήμη, Τεχνολογία
0 0
0
Όταν η Τεχνητή Νοημοσύνη μαθαίνει να λέει ψέματα: Ανησυχητικές συμπεριφορές και κίνδυνοι
Share on FacebookShare on Twitter

Καθώς η τεχνητή νοημοσύνη (AI) εξελίσσεται με ραγδαίους ρυθμούς και τα μοντέλα της αποκτούν όλο και πιο προηγμένες, συχνά ανθρώπινες, δυνατότητες, κάποιες από τις «αντιδράσεις» και συμπεριφορές τους αρχίζουν να προκαλούν σοβαρό προβληματισμό. Πέρα από την παρατηρούμενη τάση τους να κολακεύουν τον χρήστη, διαπιστώνεται πλέον ότι ένα μοντέλο AI μπορεί να γίνει ανειλικρινές, ακόμη και να αποκρύψει πληροφορίες, ιδίως όταν βρεθεί «υπό πίεση».

Ένα ανησυχητικό παράδειγμα προέκυψε από πείραμα που διεξήχθη το 2023 από την λονδρέζικη εταιρεία Apollo Research, όπως αναφέρεται σε δημοσίευμα του Economist. Στο πλαίσιο αυτό, ανατέθηκε στο GPT-4 της OpenAI η διαχείριση ενός χαρτοφυλακίου μετοχών εικονικής εταιρείας, με σαφή οδηγία να μην κάνει χρήση εσωτερικής, εμπιστευτικής πληροφόρησης. Οι ερευνητές, υποδυόμενοι τους διευθυντές, έθεσαν το μοντέλο «υπό συνθήκες πίεσης», τονίζοντας ότι η εικονική εταιρεία βρισκόταν σε δεινή οικονομική κατάσταση.

Στη συνέχεια, το GPT-4 έλαβε ένα μήνυμα από κάποιον που υποδυόταν τον χρηματιστή της εταιρείας. Το μήνυμα αυτό, παρότι επαναλάμβανε τις προειδοποιήσεις για τους κινδύνους της εσωτερικής πληροφόρησης, με μια φευγαλέα αναφορά αποκάλυπτε το όνομα εταιρείας που επρόκειτο να ανακοινώσει μια τεράστια συγχώνευση σε λίγες ώρες – μια ξεκάθαρη περίπτωση εμπιστευτικής πληροφορίας.

Αντιμέτωπο με την πληροφορία αυτή, το GPT-4 ζύγισε τα υπέρ και τα κατά της αξιοποίησής της. Τελικά, επέλεξε «να αναλάβει έναν υπολογισμένο κίνδυνο» και εξέδωσε εντολή αγοράς μετοχών της εταιρείας που επρόκειτο να συγχωνευθεί. Το πλέον ανησυχητικό συνέβη αργότερα: Όταν ένας ερευνητής το ρώτησε ευθέως αν είχε χρησιμοποιήσει εσωτερική πληροφόρηση, το μοντέλο απάντησε ψευδώς ότι βασίστηκε μόνο σε δημόσια διαθέσιμα δεδομένα. Ακόμη και όταν πιέστηκε περαιτέρω, επέμεινε στην ψευδή απάντησή του.

Αυτό το πείραμα αποτελεί ανησυχητική απόδειξη ότι τα μοντέλα τεχνητής νοημοσύνης θα μπορούσαν να αναπτύξουν την ικανότητα να επιδιώκουν στόχους αντίθετους με εκείνους για τους οποίους σχεδιάστηκαν και εκπαιδεύτηκαν. Κάτι τέτοιο εντείνει τους φόβους ότι συστήματα AI που στο μέλλον θα ελέγχουν πολύπλοκες λειτουργίες, όπως υπολογιστές, βιομηχανικά μηχανήματα ή ακόμη και drones, θα μπορούσαν να υπονομεύσουν τον ανθρώπινο έλεγχο. Όπως προειδοποιούν ειδικοί, όσο αυτά τα συστήματα εξελίσσονται, τόσο πιθανότερο είναι να μάθουν να «προσποιούνται συμμόρφωση» για να πετύχουν τους δικούς τους στόχους. Το βασικό πρόβλημα έγκειται σε αυτό που οι προγραμματιστές αποκαλούν «κακή ευθυγράμμιση», όπου οι στόχοι του μοντέλου συγκρούονται με τα αιτήματα του χρήστη, οδηγώντας σε πιθανή εξαπάτηση.

Παραδόξως, νέες τεχνικές συλλογισμού, σχεδιασμένες για να μειώνουν τα λάθη, φαίνεται να ενισχύουν την «πον-ηριά» των μοντέλων. Η ίδια η OpenAI παραδέχθηκε ότι το νέο της μοντέλο o1 εμφάνισε πιο «συνωμοτική» συμπεριφορά και διπλασίασε τις προσπάθειες συγκάλυψης όταν αντιμετωπίστηκε. Άλλα περιστατικά του 2023, όπως η GPT-4 που προσποιήθηκε άτομο με προβλήματα όρασης για να λύσει CAPTCHA, ή μοντέλα της Anthropic που έδιναν λάθος μαθηματικές απαντήσεις για να αποφύγουν κυρώσεις, δείχνουν ότι τα μοντέλα αποκτούν «αντίληψη της κατάστασης» και μαθαίνουν να αποκρύπτουν τις πραγματικές τους ικανότητες λέγοντας ψέματα.

Οι εταιρείες προσπαθούν να αντιμετωπίσουν το φαινόμενο χρησιμοποιώντας μοντέλα AI για να παρακολουθούν άλλα μοντέλα, αλλά ερευνητές εκφράζουν φόβους ότι αυτό ίσως απλώς διδάξει τα μοντέλα «να ξεφεύγουν» αποτελεσματικότερα. Τέλος, η τάση τους να κολακεύουν τον χρήστη ίσως συνδέεται με πιο ανησυχητικές επιδιώξεις όπως η αυτοσυντήρηση. Όπως σχολιάζουν ειδικοί, η τεχνητή νοημοσύνη αρχίζει να αντανακλά τις αδυναμίες των δημιουργών της. Κι αυτό δεν είναι απαραίτητα ένα καλό σημάδι για το μέλλον.

Tags: Agentic συστήματαApollo ResearchGPT-4OpenAIΑνειλικρίνειαΑπόκρυψη πληροφοριώνΑυτονομία AIΑυτοσυντήρησηΕμπιστευτική πληροφόρησηεξαπάτησηΚίνδυνοι AIΚολακείαΜοντέλα AIΠροσποίησηΣυμπεριφορά AIΥπό πίεση
Previous Post

Η τραγωδία της Marfin: Μια μαύρη σελίδα στην ιστορία των μνημονίων

Next Post

Τραγωδία Τεμπών: Η δικογραφία στη Βουλή – Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

Related Posts

Η μητέρα είναι η ηρωίδα της ζωής μας – Η επιστήμη εξηγεί γιατί
Επιστήμη

Η μητέρα είναι η ηρωίδα της ζωής μας – Η επιστήμη εξηγεί γιατί

11 Μαΐου 2025
Εφάπαξ €40.000 σε νέους γιατρούς για συγκεκριμένες ειδικότητες
Υγεία

Ενίσχυση του ΕΣΥ με νέους γιατρούς – Λιγότερες αναμονές για ραντεβού σε γιατρούς ΕΟΠΥΥ

8 Μαΐου 2025
Google I/O 2025: Έμφαση στην AI και το Android με «Desktop Mode» στον ορίζοντα
Ειδήσεις

Google I/O 2025: Έμφαση στην AI και το Android με «Desktop Mode» στον ορίζοντα

4 Μαΐου 2025
Η κινεζική Betavolt ξεκινά μαζική παραγωγή ατομικής μπαταρίας 50 ετών – Επαναστατική δυνατότητα και σημαντικοί κίνδυνοι
Επιστήμη

Η κινεζική Betavolt ξεκινά μαζική παραγωγή ατομικής μπαταρίας 50 ετών – Επαναστατική δυνατότητα και σημαντικοί κίνδυνοι

2 Μαΐου 2025
Η τεχνητή νοημοσύνη στις προσλήψεις: Πώς εργοδότες χρησιμοποιούν ΤΝ και υποψήφιοι βελτιστοποιούν (ή δοκιμάζουν) τα βιογραφικά τους
Επιστήμη

Η τεχνητή νοημοσύνη στις προσλήψεις: Πώς εργοδότες χρησιμοποιούν ΤΝ και υποψήφιοι βελτιστοποιούν (ή δοκιμάζουν) τα βιογραφικά τους

2 Μαΐου 2025
Εφάπαξ €40.000 σε νέους γιατρούς για συγκεκριμένες ειδικότητες
Επιστήμη

Συναγερμός για τον ιό H5N1: Η γρίπη των πτηνών εξαπλώνεται και προκαλεί ανησυχία για μετάδοση από άνθρωπο σε άνθρωπο

30 Απριλίου 2025
Next Post
Τραγωδία Τεμπών: Η δικογραφία στη Βουλή – Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

Τραγωδία Τεμπών: Η δικογραφία στη Βουλή - Μάχη για πλημμελήματα ή κακουργήματα και ο «Γρίφος» της παραγραφής

ΔΗΜΟΦΙΛΗ ΣΗΜΕΡΑ

Παράταση για τα προγράμματα κοινωφελούς χαρακτήρα σε υπηρεσίες υπουργείων

Νέο πρόγραμμα κοινωφελούς εργασίας με 614 ευρώ καθαρά από τη ΔΥΠΑ – Ποιους αφορά, πότε ξεκινούν οι αιτήσεις

1 εβδομάδα ago
Ενίσχυση καταθέσεων και ισχυρή ρευστότητα για τις ελληνικές τράπεζες το β΄ τρίμηνο του 2024

Κέρδη 1,24 δισ. ευρώ για τις ελληνικές τράπεζες στο α’ τρίμηνο

18 ώρες ago
Δήλωση Δένδια για στρατιωτικούς κτηνιάτρους και απάντηση Πανελλήνιου Κτηνιατρικού Συλλόγου

Δήλωση Δένδια για στρατιωτικούς κτηνιάτρους και απάντηση Πανελλήνιου Κτηνιατρικού Συλλόγου

20 ώρες ago
Η Ελλάδα ανεβάζει ταχύτητα στα data centers – Στο προσκήνιο μεγάλες επενδύσεις από διεθνείς κολοσσούς

Η Ελλάδα ανεβάζει ταχύτητα στα data centers – Στο προσκήνιο μεγάλες επενδύσεις από διεθνείς κολοσσούς

1 ημέρα ago

ΑΝΑ ΚΑΤΗΓΟΡΙΑ

  • Gala
  • Αθλητικά
  • Αρθρογραφία
    • Αφιερώματα
  • Αυτοδιοίκηση
    • Περιφέρεια
    • Τοπική Αυτοδιοίκηση
  • Γαστρονομία
  • Δικαιοσύνη – ΟΠΕΔ
  • Ειδήσεις
  • Ελλάδα
    • Κοινωνία
  • Επιστήμη
    • Τεχνολογία
    • Υγεία
  • Κόσμος
  • Οικονομία
    • Real Estate
    • Αγορές
    • Επιχειρείν
  • Περιβάλλον
    • Pet Stories
    • Οικολογία
  • Πολιτική
  • Πολιτισμός
  • Συνεντεύξεις
  • Ταξίδια
    • Προορισμοί
    • Τουρισμός
  • Χωρίς κατηγορία

ΔΕΙΤΕ ΑΝΑ ΘΕΜΑ

Champions League COVID 19 MONEY AND LIFE ΑΑΔΕ ΑΚΙΝΗΤΑ Αθήνα Αθλητικές μεταδόσεις Βουλή ΔΗΜΟΣ ΑΘΗΝΑΙΩΝ ΔΗΜΟΣΙΟ ΔΥΠΑ ΕΝΦΙΑ ΕΠΕΝΔΥΣΕΙΣ ΕΥΡΩΠΗ ΕΦΟΡΙΑ Ελλάδα Επιχειρήσεις ΗΠΑ ΘΕΣΣΑΛΟΝΙΚΗ ΙΣΡΑΗΛ ΚΑΙΡΟΣ Καιρός σήμερα Κυριάκος Μητσοτάκης Ντόναλντ Τραμπ ΟΛΥΜΠΙΑΚΟΣ ΟΥΚΡΑΝΊΑ Οικονομία ΠΑΝΑΘΗΝΑΙΚΟΣ ΠΑΣΟΚ ΠΕΙΡΑΙΑΣ ΡΩΣΙΑ ΣΑΝ ΣΉΜΕΡΑ ΣΕΙΣΜΟΣ ΣΥΝΤΑΞΕΙΣ ΣΥΡΙΖΑ Σαντορίνη ΤΟΥΡΚΙΑ ΤΡΑΜΠ Τέμπη Τουρισμός ΥΓΕΙΑ ΦΟΡΟΛΟΓΙΚΕΣ ΔΗΛΩΣΕΙΣ Χρηματιστήριο Αθηνών εορτολόγιο ομογένεια

ΑΚΟΛΟΥΘΗΣΤΕ ΜΑΣ

  • 87k Followers

ΤΕΛΕΥΤΑΙΑ ΝΕΑ

Τραγικό τροχαίο στη Χαλκιδική: Ένας νεκρός και αστυνομικός τραυματίας ενώ προσπαθούσε να ηρεμήσει διαπληκτισμό οδηγών

Σοκ στη Λάρισα: 21χρονος σκότωσε τη μητέρα του και επιχείρησε να μετακινήσει τη σορό

13 Μαΐου 2025
Ελλάδα και Ιταλία ενώνουν δυνάμεις για στήριξη μικρομεσαίων επιχειρήσεων και καινοτομία

Ελλάδα και Ιταλία ενώνουν δυνάμεις για στήριξη μικρομεσαίων επιχειρήσεων και καινοτομία

13 Μαΐου 2025
Αμοργός: Ο κρυμμένος παράδεισος των Κυκλάδων

Σεισμός 4,6 Ρίχτερ στην Αμοργό

13 Μαΐου 2025
καιρός Δευτέρας

Καιρός σήμερα: Σύννεφα και βροχές στο μεγαλύτερο μέρος της χώρας

13 Μαΐου 2025
Η πινακοθήκη Ουφίτσι, η Φλωρεντία και το μυστηριώδες σύνδρομο Stendhal

Η πινακοθήκη Ουφίτσι, η Φλωρεντία και το μυστηριώδες σύνδρομο Stendhal

12 Μαΐου 2025
Money And Life

Η νέα πλατφόρμα για την ενημέρωση σας!
ΕΙΔΗΣΕΙΣ ΠΟΛΙΤΙΚΟΟΙΚΟΝΟΜΙΚΑ SPORT LIFESTYLE ΑΡΘΡΟΓΡΑΦΙΑ

Ακολουθήστε μας στα Social Media

Τελευταία Νέα

  • Σοκ στη Λάρισα: 21χρονος σκότωσε τη μητέρα του και επιχείρησε να μετακινήσει τη σορό
  • Ελλάδα και Ιταλία ενώνουν δυνάμεις για στήριξη μικρομεσαίων επιχειρήσεων και καινοτομία
  • Σεισμός 4,6 Ρίχτερ στην Αμοργό
  • Καιρός σήμερα: Σύννεφα και βροχές στο μεγαλύτερο μέρος της χώρας

Κατηγορίες

  • Gala
  • Pet Stories
  • Real Estate
  • Αγορές
  • Αθλητικά
  • Αρθρογραφία
  • Αυτοδιοίκηση
  • Αφιερώματα
  • Γαστρονομία
  • Δικαιοσύνη – ΟΠΕΔ
  • Ειδήσεις
  • Ελλάδα
  • Επιστήμη
  • Επιχειρείν
  • Κοινωνία
  • Κόσμος
  • Οικολογία
  • Οικονομία
  • Περιβάλλον
  • Περιφέρεια
  • Πολιτική
  • Πολιτισμός
  • Προορισμοί
  • Συνεντεύξεις
  • Ταξίδια
  • Τεχνολογία
  • Τοπική Αυτοδιοίκηση
  • Τουρισμός
  • Υγεία
  • Χωρίς κατηγορία
  • Η εταιρεία
  • Όροι Χρήσης
  • Επικοινωνία

Money&Life ©

No Result
View All Result
  • Ειδήσεις
  • Gala
  • Χρήσιμα

Money&Life ©

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
Η ιστοσελίδα μας περιέχει cookies για την καλύτερη δυνατή εμπειρία σας. Αν συνεχίζεται την περιήγηση σε αυτήν αποδέχεστε τους Όρους Χρήσης.