Με τίτλο «Measuring the performance of our models on real-world tasks», το OpenAI αξιολόγησε 44 επαγγέλματα από τους εννέα πιο κερδοφόρους κλάδους της οικονομίας των ΗΠΑ και διαπίστωσε πως τα κορυφαία μοντέλα τεχνητής νοημοσύνης σήμερα πλησιάζουν ήδη την ποιότητα εργασίας που παράγουν επαγγελματίες του κλάδου.

«Η αποστολή μας είναι να διασφαλίσουμε ότι η τεχνητή γενική νοημοσύνη (AGI) θα ωφελήσει ολόκληρη την ανθρωπότητα» αναφέρει η εταιρεία OpenAI. Στο πλαίσιο αυτής της αποστολής παρουσιάστηκε το GDPval: μια νέα αξιολόγηση σχεδιασμένη για να βοηθάει στην παρακολούθηση της απόδοσης των μοντέλων ΑΙ και άλλων μοντέλων σε πραγματικές εργασίες.

Το τεστ ονομάστηκε έτσι επειδή τα 44 επαγγέλματα επιλέχθηκαν αφορούν τις 9 βιομηχανίες με τη μέγιστη συμβολή στο αμερικανικό ΑΕΠ (GDP).

Από τα μοντέλα που εξετάστηκαν (GPT‑4o, o4-mini, OpenAI o3, GPT‑5, Claude Opus 4.1, Gemini 2.5 Pro και Grok 4), η OpenAI παραδέχεται ότι το Claude Opus 4.1 είχε γενικά τις καλύτερες επιδόσεις, ειδικά στη μορφοποίηση εγγράφων, αν και το ChatGPT-5 αρίστευσε στην ακρίβεια, όπως για παράδειγμα στην εύρεση πληροφοριών.

Η έκθεση διαπιστώνει επίσης ότι, σε γενικές γραμμές, οι επιδόσεις των μοντέλων βελτιώνονται γραμμικά και έχουν υπερδιπλασιαστεί από την άνοιξη του 2024, όταν παρουσιάστηκε το ChatGPY-4o.

Οι δουλειές που είναι πιο επιρρεπείς στην αυτοματοποίηση

Διευθυντές ιατρικών και υγειονομικών υπηρεσιών

Επόπτες αστυνομικών και ντετέκτιβ

Ελεγκτές κανονιστικής συμμόρφωσης

Δικηγόροι

Λογιστές και ελεγκτές

Υπάλληλοι υποδοχής (concierges)

Επόπτες πωλήσεων λιανεμπορίου

Μοντέρ κινηματογράφου και βίντεο

Πωλητές χρηματοοικονομικών προϊόντων, μετοχών και εμπορευμάτων

Φαρμακοποιοί

Επόπτες παραγωγής και λειτουργιών

Διευθυντές διοικητικών υπηρεσιών

Αναλυτές ειδήσεων, ρεπόρτερ και δημοσιογράφοι

Υπάλληλοι γκισέ και ενοικιάσεων

Διευθυντές συστημάτων πληροφορικής

Εργαζόμενοι σε χώρους αναψυχής

Γενικοί διευθυντές λειτουργιών

Προγραμματιστές λογισμικού

Ιδιωτικοί ντετέκτιβ και ερευνητές

Αναλυτές επενδύσεων

Παραγωγοί και σκηνοθέτες

Επόπτες πωλήσεων (εκτός λιανεμπορίου)

Αγοραστές και υπεύθυνοι προμηθειών

Διευθυντές πωλήσεων

Νοσηλευτές πρακτικής (nurse practitioners)

Υπάλληλοι αποθήκης, παραλαβών και απογραφών

Επόπτες γραφείων και διοικητικής υποστήριξης

Προσωπικοί χρηματοοικονομικοί σύμβουλοι

Μεσίτες ακινήτων

Πράκτορες πωλήσεων ακινήτων

Τεχνικοί ήχου και βίντεο

Διευθυντές χρηματοοικονομικών υπηρεσιών

Κοινωνικοί λειτουργοί παιδιών, οικογένειας και σχολείων

Επόπτες μη λιανικών πωλήσεων

Υπάλληλοι παραγγελιών

Επόπτες μηχανικών και τεχνικών υπηρεσιών

Εγγεγραμμένοι νοσηλευτές

Διευθυντές πληροφοριακών συστημάτων

Ειδικοί διαχείρισης έργων

Βιομηχανικοί μηχανικοί

Μηχανολόγοι μηχανικοί

Εκπρόσωποι εξυπηρέτησης πελατών

Ο διευθύνων σύμβουλος της OpenAI Σαμ Άλτμαν έχει παραδεχτεί ότι η ΑΙ μπορεί να αντικαταστήσει τους ανθρώπους σε κάποια επαγγέλματα.

Η έκθεση ωστόσο εκτιμά ότι η μετάβαση δεν θα είναι τόσο ραγδαία, επισημαίνοντας ότι «οι καινοτόμες τεχνολογίες, από το Διαδίκτυο έως τα smartphone, χρειάζονται περισσότερο από μια δεκαετία από τη σύλληψή τους για να περάσουν σε ευρεία εφαρμογή.

Πιο ασφαλείς μπορούν αντίθετα να νιώθουν οι χειριστές βαρέων μηχανημάτων και σκαφών, οι οικιακοί βοηθοί, οι τεχνίτες στεγών, οι μασέρ και οι λαντζέρηδες.

Με άλλα λόγια, τα χαμηλόμισθα χειρωνακτικά επαγγέλματα κινδυνεύουν λιγότερο από όσα απαιτούν υψηλή εξειδίκευση.