GPT-5-Codex: Ο πράκτορας της OpenAI που προγραμματίζει και αξιολογεί κώδικα

  • Το GPT-5-Codex είναι μια παραλλαγή του GPT-5 βελτιστοποιημένη για κωδικοποίηση που βασίζεται σε πράκτορες στο Codex.
  • Προσαρμόζει δυναμικά τον χρόνο σκέψης από δευτερόλεπτα σε πάνω από επτά ώρες ανάλογα με την εργασία.
  • Βελτιώνει την ανασκόπηση κώδικα και την ανίχνευση κρίσιμων σφαλμάτων, με λιγότερα εσφαλμένα σχόλια.
  • Διαθέσιμο σε Plus, Pro, Business, Edu και Enterprise. Το API θα κυκλοφορήσει αργότερα.

Γενική εικόνα του Κώδικα GPT-5

OpenAI έχει παρουσιάσει GPT-5-Κώδικας, μια παραλλαγή του γενικευμένου μοντέλου του που επικεντρώνεται σε εργασίες προγραμματισμού που βασίζονται σε πράκτορες εντός του Codex. Στόχος είναι να δοθεί η δυνατότητα στις ομάδες να εναλλάσσονται μεταξύ διαδραστικών συνεδριών και μακροπρόθεσμης εργασίας στο παρασκήνιο χωρίς να χάνουν το περιεχόμενο ή την ποιότητα των αποτελεσμάτων.

Η εταιρεία τονίζει ότι το μοντέλο προσαρμόστε τον χρόνο που αφιερώνετε στη συλλογιστική με βάση την πολυπλοκότητα: ανταποκρίνεται σε απλά αιτήματα σε δευτερόλεπτα και μπορεί να επενδύσει ώρες όταν το απαιτεί η εργασία. Αυτή η προσέγγιση, προσανατολισμένη στη μηχανική λογισμικού, περιλαμβάνει προηγμένες δυνατότητες αναθεώρηση κώδικα και ανίχνευση κρίσιμων σφαλμάτων.

Τι είναι το GPT-5-Codex και σε τι χρησιμεύει;

Σε σύγκριση με το γενικής χρήσης GPT-5, αυτή η έκδοση ήταν εκπαιδευμένοι με πραγματικά σενάρια ανάπτυξης με πλαίσια όπως PyTorch για να δημιουργείτε έργα από την αρχή, να προσθέτετε λειτουργίες και δοκιμές, να κάνετε εντοπισμό σφαλμάτων, να αναδιαμορφώνετε και να παρακολουθείτε τις αλλαγές με συνέπεια.

Σύμφωνα με το OpenAI, το μοντέλο είναι περισσότερο αυστηρός με τις οδηγίες των πρακτόρων (AGENTS.md), οπότε ακολουθήστε καλύτερα τις οδηγίες, παρόμοια με έργα όπως OpenAssistant, και παράγει κώδικα υψηλότερης ποιότητας με σύντομα μηνύματα, χωρίς την ανάγκη σύνταξης μεγάλων μηνυμάτων.

Εκτός από τον προγραμματισμό, το GPT-5-Codex μπορεί αξιολογήστε την ορθότητα εκτελώντας τον κώδικα και τις δοκιμέςκαι επισημαίνουν προβλήματα επιπτώσεων πριν τεθούν σε παραγωγή, κάτι που είναι ιδιαίτερα χρήσιμο για ομάδες με απαιτητικές αξιολογήσεις.

Στις εργασίες διεπαφής, η εταιρεία το θεωρεί αξιόπιστος συνεργάτης για εργασίες front-end και δημιουργία εφαρμογών για υπολογιστές, με βελτιώσεις στη δημιουργία εμπειρίας για κινητά με βάση εσωτερικές αξιολογήσεις ανθρώπινων προτιμήσεων.

Όλα τα παραπάνω ενσωματώνονται στη συνήθη ροή: Τερματικό (CLI), IDE, ιστός, GitHub και η εφαρμογή ChatGPT, με συνέχεια περιβάλλοντος μεταξύ cloud και τοπικού περιβάλλοντος.

Απόδοση και προσαρμόσιμος «χρόνος σκέψης»

Ένα από τα κλειδιά για την κυκλοφορία του είναι η διαχείριση δυναμικής συλλογιστικήςΤο ίδιο το μοντέλο αποφασίζει σε πραγματικό χρόνο πόσο «κεφάλι» θα αφιερώσει και μπορεί να επεκτείνει την εκτέλεση όταν ανιχνεύσει ότι η εργασία αυξάνεται σε πολυπλοκότητα.

Το OpenAI ισχυρίζεται ότι έχει παρατηρήσει μεμονωμένες συνεδρίες άνω των επτά ωρών σε αναδιαμορφώσεις μεγάλης κλίμακας, με επαναλήψεις που διορθώνουν τις αποτυχίες των δοκιμών και επικυρώνουν τα αποτελέσματα μέχρι να επιτευχθεί ο στόχος.

Αυτή η συμπεριφορά έρχεται σε αντίθεση με τις στρατηγικές που βασίζονται σε δρομολογητές που προκαθορίζουν τους πόρουςεδώ, το μοντέλο επαναξιολογεί την προσπάθεια καθώς αυτή εξελίσσεται, συνδυάζοντας τον ευέλικτο διάλογο με την επίμονη εκτέλεση.

Σε πρακτικό επίπεδο, αυτό μεταφράζεται σε γρήγορες απαντήσεις σε συγκεκριμένα αιτήματα και περισσότερος χρόνος που επενδύεται όταν η εργασία περιλαμβάνει την ενορχήστρωση αλλαγών σε πολλαπλές ενότητες ή την επίλυση πολύπλοκων εξαρτήσεων.

Για τις ομάδες λογισμικού, η προσέγγιση υπόσχεται λιγότερες άσχετες επαναλήψεις και μεγαλύτερη έμφαση σε βήματα με υψηλό αντίκτυπο, ειδικά κατά την αναθεώρηση μεγάλων αποθετηρίων ή την αντιμετώπιση εγκάρσιων εργασιών.

Εννοιολογική εικόνα ενός πράκτορα κώδικα

Εργαλεία και ενσωμάτωση: CLI, IDE, web και GitHub

Η διεπαφή γραμμής εντολών του Codex έχει γίνει επανασχεδιασμένο γύρω από ροές που βασίζονται σε πράκτορεςΟι εικόνες μπορούν πλέον να επισυνάπτονται απευθείας στο CLI για να διευκολύνουν τη λήψη αποφάσεων σχεδιασμού ή να εντοπίζουν οπτικές ασυνέπειες.

Το σύστημα μπορεί παρακολουθήστε την πρόοδο με λίστες υποχρεώσεων και ενσωματώνει εργαλεία όπως η αναζήτηση ιστού και το MCP, ένα ανοιχτό πρότυπο για την ασφαλή σύνδεση LLM με εξωτερικά δεδομένα και βοηθητικά προγράμματα.

Η διεπαφή βελτιώνει επίσης την μορφή κλήσης εργαλείου και συγκρίσεις, το οποίο βοηθά στην πιο καθαρή παρακολούθηση της συλλογιστικής και της αναθεώρησης των διαφορών του πράκτορα.

Σε περιβάλλοντα ανάπτυξης, η επέκταση IDE και η ενσωμάτωση GitHub επιτρέπουν Μετακινήστε την εργασία σας μεταξύ εσωτερικής εγκατάστασης και cloud χωρίς να χάσετε το περιεχόμενο, βασιζόμενος σε ανοιχτό κώδικα στον επεξεργαστή για πιο ακριβείς απαντήσεις.

Το OpenAI υποδεικνύει ότι ο παράγοντας εκτελείται σε ελεγχόμενα περιβάλλοντα από προεπιλογή και ότι είναι δυνατή η προσαρμογή των δικαιωμάτων, προκειμένου να περιοριστούν οι δυνητικά καταστροφικές ενέργειες σε ευαίσθητα έργα.

Διαθεσιμότητα και πρόσβαση

Το GPT-5-Codex είναι ενεργοποιημένο στο ChatGPT Plus, Pro, Επιχειρήσεις, Εκπαίδευση και Επιχειρήσεις, εκτός από τις εμπειρίες Codex σε τερματικό, web, IDE και GitHub.

Η εταιρεία σχεδιάζει να το διαθέσει σε Πελάτες API αργότερα, αν και προς το παρόν δεν έχει ανακοινώσει λεπτομερώς το πρόγραμμα ή συγκεκριμένες τιμές για το συγκεκριμένο κανάλι.

Δοκιμές και μετρήσεις του GPT-5 Codex

Σύμφωνα με πληροφορίες που κοινοποιήθηκαν από το OpenAI και εξωτερικές αναφορές, το GPT-5-Codex προσφέρει καλύτερα αποτελέσματα από το GPT-5 σε σενάρια προσανατολισμένα σε πράκτορες, όπως το SWE-bench Verified bench.

Σε συγκεκριμένα στοιχεία, αναφέρονται Βελτιώσεις έως και 74,5% στο SWE-bench Verified και μια αύξηση στις δοκιμές αναδιαμόρφωσης από 33,9% με GPT-5 σε 51,3% με GPT-5-Codex, γεγονός που υποδηλώνει πρόοδο στη συντήρηση και επεξεργασία πολλαπλών αρχείων.

Η εταιρεία τονίζει επίσης ότι η Τα σχόλια αξιολόγησης είναι λιγότερο λανθασμένα ή άσχετα, επιτρέποντας την εστίαση της προσοχής σε κρίσιμα ζητήματα και μειώνοντας τον θόρυβο στις δημόσιες σχέσεις.

Τι σημαίνει ο Κώδικας GPT-5 για τις Τεχνικές Ομάδες

Για τους προγραμματιστές, η ύπαρξη ενός αντιπροσώπου που συνδυάζει την ταχεία αλληλεπίδραση και την αυτόνομη εργασία ανοίγει την πόρτα σε μικρότερους κύκλους και πιο αποτελεσματική ιεράρχηση σύνθετων εργασιών.

Στους οργανισμούς, η ικανότητα ενός μοντέλου να αφιερώνει ώρες σε μια εργασία απαιτεί μια στρατηγική τεχνητής νοημοσύνης για επιχειρήσεις, σαφείς πολιτικές σχετικά με το κόστος και τα όρια εκτέλεσης, καθώς και επικύρωση της απόδοσής του σε πολλαπλές γλώσσες και μονοαποθηκευτικά αρχεία με εκτεταμένο πλαίσιο.

Πρακτικές του ασφαλής ενσωμάτωση σε υπάρχουσες ροές, με ελέγχους δικαιωμάτων, παρακολούθηση αποφάσεων εκπροσώπων και ευανάγνωστες διαφορές για τη διατήρηση της ποιότητας και της ιχνηλασιμότητας.

Με έμφαση στη μηχανική λογισμικού, Το GPT-5-Codex στοχεύει να είναι τεχνικός συνεργάτης ικανό να δημιουργεί, να αναθεωρεί και να υποστηρίζει σύνθετα έργα, προσαρμόζοντας την υπολογιστική προσπάθεια στο πραγματικό μέγεθος του προβλήματος και ανεβάζοντας τον πήχη για εργαλεία κωδικοποίησης που υποστηρίζονται από την Τεχνητή Νοημοσύνη.

Red Hat
σχετικό άρθρο:
Η Red Hat ενισχύει τη στρατηγική της για την τεχνητή νοημοσύνη σε επιχειρήσεις με το OpenShift AI, το F5 και ένα οικοσύστημα ευφυών πρακτόρων.