Τι άλλο ανακοινώθηκε στο OpenAI Devday εκτός από το GPT-4 Turbo;

Εκτενής Παρουσίαση του OpenAI DevDay: Τι Άλλο Ανακοινώθηκε Εκτός από το GPT-4 Turbo;

By Sean Chen, 10/11/2023

Στις 06/11/2023 πραγματοποιήθηκε η εκδήλωση OpenAI DevDay, όπου ο διευθύνων σύμβουλος της OpenAI, Sam Altman, ξεπέρασε ξανά τις προσδοκίες, προσφέροντας νέες δυνατότητες στους προγραμματιστές AI. Μέσα από αυτό το άρθρο, ας ανακαλύψουμε τη γοητεία του GPT-4 Turbo για τους προγραμματιστές λογισμικού.

Η OpenAI διοργάνωσε την εκδήλωση OpenAI DevDay στις 06/11/2023, ενώ άλλες μεγάλες τεχνολογικές εταιρείες προσπαθούν ακόμα να φτάσουν τις επιδόσεις του GPT-4. Ο διευθύνων σύμβουλος της OpenAI, Sam Altman, ξεπέρασε ξανά τις προσδοκίες, προσφέροντας νέες δυνατότητες στους προγραμματιστές AI, επιδεικνύοντας την ηγετική θέση της OpenAI στην τεχνητή νοημοσύνη.

Το Ενισχυμένο GPT-4 Turbo: Ταχύτερο, με Μεγαλύτερο Όγκο Κειμένου και Πιο Οικονομικό

Η έννοια του "Πλαισίου" αναφέρεται στον συνολικό όγκο κειμένου που εισάγεται στο μεγάλο γλωσσικό μοντέλο για προτροπές και διαλόγους. Στο παρελθόν, ο μέγιστος όγκος κειμένου υποστηριζόταν έως 32,000 tokens (και ήταν διαθέσιμος μόνο για ορισμένους προγραμματιστές), ενώ το GPT-4 Turbo επιτρέπει έως 128,000 tokens, που ισοδυναμεί με την εισαγωγή ενός βιβλίου 300 σελίδων στο GPT-4 Turbo για δημιουργία. Όσον αφορά την ταχύτητα, το GPT-4 είχε επικριθεί για την αργή του απόδοση, με αποτέλεσμα οι επιχειρήσεις να προτιμούν το GPT-3.5 για την επίλυση των περισσότερων πρακτικών εφαρμογών. Το GPT-4 Turbo λύνει αυτό το πρόβλημα, προσφέροντας ταχύτητα κοντά στο GPT-3.5, εμπλουτίζοντας τα μελλοντικά σενάρια ενσωμάτωσης του GPT-4 Turbo. Όσον αφορά το κόστος, σε σύγκριση με την προηγούμενη έκδοση του GPT-4, το κόστος των προτροπών είναι τρεις φορές φθηνότερο και το κόστος του παραγόμενου κειμένου είναι δύο φορές φθηνότερο.

Φιλικότερη Λειτουργία Κλήσης Συναρτήσεων για Προγραμματιστές

Τι είναι η Κλήση Συναρτήσεων;

Η OpenAI κυκλοφόρησε νωρίτερα φέτος τη λειτουργία "Κλήση Συναρτήσεων", η οποία επιτρέπει στους προγραμματιστές να καλούν προσαρμοσμένες συναρτήσεις κώδικα κατά τη χρήση του GPT. Με άλλα λόγια, επιτρέπει στην έξυπνη AI να συνδέεται με διάφορα API, αυξάνοντας σημαντικά το πεδίο χρήσης της OpenAI. Η ισχυρή απόδοση του μοντέλου έγκειται στο ότι, αρκεί να παρέχουν οι προγραμματιστές πολλαπλές διεπαφές εντολών, το GPT μπορεί να αποφασίσει ποια εντολή να καλέσει και να εκτελέσει με κατάλληλες παραμέτρους.

Παράδειγμα: Ένας προγραμματιστής έξυπνης λάμπας παρέχει δύο εντολές: "Ρύθμιση Χρώματος" και "Ρύθμιση Χρονικού Διαστήματος Αισθητήρα". Οι παράμετροι της εντολής ρύθμισης χρώματος είναι τρεις: λευκό φως, φυσικό φως και νυχτερινό φως. Όταν εισάγεται στο GPT η προτροπή: "Ρύθμισε την κατάλληλη λάμπα για τη νύχτα", το GPT θα αποφασίσει αυτόματα να χρησιμοποιήσει την εντολή "Ρύθμιση Χρώματος" και να επιλέξει την παράμετρο "νυχτερινό φως", χωρίς ανθρώπινη παρέμβαση. Στο παρελθόν, απαιτούνταν η χρήση τεχνολογίας NLP για τη συγγραφή προσαρμοσμένης λογικής για την επίτευξη αυτής της λειτουργίας, ενώ τώρα μπορεί να επιτευχθεί απλά με την κλήση του προγράμματος GPT.

Τι Αλλαγές Έγιναν Αυτή τη Φορά;

Η ενημέρωση αυτή επιτρέπει στο GPT να κρίνει με μεγαλύτερη ακρίβεια ποια εντολή και παράμετρο να χρησιμοποιήσει, ενώ βελτιώνει την ικανότητα του GPT να καλεί πολλαπλές εντολές ταυτόχρονα. Στο παρελθόν, όταν το σενάριο ήταν πιο περίπλοκο, οι προγραμματιστές έπρεπε να γράψουν επιπλέον κώδικα για να επιτρέψουν την πολλαπλή κλήση συναρτήσεων. Η ενημέρωση αυτή επιτρέπει στο GPT να εκτελεί πολλαπλές εντολές ταυτόχρονα και να μεταφέρει τα αποτελέσματα κάθε εντολής. Για παράδειγμα: με την προτροπή "Συνηθίζω να ξυπνάω το βράδυ για να πιω νερό, ρύθμισε την κατάλληλη λάμπα", το GPT μπορεί να αποφασίσει να καλέσει τις εντολές "Ρύθμιση Χρώματος" και "Ρύθμιση Χρονικού Διαστήματος Αισθητήρα", καθορίζοντας την παράμετρο "Χρονικό Διάστημα Αισθητήρα" ως "01:00 έως 06:30" και χρησιμοποιώντας την παράμετρο "Ρύθμιση Χρώματος" ως "νυχτερινό φως".

Επιπλέον, οι απαντήσεις των γλωσσικών μοντέλων στο παρελθόν ήταν σε "μη συγκεκριμένη μορφή κειμένου". Αν επιθυμούσατε απάντηση σε συγκεκριμένη μορφή, έπρεπε να ζητήσετε "απάντηση σε μορφή xml" στην προτροπή. Ωστόσο, οι προγραμματιστές συχνά αντιμετώπιζαν το πρόβλημα ότι η απάντηση δεν ήταν πάντα σε xml, αλλά περιείχε και απλό κείμενο, προκαλώντας σφάλματα στη μετατροπή μορφής. Το GPT-4 Turbo επιτρέπει τώρα στους προγραμματιστές να ορίσουν την παράμετρο response_format, η οποία μπορεί να οριστεί σε xml ή json, κοινές μορφές επιστροφής API, αυξάνοντας τη σταθερότητα του προγράμματος.

Τέλος, η OpenAI επιτρέπει στους χρήστες να ορίσουν την παράμετρο Seed, η οποία καθορίζει την τυχαιότητα του περιεχομένου που επιστρέφει το GPT. Μέσω της ρύθμισης αυτής της παραμέτρου, οι προγραμματιστές μπορούν να διασφαλίσουν ότι οι απαντήσεις του γλωσσικού μοντέλου παραμένουν συνεπείς, επιτρέποντας στους προγραμματιστές να γράφουν πιο ασφαλή σενάρια δοκιμών (αποφεύγοντας απρόβλεπτες απαντήσεις από το γλωσσικό μοντέλο), αυξάνοντας την αξιοπιστία και την ποιότητα του προγράμματος.

Εκτός από τα παραπάνω, η κυκλοφορία του Assistants API είναι το κύριο γεγονός του DevDay όσον αφορά την επέκταση των εφαρμογών.

Assistants API

Στο παρελθόν, για να αναπτύξετε εφαρμογές AI με χρήση μεγάλων γλωσσικών μοντέλων, χρειαζόταν να χρησιμοποιήσετε τρίτα πακέτα όπως το LangChain, για να προσδώσετε στα μεγάλα γλωσσικά μοντέλα πιο προηγμένες δυνατότητες, όπως η χρήση πολλαπλών γλωσσικών μοντέλων, η δυνατότητα προσαρμογής δεδομένων, η μνήμη και οι πράκτορες (Agent, που επιτρέπουν στην AI να εκτελεί συνεχείς εργασίες και αποφάσεις), για την ολοκλήρωση πιο σύνθετων εφαρμογών AI.

Η κυκλοφορία του Assistants API στο DevDay ενσωματώνει τις παραπάνω δυνατότητες στο επίσημο API, εξαλείφοντας τα προβλήματα που αντιμετωπίζουν οι προγραμματιστές κατά την ενσωμάτωση τρίτων πακέτων. Αυτή είναι η πρώτη φορά που η OpenAI προχωρά πέρα από την απλή βελτιστοποίηση της απόδοσης των μεγάλων γλωσσικών μοντέλων, εξερευνώντας την εφαρμογή των "πρακτόρων". Τα επίσημα έγγραφα αναφέρουν ότι "ένας βοηθός είναι μια AI με στόχο, που επιτρέπει τη χρήση συγκεκριμένων εντολών, εξωτερικών δεδομένων ή διαφορετικών γλωσσικών μοντέλων και εργαλείων για την εκτέλεση εργασιών".

Το νέο Assistants API περιλαμβάνει επίσης διάφορα εργαλεία, εκτός από την "Κλήση Συναρτήσεων", προσφέροντας επίσης "Διερμηνέα Κώδικα" και "Ανάκτηση Δεδομένων".

Διερμηνέας Κώδικα

Ο "Διερμηνέας Κώδικα" του GPT-4 επιτρέπει την εκτέλεση κώδικα σε ένα περιβάλλον sandbox (προς το παρόν υποστηρίζει μόνο Python). Στο παρελθόν, οι μηχανικοί έπρεπε να αντιγράψουν και να επικολλήσουν τον κώδικα που έγραψε το GPT-4 στο δικό τους περιβάλλον ανάπτυξης για δοκιμή. Το περιβάλλον sandbox που παρέχει η OpenAI επιτρέπει στο GPT-4 να ελέγχει μόνο του αν ο κώδικας είναι σωστός και να τροποποιεί σταδιακά τον κώδικα μέχρι να επιτευχθεί ο στόχος.

Ωστόσο, η λειτουργία του διερμηνέα κώδικα υπερβαίνει το "να επιτρέπει στο GPT-4 να ελέγχει την ορθότητα του κώδικα που γράφει". Η μεγαλύτερη σημασία του έγκειται στο "να επιτρέπει στο μεγάλο γλωσσικό μοντέλο να έχει τον δικό του υπολογιστή", ο οποίος μπορεί να εκτελεί τις περισσότερες εργασίες. Αν και η εκτέλεση σε περιορισμένο περιβάλλον sandbox επιτρέπει στον διερμηνέα κώδικα να χρησιμοποιεί μόνο συγκεκριμένα τρίτα πακέτα, είναι αρκετό για την εκτέλεση "των περισσότερων εργασιών που η γλώσσα Python είναι καλή στη διαχείριση", όπως η επεξεργασία δεδομένων και οι κλήσεις API, και μπορεί να διαβάσει μεγαλύτερα αρχεία κώδικα που παρέχονται από τον χρήστη. Το περιβάλλον sandbox, από άποψη ασφάλειας, αποτρέπει την κατάχρηση των ισχυρών δυνατοτήτων του μεγάλου γλωσσικού μοντέλου, παρέχοντας έτσι ένα επίπεδο ασφάλειας.

Ανάκτηση Δεδομένων

Η "Ανάκτηση Δεδομένων" επιτρέπει στους χρήστες να ανεβάζουν τα δικά τους δεδομένα (όπως δεδομένα συγκεκριμένων βιομηχανικών τομέων, πληροφορίες προϊόντων ή εσωτερικά έγγραφα) και να επιτρέπουν στο μεγάλο γλωσσικό μοντέλο να απαντά σε ερωτήσεις σχετικά με αυτά τα δεδομένα, εφαρμόζοντας τα στον δικό τους τομέα ή βιομηχανία. Αυτή η λειτουργία ήταν ένα σημείο ανταγωνισμού από την κυκλοφορία του GPT-3. Η ανάκτηση δεδομένων που ανακοινώθηκε στο DevDay είναι η πρώτη φορά που παρέχεται μια εγγενής λύση για αυτή τη λειτουργία, όπως η δημιουργία ενός εσωτερικού ρομπότ γνώσης για επιχειρήσεις, όπως AI project manager, AI system analyst. Στους τομείς της υγείας, των χρηματοοικονομικών και άλλων, τα ρομπότ εξυπηρέτησης πελατών απαιτούσαν στο παρελθόν τη χρήση σύνθετων τεχνολογιών επεξεργασίας γλώσσας για να υλοποιηθούν. Τώρα, με το ισχυρό γλωσσικό μοντέλο GPT-4 και τη λειτουργία ανάκτησης δεδομένων που παρέχεται επίσημα από την OpenAI, οι προγραμματιστές μπορούν να επικεντρωθούν στη λογική των επιχειρήσεων, την ακρίβεια των δεδομένων και τη ρύθμιση των λεπτομερειών. Επιπλέον, οι απαιτήσεις για βάσεις δεδομένων διανυσμάτων, επεξεργασία δεδομένων ή συγκεκριμένους αλγόριθμους αναζήτησης που απαιτούνταν στο παρελθόν με τη χρήση τρίτων πακέτων, δεν χρειάζονται πλέον επιπλέον προσπάθεια με την υποστήριξη της OpenAI, εξοικονομώντας έτσι χρόνο και κόστος ανάπτυξης. Η OpenAI τονίζει επίσης ότι οι συνομιλίες και τα αρχεία που χρησιμοποιούνται από το Assistants API δεν θα χρησιμοποιηθούν για την εκπαίδευση του επόμενου μοντέλου της OpenAI.

Συμπεράσματα

Συνολικά, η OpenAI συνεχίζει να βελτιστοποιεί την απόδοση των μοντέλων της και να επεκτείνει τις εφαρμογές των μεγάλων γλωσσικών μοντέλων. Ο Sam Altman έχει δηλώσει ότι το GPT-5 δεν θα κυκλοφορήσει σύντομα. Με την τρέχουσα ακρίβεια του GPT-4, το να δαπανηθεί επιπλέον κόστος για την εκπαίδευση ενός μεγαλύτερου μοντέλου φαίνεται περιττό. Αντίθετα, η βελτίωση της απόδοσης, της ευχρηστίας και της επεκτασιμότητας του GPT-4 είναι το κύριο μέλημα της OpenAI αυτή τη στιγμή. Για τους προγραμματιστές, τις επιχειρήσεις και τους τελικούς καταναλωτές, η ενσωμάτωση περισσότερων ισχυρών AI που μπορούν να εφαρμοστούν σε πολλαπλά σενάρια έχει γίνει το επίκεντρο της επόμενης γενιάς ψηφιακού μετασχηματισμού. Το GPT που δημιούργησε η OpenAI είναι σαν ο εγκέφαλος του μελλοντικού τεχνολογικού κόσμου, και πιστεύουμε ότι οι επόμενες δημιουργίες και εξελίξεις θα κάνουν την τεχνητή νοημοσύνη πιο ικανή στη χρήση εργαλείων, να "βλέπει", να "ακούει" και να "μιλά" και να "σχεδιάζει" με ευχέρεια.