Γιατί το OpenAI αναπτύσσει μια τεχνητή νοημοσύνη που είναι καλή στα μαθηματικά είναι τόσο μεγάλη υπόθεση

Με την πρόσφατη απόλυση του OpenAI και τη γρήγορη επαναφορά του Sam Altman, οι συζητήσεις γύρω από την ανάπτυξη και τη χρήση της τεχνητής νοημοσύνης (AI) βρίσκονται και πάλι στο επίκεντρο. Ακόμη πιο ασυνήθιστο, ένα εξέχον θέμα στην κάλυψη των μέσων ενημέρωσης είναι η ικανότητα των συστημάτων AI να κάνουν μαθηματικά.

Προφανώς, μέρος του δράματος στο OpenAI σχετιζόταν με την ανάπτυξη από την εταιρεία ενός νέου αλγόριθμου AI που ονομάζεται Q*. Το σύστημα περιγράφηκε ως μια σημαντική πρόοδος και ένα από τα εξαιρετικά χαρακτηριστικά του ήταν η ικανότητα μαθηματικής λογικής.

Δεν είναι όμως τα μαθηματικά η βάση της τεχνητής νοημοσύνης; Πώς θα μπορούσε ένα σύστημα τεχνητής νοημοσύνης να έχει προβλήματα με τη μαθηματική λογική, λαμβάνοντας υπόψη ότι οι υπολογιστές και οι αριθμομηχανές μπορούν να εκτελέσουν μαθηματικές εργασίες;

Το AI δεν είναι μια ενιαία οντότητα. Είναι ένα συνονθύλευμα στρατηγικών για την εκτέλεση υπολογισμών χωρίς άμεσες οδηγίες από τον άνθρωπο. Όπως θα δούμε, ορισμένα συστήματα AI είναι ικανά στα μαθηματικά.

Ωστόσο, μία από τις πιο σημαντικές τρέχουσες τεχνολογίες, τα μεγάλα γλωσσικά μοντέλα (LLM) πίσω από τα chatbots AI, όπως το ChatGPT, έχουν δυσκολευτεί μέχρι στιγμής να μιμηθούν τη μαθηματική λογική. Αυτό συμβαίνει επειδή έχουν σχεδιαστεί για να επικεντρώνονται στη γλώσσα.

Εάν ο νέος αλγόριθμος Q* της εταιρείας μπορεί να λύσει προηγουμένως άγνωστα μαθηματικά προβλήματα, θα μπορούσε κάλλιστα να είναι μια σημαντική ανακάλυψη. Τα μαθηματικά είναι μια αρχαία μορφή ανθρώπινης σκέψης την οποία τα μεγάλα γλωσσικά μοντέλα (LLM) είχαν προηγουμένως δυσκολία να αναπαραγάγουν. Τα LLM είναι τα υποκείμενα συστήματα τεχνολογίας όπως το ChatGPT του OpenAI.

Τη στιγμή που γράφονται αυτές οι γραμμές, οι λεπτομέρειες του αλγορίθμου Q* και των δυνατοτήτων του είναι περιορισμένες αλλά εξαιρετικά ενδιαφέρουσες. Προτού το Q* θεωρηθεί επιτυχημένο, πρέπει να ληφθούν υπόψη διάφορες λεπτομέρειες.

Για παράδειγμα, τα μαθηματικά είναι ένα μάθημα με το οποίο ασχολούνται όλοι σε διαφορετικούς βαθμούς και παραμένει ασαφές σε ποιο μαθηματικό επίπεδο είναι ικανό το Q*. Ωστόσο, έχουν δημοσιευθεί επιστημονικές εργασίες που χρησιμοποιούν εναλλακτικές μορφές τεχνητής νοημοσύνης για την προώθηση των μαθηματικών σε επίπεδο έρευνας (συμπεριλαμβανομένων ορισμένων που γράφτηκαν από εμένα και μία από μια ομάδα μαθηματικών σε συνεργασία με ερευνητές στο Google DeepMind).

Αυτά τα συστήματα AI θα μπορούσαν να περιγραφούν ως ικανά στα μαθηματικά. Ωστόσο, είναι πιθανό ότι το Q* δεν προορίζεται να βοηθήσει τους επιστήμονες στην εργασία τους, αλλά μάλλον προορίζεται για άλλο σκοπό.

Αν και το Q* μπορεί να μην είναι σε θέση να ξεπεράσει τα όρια της έρευνας αιχμής, είναι πιθανό να υπάρχει κάποιο νόημα στον τρόπο κατασκευής του, προσφέροντας δελεαστικές δυνατότητες για μελλοντική ανάπτυξη.

Πάντα πιο άνετα

Ως κοινωνία, αισθανόμαστε όλο και πιο άνετοι με το εξειδικευμένο AI που χρησιμοποιείται για την επίλυση συγκεκριμένων τύπων προβλημάτων. Για παράδειγμα, οι περισσότεροι άνθρωποι θα είναι εξοικειωμένοι με ψηφιακούς βοηθούς, συστήματα αναγνώρισης προσώπου και ηλεκτρονικών συστάσεων. Αυτό που δεν είναι ακόμη απτό είναι η λεγόμενη «τεχνητή γενική νοημοσύνη» (AGI), η οποία έχει ολοκληρωμένες ικανότητες σκέψης συγκρίσιμες με αυτές ενός ανθρώπου.

Τα μαθηματικά είναι μια βασική δεξιότητα που θα θέλαμε να μεταδώσουμε σε κάθε παιδί του σχολείου και σίγουρα θα θεωρούνταν θεμελιώδες ορόσημο στην επιδίωξη του AGI. Πώς αλλιώς θα μπορούσαν τα μαθηματικά ικανά συστήματα AI να βοηθήσουν την κοινωνία;

Η μαθηματική σκέψη σχετίζεται με μια ποικιλία εφαρμογών, όπως η κωδικοποίηση και η μηχανική, και επομένως η μαθηματική σκέψη είναι μια σημαντική μεταβιβάσιμη δεξιότητα τόσο για την ανθρώπινη όσο και για την τεχνητή νοημοσύνη. Μια ειρωνεία είναι ότι η τεχνητή νοημοσύνη βασίζεται βασικά στα μαθηματικά.

Για παράδειγμα, πολλές από τις τεχνικές που εφαρμόζονται από αλγόριθμους τεχνητής νοημοσύνης καταλήγουν τελικά σε ένα πεδίο των μαθηματικών γνωστό ως άλγεβρα μήτρας. Ένας πίνακας είναι απλώς ένα πλέγμα αριθμών, του οποίου μια ψηφιακή εικόνα είναι ένα πολύ γνωστό παράδειγμα. Κάθε pixel δεν είναι τίποτα άλλο από αριθμητικά δεδομένα.

Τα μεγάλα γλωσσικά μοντέλα είναι επίσης εγγενώς μαθηματικά. Δεδομένου ενός μεγάλου δείγματος κειμένου, ένα μηχάνημα μπορεί να μάθει τις πιθανότητες για τις λέξεις που είναι πιο πιθανό να ακολουθήσουν ένα αίτημα (ή ερώτηση) από τον χρήστη στο chatbot. Εάν θέλετε ένα προεκπαιδευμένο LLM να ειδικευτεί σε ένα συγκεκριμένο θέμα, μπορεί να προσαρμοστεί στη μαθηματική βιβλιογραφία ή σε άλλο τομέα μάθησης. Ένα LLM μπορεί να δημιουργήσει κείμενα που διαβάζονται σαν να καταλαβαίνουν τα μαθηματικά.

Δυστυχώς, αυτό οδηγεί σε ένα LLM που είναι καλό στο μπλόφα αλλά φτωχό στη λεπτομέρεια. Το πρόβλημα είναι ότι σε μια μαθηματική πρόταση μπορεί, εξ ορισμού, να εκχωρηθεί μια μοναδική τιμή Boole (δηλαδή true ή false). Η μαθηματική σκέψη αφορά τη λογική εξαγωγή νέων μαθηματικών δηλώσεων από ήδη καθιερωμένες.

ο συνήγορος του διαβόλου

Φυσικά, οποιαδήποτε προσέγγιση του μαθηματικού συλλογισμού που βασίζεται σε γλωσσικές πιθανότητες θα βγει εκτός τροχιάς. Ένας τρόπος για να το ξεπεράσετε αυτό θα μπορούσε να είναι η δημιουργία ενός συστήματος επίσημης επαλήθευσης στην αρχιτεκτονική (όπως ακριβώς είναι κατασκευασμένο το LLM) που ελέγχει συνεχώς τη λογική πίσω από τα άλματα του μεγάλου γλωσσικού μοντέλου.

Μια ένδειξη ότι αυτό συνέβη θα μπορούσε να είναι το όνομα Q*, το οποίο θα μπορούσε εύλογα να αναφέρεται σε έναν αλγόριθμο που αναπτύχθηκε στη δεκαετία του 1970 για να βοηθήσει τον απαγωγικό συλλογισμό. Εναλλακτικά, το Q* θα μπορούσε να αναφέρεται στο Q-learning, όπου ένα μοντέλο μπορεί να βελτιωθεί με την πάροδο του χρόνου ελέγχοντας και ανταμείβοντας τα σωστά συμπεράσματα.

Ωστόσο, υπάρχουν αρκετές προκλήσεις στη δημιουργία μαθηματικά ισχυρών AI. Για παράδειγμα, μερικά από τα πιο ενδιαφέροντα μαθηματικά γεγονότα αποτελούνται από εξαιρετικά απίθανα γεγονότα. Υπάρχουν πολλές περιπτώσεις στις οποίες κάποιος μπορεί να σκεφτεί ότι υπάρχει ένα μοτίβο με βάση μικρούς αριθμούς, αλλά απροσδόκητα καταρρέει όταν κάποιος εξετάζει αρκετές περιπτώσεις. Αυτή η ικανότητα είναι δύσκολο να ενσωματωθεί σε ένα μηχάνημα.

Μια άλλη πρόκληση μπορεί να προκαλεί έκπληξη: η μαθηματική έρευνα μπορεί να είναι πολύ δημιουργική. Αυτό πρέπει να συμβαίνει, επειδή οι επαγγελματίες πρέπει να εφεύρουν νέες έννοιες, ενώ εξακολουθούν να τηρούν τους επίσημους κανόνες ενός παλιού θέματος.

Μια μεθοδολογία τεχνητής νοημοσύνης που είναι εκπαιδευμένη μόνο για να βρίσκει μοτίβα στα υπάρχοντα μαθηματικά πιθανότατα δεν θα μπορούσε ποτέ να δημιουργήσει πραγματικά νέα μαθηματικά. Δεδομένης της σύνδεσης μεταξύ μαθηματικών και τεχνολογίας, αυτό φαίνεται να αποκλείει τη σύλληψη νέων τεχνολογικών επαναστάσεων.

Αλλά ας παίξουμε για λίγο τον δικηγόρο του διαβόλου και ας φανταστούμε αν η τεχνητή νοημοσύνη θα μπορούσε πραγματικά να δημιουργήσει νέα μαθηματικά. Το προηγούμενο επιχείρημα εναντίον αυτού είναι εσφαλμένο στο ότι θα μπορούσε κανείς επίσης να πει ότι οι καλύτεροι ανθρώπινοι μαθηματικοί είχαν επίσης εκπαιδευτεί αποκλειστικά στα υπάρχοντα μαθηματικά. Τα μεγάλα γλωσσικά μοντέλα μας έχουν εκπλήξει στο παρελθόν και θα το κάνουν ξανά.

Αυτό το άρθρο αναδημοσιεύεται από το The Conversation με άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.

Η συζήτηση

Ο Tom Oliver δεν εργάζεται, δεν συμβουλεύει, δεν κατέχει μετοχές ή δεν λαμβάνει χρηματοδότηση από οποιαδήποτε εταιρεία ή οργανισμό που θα επωφεληθεί από αυτό το άρθρο και δεν έχει αποκαλύψει σχετικές σχέσεις πέρα από την ακαδημαϊκή τους απασχόληση.

Πάντα πιο άνετα

ο συνήγορος του διαβόλου

Leave a Reply Cancel reply