Η τεχνητή νοημοσύνη έχει μεγάλο και αυξανόμενο αποτύπωμα άνθρακα, αλλά υπάρχουν πιθανές λύσεις στον ορίζοντα

By | February 16, 2024

    <span class=Gorodenkoff / Shutterstock” src=”https://s.yimg.com/ny/api/res/1.2/6SKGvPy7ixHuNFY21y4G5w–/YXBwaWQ9aGlnaGxhbmRlcjt3PTk2MDtoPTU0MA–/https://media.zenfs.com/convers295455555000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 8 8b00569d5″ data-src = “https://s.yimg.com/ny/api/res/1.2/6SKGvPy7ixHuNFY21y4G5w–/YXBwaWQ9aGlnaGxhbmRlcjt3PTk2MDtoPTU0MA–/https://media.zenfs.com/en/the_conversation 00 569d5″/>

Δεδομένης της τεράστιας δυνατότητας επίλυσης προβλημάτων της τεχνητής νοημοσύνης (AI), δεν θα ήταν παράλογο να πιστέψουμε ότι η τεχνητή νοημοσύνη θα μπορούσε επίσης να μας βοηθήσει να αντιμετωπίσουμε την κλιματική κρίση. Ωστόσο, όταν κοιτάξετε τις ενεργειακές απαιτήσεις των μοντέλων τεχνητής νοημοσύνης, γίνεται σαφές ότι η τεχνολογία είναι τόσο μέρος του κλιματικού προβλήματος όσο και λύση.

Οι εκπομπές προέρχονται από υποδομές που σχετίζονται με την τεχνητή νοημοσύνη, όπως η κατασκευή και η λειτουργία των κέντρων δεδομένων που επεξεργάζονται τις μεγάλες ποσότητες πληροφοριών που απαιτούνται για τη συντήρηση αυτών των συστημάτων.

Ωστόσο, διαφορετικές τεχνολογικές προσεγγίσεις για την κατασκευή συστημάτων τεχνητής νοημοσύνης θα μπορούσαν να συμβάλουν στη μείωση του αποτυπώματος άνθρακα. Δύο τεχνολογίες είναι ιδιαίτερα ελπιδοφόρες για αυτό: η παροχή νευρωνικών δικτύων και η δια βίου μάθηση.

Η διάρκεια ζωής ενός συστήματος AI μπορεί να χωριστεί σε δύο φάσεις: εκπαίδευση και εξαγωγή συμπερασμάτων. Κατά τη διάρκεια της εκπαίδευσης, χρησιμοποιείται ένα σχετικό σύνολο δεδομένων για τη δημιουργία και τη βελτιστοποίηση ή τη βελτίωση του συστήματος. Κατά τη διάρκεια της εξαγωγής συμπερασμάτων, το εκπαιδευμένο σύστημα δημιουργεί προβλέψεις που βασίζονται σε δεδομένα που δεν είχαν δει προηγουμένως.

Για παράδειγμα, για να εκπαιδεύσετε μια τεχνητή νοημοσύνη που θα χρησιμοποιηθεί σε αυτοοδηγούμενα αυτοκίνητα θα απαιτούσε ένα σύνολο δεδομένων με πολλά διαφορετικά σενάρια οδήγησης και αποφάσεις που λαμβάνονται από ανθρώπους οδηγούς.

Μετά τη φάση της εκπαίδευσης, το σύστημα AI θα προβλέπει αποτελεσματικούς ελιγμούς για ένα αυτοοδηγούμενο αυτοκίνητο. Τα τεχνητά νευρωνικά δίκτυα (ANN) είναι μια υποκείμενη τεχνολογία που χρησιμοποιείται στα περισσότερα τρέχοντα συστήματα τεχνητής νοημοσύνης.

Αποτελούνται από πολλά διαφορετικά στοιχεία, τις λεγόμενες παραμέτρους, οι τιμές των οποίων προσαρμόζονται κατά τη φάση εκπαίδευσης του συστήματος AI. Αυτές οι παράμετροι μπορούν συνολικά να ξεπεράσουν τα 100 δισεκατομμύρια.

Ενώ ένας μεγάλος αριθμός παραμέτρων βελτιώνει τις δυνατότητες των ANN, καθιστούν επίσης τις διαδικασίες εκπαίδευσης και εξαγωγής συμπερασμάτων διεργασίες έντασης πόρων. Για να βάλουμε τα πράγματα στη θέση τους, η εκπαίδευση του GPT-3 (το πρόδρομο σύστημα AI του τρέχοντος ChatGPT) παρήγαγε 502 τόνους άνθρακα, που ισοδυναμεί με την οδήγηση 112 βενζινοκίνητων αυτοκινήτων για ένα χρόνο.

Με βάση το συμπέρασμα, το GPT-3 εκπέμπει επίσης 8,4 τόνους CO2 ετησίως. Από τότε που ξεκίνησε η έκρηξη της τεχνητής νοημοσύνης στις αρχές της δεκαετίας του 2010, οι ενεργειακές απαιτήσεις των συστημάτων τεχνητής νοημοσύνης γνωστά ως Large Language Models (LLM) – ο τύπος της τεχνολογίας πίσω από το ChatGPT – έχουν αυξηθεί κατά 300.000.

Καθώς τα μοντέλα τεχνητής νοημοσύνης γίνονται πιο πανταχού παρόντα και πολύπλοκα, αυτή η τάση θα συνεχιστεί, καθιστώντας δυνητικά την τεχνητή νοημοσύνη σημαντική συμβολή στις εκπομπές CO₂. Στην πραγματικότητα, οι τρέχουσες εκτιμήσεις μας μπορεί να είναι χαμηλότερες από το πραγματικό αποτύπωμα άνθρακα της τεχνητής νοημοσύνης λόγω έλλειψης τυποποιημένων και ακριβών τεχνικών για τη μέτρηση των εκπομπών που σχετίζονται με την τεχνητή νοημοσύνη.

Καμινάδες σε εργοστάσιο παραγωγής ενέργειας.

Αιχμηρά νευρωνικά δίκτυα

Οι προαναφερθείσες αναδυόμενες τεχνολογίες, Spiking Neural Networks (SNN) και Lifelong Learning (L2), έχουν τη δυνατότητα να μειώσουν το διαρκώς αυξανόμενο αποτύπωμα άνθρακα του AI, με τα SNN να λειτουργούν ως ενεργειακά αποδοτική εναλλακτική λύση στα ANN.

Τα ANN λειτουργούν επεξεργάζοντας και μαθαίνοντας μοτίβα από δεδομένα για να κάνουν προβλέψεις. Δουλεύεις με δεκαδικούς αριθμούς. Για να εκτελέσετε ακριβείς υπολογισμούς, ειδικά όταν πολλαπλασιάζετε αριθμούς με δεκαδικούς, ο υπολογιστής πρέπει να είναι πολύ ακριβής. Λόγω αυτών των δεκαδικών, τα ANN απαιτούν μεγάλη υπολογιστική ισχύ, μνήμη και χρόνο.

Αυτό σημαίνει ότι όσο μεγαλύτερα και πιο σύνθετα γίνονται τα δίκτυα, τόσο πιο ενεργοβόρα γίνονται τα ANN. Τόσο τα ANN όσο και τα SNN εμπνέονται από τον εγκέφαλο, ο οποίος περιέχει δισεκατομμύρια νευρώνες (νευρικά κύτταρα) που συνδέονται μεταξύ τους μέσω συνάψεων.

Όπως ο εγκέφαλος, τα ANN και τα SNN έχουν επίσης συστατικά που οι ερευνητές αποκαλούν νευρώνες, αν και αυτά είναι τεχνητά και όχι βιολογικά. Η κύρια διαφορά μεταξύ των δύο τύπων νευρωνικών δικτύων είναι ο τρόπος με τον οποίο μεμονωμένοι νευρώνες μεταδίδουν πληροφορίες μεταξύ τους.

Οι νευρώνες στον ανθρώπινο εγκέφαλο επικοινωνούν μεταξύ τους μεταδίδοντας διακοπτόμενα ηλεκτρικά σήματα που ονομάζονται αιχμές. Οι ίδιες οι αιχμές δεν περιέχουν πληροφορίες. Αντίθετα, οι πληροφορίες βρίσκονται στο χρονοδιάγραμμα αυτών των κορυφών. Αυτό το δυαδικό χαρακτηριστικό όλα ή τίποτα των αιχμών (συνήθως αντιπροσωπεύεται ως 0 ή 1) υποδηλώνει ότι οι νευρώνες είναι ενεργοί όταν παράγουν αιχμές και ανενεργοί διαφορετικά.

Αυτός είναι ένας από τους λόγους για ενεργειακά αποδοτική επεξεργασία στον εγκέφαλο.

Ακριβώς όπως ο κώδικας Μορς χρησιμοποιεί συγκεκριμένες ακολουθίες κουκκίδων και παύλων για τη μετάδοση μηνυμάτων, τα SNN χρησιμοποιούν μοτίβα ή χρονισμό αιχμών για την επεξεργασία και τη μετάδοση πληροφοριών. Έτσι, ενώ οι τεχνητοί νευρώνες στα ANN είναι πάντα ενεργοί, τα SNN καταναλώνουν ενέργεια μόνο όταν εμφανίζεται μια ακίδα.

Διαφορετικά η απαίτηση ενέργειας είναι σχεδόν μηδενική. Τα SNN μπορεί να είναι έως και 280 φορές πιο ενεργειακά αποδοτικά από τα ANN.

Οι συνάδελφοί μου και εγώ αναπτύσσουμε αλγόριθμους εκμάθησης για SNN που μπορεί να τους φέρουν ακόμη πιο κοντά στην ενεργειακή απόδοση του εγκεφάλου. Το χαμηλότερο υπολογιστικό κόστος συνεπάγεται επίσης ότι τα SNN μπορεί να είναι σε θέση να λαμβάνουν αποφάσεις πιο γρήγορα.

Αυτές οι ιδιότητες καθιστούν τα SNN χρήσιμα για ένα ευρύ φάσμα εφαρμογών, συμπεριλαμβανομένης της εξερεύνησης του διαστήματος, της άμυνας και των αυτοοδηγούμενων αυτοκινήτων, καθώς σε αυτά τα σενάρια είναι διαθέσιμες περιορισμένες πηγές ενέργειας.

Το L2 είναι μια άλλη στρατηγική για τη μείωση της συνολικής κατανάλωσης ενέργειας των ANN κατά τη διάρκεια ζωής τους, πάνω στην οποία επίσης εργαζόμαστε.

Η διαδοχική εκπαίδευση των ANN (όπου τα συστήματα μαθαίνουν από αλληλουχίες δεδομένων) σε νέα προβλήματα τα κάνει να ξεχνούν τις προηγούμενες γνώσεις τους καθώς μαθαίνουν νέες εργασίες. Τα ANN πρέπει να επανεκπαιδευτούν από την αρχή καθώς το περιβάλλον λειτουργίας τους αλλάζει, αυξάνοντας περαιτέρω τις εκπομπές που σχετίζονται με την τεχνητή νοημοσύνη.

Το L2 είναι μια συλλογή αλγορίθμων που επιτρέπουν στα μοντέλα τεχνητής νοημοσύνης να εκπαιδεύονται διαδοχικά σε πολλαπλές εργασίες, με ελάχιστη έως καθόλου λήθη. Το L2 επιτρέπει στα μοντέλα να μαθαίνουν καθ’ όλη τη διάρκεια της ζωής τους, αξιοποιώντας τις υπάρχουσες γνώσεις τους χωρίς να χρειάζεται να τα εκπαιδεύσουν από την αρχή.

Ο τομέας της τεχνητής νοημοσύνης αναπτύσσεται ραγδαία και εμφανίζονται περισσότερες πιθανές προόδους που μπορούν να μειώσουν τις ενεργειακές απαιτήσεις αυτής της τεχνολογίας. Για παράδειγμα, μπορούν να δημιουργηθούν μικρότερα μοντέλα τεχνητής νοημοσύνης που έχουν τις ίδιες δυνατότητες πρόβλεψης με ένα μεγαλύτερο μοντέλο.

Η πρόοδος στον κβαντικό υπολογισμό – μια διαφορετική προσέγγιση για την κατασκευή υπολογιστών που αξιοποιεί φαινόμενα από τον κόσμο της κβαντικής φυσικής – θα επέτρεπε επίσης ταχύτερη εκπαίδευση και εξαγωγή συμπερασμάτων χρησιμοποιώντας ANN και SNN. Οι ανώτερες υπολογιστικές δυνατότητες του κβαντικού υπολογισμού θα μπορούσαν να μας επιτρέψουν να βρούμε ενεργειακά αποδοτικές λύσεις για την τεχνητή νοημοσύνη σε πολύ μεγαλύτερη κλίμακα.

Η πρόκληση της κλιματικής αλλαγής απαιτεί από εμάς να προσπαθήσουμε να βρούμε λύσεις για περιοχές που κινούνται γρήγορα, όπως η τεχνητή νοημοσύνη, προτού το αποτύπωμα άνθρακα τους γίνει πολύ μεγάλο.

Αυτό το άρθρο αναδημοσιεύεται από το The Conversation με άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.

Η συζήτησηΗ συζήτηση

Η συζήτηση

Η Shirin Dora δεν εργάζεται, δεν συμβουλεύει, δεν κατέχει μετοχές ή δεν λαμβάνει χρηματοδότηση από οποιαδήποτε εταιρεία ή οργανισμό που θα επωφεληθεί από αυτό το άρθρο και δεν έχει αποκαλύψει σχετικές σχέσεις πέρα ​​από την ακαδημαϊκή της απασχόληση.

Leave a Reply

Your email address will not be published. Required fields are marked *