Σύνοψη
Ερευνητές του Πανεπιστημίου του Πεκίνου παρουσίασαν το μικρότερο σιδηροηλεκτρικό transistor (FeFET) στον κόσμο με πύλη μεγέθους 1 νανομέτρου.Καταργείται ο διαχωρισμός μνήμης και επεξεργαστή, αντιμετωπίζοντας δομικά την απώλεια ενέργειας που αγγίζει το 90% στα παραδοσιακά AI chips λόγω μεταφοράς δεδομένων.Η νέα αρχιτεκτονική λειτουργεί με τάση μόλις 0.6 Volt, συγχρονίζοντας πλήρως τις απαιτήσεις των κυκλωμάτων λογικής και αποθήκευσης χωρίς ανάγκη πολύπλοκων μετατροπέων τάσης (step-up).Με χρόνο απόκρισης στα 1.6 νανοδευτερόλεπτα, η τεχνολογία καταναλώνει το 1/10 της ενέργειας σε σύγκριση με τις κορυφαίες διεθνείς εργαστηριακές υλοποιήσεις.Αν και βρίσκεται σε ερευνητικό στάδιο, η τεχνολογία έχει ήδη πατενταριστεί, στοχεύοντας στη μελλοντική μαζική παραγωγή για αυτόνομα συστήματα edge computing.
Η ραγδαία επέκταση των μοντέλων τεχνητής νοημοσύνης επιβάλλει νέες αυστηρές προδιαγραφές στην παραγωγή ημιαγωγών. Η συμβατική μέθοδος σχεδιασμού εστίαζε αποκλειστικά στη σμίκρυνση της κλίμακας μέσω προηγμένων κόμβων λιθογραφίας, ωστόσο η προσέγγιση αυτή προσεγγίζει σταδιακά τα φυσικά όρια του πυριτίου. Η απάντηση στην αυξανόμενη ζήτηση υπολογιστικής ισχύος προέρχεται από μια ερευνητική ομάδα του Πανεπιστημίου του Πεκίνου και της Κινεζικής Ακαδημίας Επιστημών.
Οι επιστήμονες κατασκεύασαν επιτυχώς το μικρότερο και ενεργειακά πλέον αποδοτικό σιδηροηλεκτρικό transistor (FeFET) διεθνώς, με ηλεκτρόδιο πύλης (gate) διαστάσεων 1 νανομέτρου. Η μελέτη, η οποία δημοσιεύθηκε στο επιστημονικό περιοδικό Science Advances, αποτυπώνει την προσπάθεια αναδιαμόρφωσης των φυσικών αρχιτεκτονικών που υποστηρίζουν το AI hardware.
Η ρίζα του ενεργειακού προβλήματος στην επεξεργασία δεδομένων τεχνητής νοημοσύνης εντοπίζεται στη μεταφορά των δεδομένων. Στις παραδοσιακές αρχιτεκτονικές von Neumann, οι μονάδες υπολογισμού (επεξεργαστές) και οι μονάδες αποθήκευσης (μνήμη) λειτουργούν ως αυστηρά διαχωρισμένα υποσυστήματα. Κατά την εκτέλεση αλγορίθμων βαθιάς μάθησης (deep learning), τα δεδομένα πρέπει να δρομολογούνται διαρκώς μέσω διαύλων μεταξύ αυτών των δύο μονάδων. Οι ερευνητές επισημαίνουν ότι αυτή ακριβώς η διαδικασία μεταφοράς ευθύνεται για το 60% έως 90% της συνολικής κατανάλωσης ενέργειας ενός AI server, συνιστώντας ένα δομικό “μπουκάλι του von Neumann”.
Σε αυτόν τον περιορισμό προστίθεται ένα εξίσου σοβαρό ζήτημα ασυμβατότητας τάσης. Στις προηγμένες διαδικασίες κατασκευής, η τάση λειτουργίας των λογικών κυκλωμάτων έχει μειωθεί περίπου στα 0.7 volt, προκειμένου να διασφαλιστεί υψηλή ενεργειακή αποδοτικότητα. Αντίθετα, η μη πτητική μνήμη, όπως η παραδοσιακή NAND flash, απαιτεί λειτουργική τάση άνω των 5 volt για την εκτέλεση εντολών εγγραφής. Για να επιτευχθεί η συνεργασία μεταξύ επεξεργαστή και μνήμης, οι μηχανικοί υποχρεώνονται να ενσωματώνουν πολύπλοκα κυκλώματα μετατροπής τάσης. Αυτά τα πρόσθετα στάδια καταλαμβάνουν πολύτιμο χώρο στη μητρική πλακέτα και προκαλούν απώλεια έως και 30% της πολύτιμης ηλεκτρικής ενέργειας, η οποία εκλύεται στο περιβάλλον ως θερμότητα, καθιστώντας υποχρεωτική τη χρήση ογκωδών συστημάτων ψύξης.
Για την οριστική υπέρβαση των παραπάνω κατασκευαστικών περιορισμών, η ομάδα του ερευνητή Qiu Chenguang και του ακαδημαϊκού Peng Lianmao αξιοποίησε την τεχνολογία των σιδηροηλεκτρικών transistor (Ferroelectric Field-Effect Transistors – FeFET). Σε αντίθεση με τις συμβατικές αρχιτεκτονικές, τα FeFET υιοθετούν μια νευρομορφική λογική εμπνευσμένη από τον ανθρώπινο εγκέφαλο, ενοποιώντας τη μνήμη και την επεξεργασία στην ίδια μονάδα (in-memory computing). Τα σιδηροηλεκτρικά υλικά έχουν την ιδιότητα να μεταβάλλουν την πόλωσή τους όταν εφαρμόζεται ηλεκτρικό πεδίο και να διατηρούν αυτήν την κατάσταση ακόμα και μετά τη διακοπή της τάσης, προσφέροντας εγγενή ικανότητα αποθήκευσης.
Μέσω εξειδικευμένων τεχνικών επεξεργασίας, οι επιστήμονες κατάφεραν να συρρικνώσουν το ηλεκτρόδιο της πύλης του transistor σε φυσικό μήκος 1 νανομέτρου, επιτυγχάνοντας ακρίβεια ατομικού επιπέδου. Για να γίνει αντιληπτή η κλίμακα, αρκεί να αναφερθεί ότι ένα μεμονωμένο μόριο DNA έχει πλάτος περίπου δύο νανόμετρα.
Το τεχνικό χαρακτηριστικό που διαχωρίζει τη συγκεκριμένη υλοποίηση από τις προηγούμενες πειραματικές διατάξεις είναι η λειτουργία σε συνθήκες εξαιρετικά χαμηλής τάσης. Το nano-gate FeFET του Πανεπιστημίου του Πεκίνου λειτουργεί σταθερά με μόλις 0.6 volt, καθιστώντας το απολύτως συμβατό με τα δεδομένα των σύγχρονων κυκλωμάτων λογικής. Με την εφαρμογή αυτής της παραμέτρου, καταργούνται οριστικά τα φυσικά εμπόδια επικοινωνίας μεταξύ μνήμης και επεξεργαστή, καθώς η μεταφορά δεδομένων πραγματοποιείται ακαριαία, στο ίδιο ενεργειακό επίπεδο.
Σύμφωνα με τα δημοσιευμένα δεδομένα στο Science Advances, η συσκευή προσφέρει ταχύτατους χρόνους απόκρισης της τάξης των 1.6 νανοδευτερολέπτων. Παράλληλα, η κατανάλωση ενέργειας περιορίζεται δραματικά, φτάνοντας περίπου το 1/10 της αντίστοιχης κατανάλωσης που είχαν σημειώσει οι προηγούμενες χαμηλότερες διεθνείς καταγραφές για συστήματα FeFET. Η εκτέλεση πράξεων πολλαπλασιασμού-συσσώρευσης (Multiply-Accumulate operations – MAC), που αποτελούν τον πυρήνα των υπολογισμών στα νευρωνικά δίκτυα, πραγματοποιείται απευθείας εντός του chip, παρακάμπτοντας τις απώλειες εξωτερικής δρομολόγησης.
Η συγκεκριμένη έρευνα εδραιώνει μια εναλλακτική στρατηγική ανάπτυξης. Αντί η βιομηχανία να επικεντρώνεται στην εξαιρετικά δαπανηρή παραγωγή κόμβων των 2nm ή μικρότερων ακραίας υπεριώδους λιθογραφίας (EUV), επιχειρείται η πλήρης αναβάθμιση της αρχιτεκτονικής συλλογιστικής. Το Πανεπιστήμιο του Πεκίνου έχει ήδη καταθέσει τις απαραίτητες αιτήσεις διπλωμάτων ευρεσιτεχνίας για τη δομή των νέων transistor, ενδεικτικό του μελλοντικού εμπορικού προσανατολισμού της τεχνολογίας.
Η εμπορική προοπτική των FeFET του 1nm θα διαμορφώσει νέα δεδομένα στον σχεδιασμό υποδομών τεχνητής νοημοσύνης. Παρόλο που τα παραδοσιακά data centers θα ευνοηθούν, οι σημαντικότερες αλλαγές θα αφορούν τον τομέα του edge computing. Σε συστήματα όπως τα ρομποτικά οχήματα αυτόνομης οδήγησης, τα έξυπνα wearables επόμενης γενιάς και οι βιομηχανικοί αισθητήρες IoT, η χωρητικότητα της μπαταρίας και ο όγκος απαγωγής θερμότητας παραμένουν ανελαστικά μεγέθη. Η ελαχιστοποίηση της ενεργειακής απαίτησης θα επιτρέψει τη λειτουργία πολύπλοκων γενετικών μοντέλων τεχνητής νοημοσύνης σε τοπικό επίπεδο, μηδενίζοντας την εξάρτηση από cloud servers, μειώνοντας τον χρόνο υστέρησης (latency) και προσφέροντας αυξημένη προστασία δεδομένων στους τελικούς χρήστες.
Η ανακοίνωση του Πανεπιστημίου του Πεκίνου επιβεβαιώνει πως η απάντηση στα φυσικά όρια των ημιαγωγών και στις γεωπολιτικές προκλήσεις διαθεσιμότητας τεχνικού εξοπλισμού, βρίσκεται στην αναθεώρηση της ίδιας της αρχιτεκτονικής των chips. Το in-memory computing δεν είναι πλέον μια αποκλειστικά θεωρητική προσέγγιση αλλά η ρεαλιστική διέξοδος για τον χειρισμό των τεράστιων ενεργειακών απαιτήσεων της τεχνητής νοημοσύνης. Ο χρόνος που θα χρειαστεί η εν λόγω τεχνολογία να περάσει από τα εργαστήρια στη γραμμή παραγωγής (wafer-scale manufacturing) αποτελεί τη μοναδική μεταβλητή. Σε κάθε περίπτωση, η μετάβαση από το δόγμα της “εστίασης στα νανόμετρα” στο δόγμα της “δομικής ενεργειακής αποδοτικότητας” θα καθορίσει την επόμενη γενιά συσκευών edge AI.
