Οι κάρτες RTX 3000 της NVIDIA καθιστούν περιττές τις μετρήσεις teraflop

NVIDIA AMPERE SM


Η πιο δημοφιλής GPU μεταξύ των χρηστών του Steam σήμερα, το σεβαστό GTX 1060 της NVIDIA, είναι ικανό να εκτελεί 4.4 teraflops, το 2080 Ti, το οποίο σύντομα θα σφετεριστεί, μπορεί να χειριστεί περίπου το 13,5 και το επερχόμενο Xbox Series X μπορεί διαχείριση 12. Αυτοί οι αριθμοί υπολογίζονται λαμβάνοντας τον αριθμό των πυρήνων shader σε ένα τσιπ, πολλαπλασιάζοντάς τον με την μέγιστη ταχύτητα ρολογιού της κάρτας και μετά πολλαπλασιάζοντας ότι από τον αριθμό οδηγιών ανά ρολόι. Σε αντίθεση με πολλά στοιχεία που βλέπουμε στο χώρο του υπολογιστή, είναι ένας δίκαιος και διαφανής υπολογισμός, αλλά αυτό δεν το κάνει καλό μέτρο της απόδοσης του παιχνιδιού.

Σχεδόν κάθε οικογένεια GPU διαθέτει αυτά τα γενεά οφέλη

Το AMD’s RX 580, ένα 2017 6,17 teraflop GPU, για παράδειγμα, αποδίδει παρόμοια με το RX 5500, μια κάρτα 5.2 teraflop προϋπολογισμού που κυκλοφόρησε από την εταιρεία πέρυσι. Αυτό το είδος «κρυφής» βελτίωσης μπορεί να αποδοθεί σε πολλούς παράγοντες, από αρχιτεκτονικές αλλαγές έως προγραμματιστές παιχνιδιών που χρησιμοποιούν νέες δυνατότητες, αλλά σχεδόν κάθε οικογένεια GPU διαθέτει αυτά τα γενετικά οφέλη. Αυτός είναι ο λόγος για τον οποίο το Xbox Sequence X, για παράδειγμα, πρέπει να ξεπεράσει το Xbox 1 X περισσότερο από ό, τι υποδεικνύουν οι αριθμοί “12 έναντι 6 teraflops”. (Το ίδιο για PS5 και PS4 Professional.)

Το θέμα είναι, ακόμη και στην ίδια εταιρεία GPU κάθε χρόνο, οι αλλαγές στον τρόπο με τον οποίο σχεδιάζονται οι μάρκες και τα παιχνίδια καθιστούν δυσκολότερο να διακρίνουμε τι ακριβώς σημαίνει “ένα teraflop” για την απόδοση των παιχνιδιών. Πάρτε μια κάρτα AMD και μια κάρτα NVIDIA οποιασδήποτε γενιάς και η σύγκριση είναι ακόμη λιγότερο πολύτιμη.

https://www.youtube.com/look at?v=7QeoZY4tf9I

Όλα μας φέρνουν στη σειρά RTX 3000. Έρχονται με μερικές πραγματικά συγκλονιστικές προδιαγραφές. Το RTX 3070, μια κάρτα $ 500, έχει 5.888 πυρήνες από το cuda (το όνομα NVIDIA για shaders) ικανό για 20 teraflops. Τι γίνεται με τη νέα κάρτα ναυαρχίδας 1.500 $, το RTX 3090 10.496 πυρήνες, για 36 teraflops. Για λόγους περιβάλλοντος, η RTX 2080 Ti, που είναι σήμερα η καλύτερη διαθέσιμη κάρτα γραφικών “καταναλωτών”, διαθέτει 4.352 “cuda main”. Ως εκ τούτου, η NVIDIA αύξησε τον πυρήνα της ναυαρχίδας της κατά περισσότερο από 140% και την ικανότητα της teraflop κατά περισσότερο από 160%.

Λοιπόν, το έκανε και δεν είναι.

Οι κάρτες NVIDIA αποτελούνται από πολλούς “πολυεπεξεργαστές ροής” ή SM. Καθένας από τους 68 “Turing” SM του 2080 Ti περιέχει, μεταξύ πολλών άλλων, 64 “FP32” cuda πυρήνες αφιερωμένους σε floating stage math και 64 “INT32” main αφιερωμένους σε ακέραια μαθηματικά (ακέραιοι υπολογισμοί).

Η μεγάλη καινοτομία στο Turing SM, εκτός από την επιτάχυνση της τεχνητής νοημοσύνης και της ακτινοβολίας, ήταν η ικανότητα εκτέλεσης μαθημάτων ακέραιου και κινητού σημείου ταυτόχρονα. Αυτή ήταν μια σημαντική αλλαγή από την προηγούμενη γενιά, Pascal, όπου οι τράπεζες πυρήνων άλλαξαν από ακέραιους σε κυμαινόμενο σημείο στη μία ή την άλλη βάση.

NVIDIA

Οι κάρτες RTX 3000 είναι χτισμένες σε μια αρχιτεκτονική που η NVIDIA ονομάζει “Ampere” και η SM της υιοθετεί κάπως τις προσεγγίσεις Pascal και Turing. Το Ampere διατηρεί τους 64 πυρήνες FP32 όπως πριν, αλλά οι άλλοι 64 πυρήνες έχουν πλέον χαρακτηριστεί ως “FP32 είναι INT32. “Έτσι, οι μισοί πυρήνες του Αμπέρ είναι αφιερωμένοι σε κυμαινόμενο σημείο, αλλά το άλλο μισό μπορεί να κάνει κυμαινόμενο σημείο ή ακέραιους υπολογισμούς, όπως και στο Pascal.

Με αυτόν τον διακόπτη, το NVIDIA μετρά τώρα κάθε SM ότι περιέχει 128 πυρήνες FP32, αντί για το 64 που είχε ο Turing. Οι “5.888 πυρήνες cuda” της δεκαετίας του 3070 περιγράφονται ίσως καλύτερα ως “2.944 πυρήνες cuda και 2.944 πυρήνες που μπορεί γίνε κούδα. “

Καθώς τα παιχνίδια έγιναν πιο περίπλοκα, οι προγραμματιστές άρχισαν να βασίζονται περισσότερο στο σύνολο. Μια διαφάνεια NVIDIA από την αρχική κυκλοφορία του 2018 RTX πρότεινε ότι τα ακέραια μαθηματικά, κατά μέσο όρο, αποτελούσαν περίπου το ένα τέταρτο των λειτουργιών GPU στο παιχνίδι.

Το μειονέκτημα του Turing SM είναι το ενδεχόμενο υποχρησιμοποίησης. Εάν, για παράδειγμα, ένας φόρτος εργασίας αποτελείται από έναν ακέραιο αριθμό 25 τοις εκατό, περίπου το ένα τέταρτο των πυρήνων GPU θα μπορούσε να κάθεται χωρίς να κάνει τίποτα. Αυτή είναι η σκέψη πίσω από αυτήν τη νέα ημι-ενοποιημένη δομή πυρήνα, και σε χαρτί, έχει πολύ νόημα: μπορείτε ακόμα να εκτελείτε ακέραιες και κυμαινόμενες λειτουργίες ταυτόχρονα, αλλά όταν αυτοί οι ακέραιοι πυρήνες είναι αδρανείς, μπορούν να κάνουν επιπλέον σημείο.

[This episode of Upscaled was produced before NVIDIA explained the SM changes.]

Κατά την κυκλοφορία του RTX 3000 της NVIDIA, ο Διευθύνων Σύμβουλος Jensen Huang δήλωσε ότι το RTX 3070 είναι “πιο ισχυρό από το RTX 2080 Ti”. Χρησιμοποιώντας ό, τι γνωρίζουμε τώρα για το σχεδιασμό, τον ακέραιο, τον κινητήρα, την ταχύτητα του ρολογιού και τα teraflops της Ampere, μπορούμε να δούμε πώς θα μπορούσαν να πάνε τα πράγματα. Σε αυτό το “25% ακέραιος” φόρτος εργασίας, 4.416 από αυτούς τους πυρήνες θα μπορούσαν να κάνουν υπολογισμούς FP32, με 1.472 χειρισμό του απαραίτητου INT32.

Μαζί με όλες τις άλλες αλλαγές που έκανε το Ampere, το 3070 θα μπορούσε να ξεπεράσει το 2080 Ti κατά 10%, υποθέτοντας ότι το παιχνίδι δεν πειράζει να έχει 8 GB αντί για 11 GB μνήμης για να εργαστεί. Στο απόλυτο χειρότερο σενάριο (και πολύ απίθανο), όπου ο φόρτος εργασίας εξαρτάται εξαιρετικά από έναν ακέραιο, μπορεί να συμπεριφέρεται περισσότερο όπως το 2080. Από την άλλη πλευρά, εάν ένα παιχνίδι απαιτεί πολύ λίγα ακέραια μαθηματικά, η ώθηση πάνω από 2080 Ti μπορεί να είσαι τεράστιος.

Πέρα από τη φαντασία, μέχρι στιγμής έχουμε ένα σημείο σύγκρισης: α Ψηφιακό χυτήριο βίντεο που συγκρίνει το RTX 3080 με το RTX 2080. DF έχει σημειώσει αύξηση 70 έως 90% μεταξύ των γενεών σε διαφορετικά παιχνίδια που έχει υποβάλει η NVIDIA για δοκιμή, με το υψηλότερο κενό απόδοσης στους τίτλους που χρησιμοποιούν λειτουργίες RTX όπως η ανίχνευση ακτίνων. Αυτό το εύρος δίνει μια ιδέα για το είδος της μεταβλητής απόδοσης που θα περιμέναμε με τους νέους κοινόχρηστους πυρήνες. Θα είναι ενδιαφέρον να δούμε πώς θα αποδίδει μια μεγαλύτερη σουίτα παιχνιδιών, καθώς το NVIDIA είναι πιθανό να έχει δώσει τα καλύτερα με την επιτρεπόμενη επιλογή παιχνιδιού. Αυτό που δεν θα δείτε είναι η σχεδόν 3x βελτίωση που θα σήμαινε το άλμα από το 2080 teraflop στο 3080 teraflop.

https://www.youtube.com/view?v=cWD01yUQdVA

Με τις πρώτες κάρτες RTX 3000 να έρχονται σε εβδομάδες, μπορείτε να περιμένετε κριτικές για να σας δώσει μια καλή ιδέα για την απόδοση του Ampere σύντομα. Αν και ακόμη και τώρα είναι ασφαλές να πούμε ότι το Ampere αντιπροσωπεύει ένα τεράστιο άλμα προς τα εμπρός για gaming Pc. Τα $ 499 3070 είναι πιθανό να ανταλλάξουν επιτυχίες με την τρέχουσα ναυαρχίδα, και τα $ 799 3080 θα πρέπει να προσφέρουν περισσότερες από αρκετές επιδόσεις για όσους είχαν προηγουμένως επιλέξει το “Ti”. Ωστόσο, αυτές οι κάρτες ευθυγραμμίζονται, ωστόσο, είναι σαφές ότι η αξία τους δεν μπορεί πλέον να αντιπροσωπεύεται από μια μοναδική φιγούρα όπως τα teraflops.



[via]

Απάντηση

Αυτός ο ιστότοπος χρησιμοποιεί το Akismet για να μειώσει τα ανεπιθύμητα σχόλια. Μάθετε πώς υφίστανται επεξεργασία τα δεδομένα των σχολίων σας.