ด่วน! เปิดตัวกราฟิกการ์ด NVIDIA GeForce RTX 4090 “Ada Lovelace”

NVIDIA GeForce RTX 4090 มาถึงแล้วในฐานะ BFGPU เจเนอเรชันถัดไป นำเสนอประสิทธิภาพที่ทำลายโลกซึ่งนำการเล่นเกมไปสู่อีกระดับ GeForce RTX 4090 ไม่ได้เป็นเพียง GPU เท่านั้น แต่ยังเป็นผลิตภัณฑ์เรือธงที่นำเสนอ และให้ประสิทธิภาพเพิ่มขึ้นสี่เท่าจากรุ่นก่อน

NVIDIA นำการเล่นเกมไปสู่อีกระดับด้วย GeForce RTX 4090 BFGPU เจเนอเรชันถัดไป ผสมผสานกับ GPU ที่เร็วที่สุดในโลก

GeForce RTX 4090 ของ NVIDIA รอคอยมานานและในที่สุดก็มาถึงแล้ว การ์ดแสดงผลได้รับการออกแบบมาสำหรับผู้คลั่งไคล้และนักเล่นเกมที่ต้องการความคมชัดของภาพที่ดีที่สุด และเพื่อให้บรรลุเป้าหมายนั้น คุณต้องการ GPU ที่ทรงพลังเมื่อพิจารณาว่าเกม AAA เจเนอเรชันถัดไปมีความต้องการสูงเพียงใด เมื่อคำนึงถึงเรื่องนี้ NVIDIA ไม่ได้ผลักดันชิปตัวต่อไปให้เร็วขึ้นสองสามเปอร์เซ็นต์หรือ 50% จากเจนเนอเรชั่นที่แล้ว แต่เร็วขึ้นทั้งหมด 4 เท่าด้วย DLSS และเร็วขึ้น 2 เท่าในความละเอียดดั้งเดิม เพื่อให้แน่ใจว่ากราฟิกการ์ดไม่พร้อมเพียงเท่านั้น สำหรับเกมที่กำลังจะมีขึ้น แต่สำหรับคุณสมบัติที่ได้รับการปรับปรุง เช่น Ray Tracing เป็นต้น

GPU AD102 ‘Ada Lovelace’ ของ NVIDIA – ขุมพลังแห่งอนาคต

หัวใจของกราฟิกการ์ด NVIDIA GeForce RTX 4090 คือ Ada Lovelace AD102 GPU GPU มีขนาด 608,4mm2 และจะใช้โหนดกระบวนการ TSMC 4Nซึ่งเป็นรุ่นที่ได้รับการปรับปรุงของโหนด 5nm (N5) ของ TSMC ที่ออกแบบมาสำหรับทีมสีเขียว GPU มีทรานซิสเตอร์จำนวน 76.3 พันล้านตัว

คาดว่า NVIDIA Ada Lovelace AD103 GPU จะสามารถรองรับได้ถึง 7 GPC (Graphics Processing Clusters) นี่คือจำนวน GPC เดียวกันกับ Ampere GA102 GPU และ GPC เพิ่มเติมอีกหนึ่งตัวบน GA103 GPU GPU แต่ละตัวจะประกอบด้วย 6 TPC และ 2 SMs ซึ่งเป็นการกำหนดค่าเดียวกันกับชิปที่มีอยู่ SM (Streaming Multiprocessor) แต่ละตัวจะมีคอร์ย่อยสี่คอร์ซึ่งเหมือนกับ GA102 GPU สิ่งที่เปลี่ยนแปลงคือการกำหนดค่าหลัก FP32 และ INT32 แต่ละคอร์ย่อยจะมี 128 FP32 ยูนิต แต่ยูนิต FP32+INT32 ที่รวมกันจะสูงถึง 192 เนื่องจากยูนิต FP32 ไม่ได้ใช้คอร์ย่อยเดียวกันกับยูนิต IN32 คอร์ 128 FP32 แยกจากคอร์ 64 INT32

โดยรวมแล้ว แต่ละคอร์ย่อยจะประกอบด้วย 32 FP32 บวก 16 INT32 ยูนิต รวมเป็น 48 ยูนิต SM แต่ละตัวจะมีทั้งหมด 128 FP32 ยูนิต บวก 64 INT32 ยูนิต รวมเป็น 192 ยูนิต และเนื่องจากมีหน่วย SM ทั้งหมด 84 หน่วย (12 หน่วยต่อ GPC) เราจึงกำลังมองหาหน่วย FP32 จำนวน 12,288 หน่วย และ INT32 จำนวน 6,144 หน่วย รวมเป็น 18,432 แกน SM แต่ละรายจะรวมกำหนดการการตัดคำสองรายการ (32 เธรด/CLK) สำหรับการตัดคำ 64 รายการต่อ SM นี่คือการเพิ่มขึ้นของคอร์ 50% (FP32+INT32) และ Wraps/Threads เพิ่มขึ้น 33% เทียบกับ GA102 GPU

NVIDIA AD102 ‘Ada Lovelace’ GPU สำหรับเล่นเกม ‘SM’ บล็อกไดอะแกรม (เครดิตรูปภาพ: Kopite7kimi):

คาดว่า NVIDIA Ada Lovelace AD103 GPU จะสามารถรองรับได้ถึง 7 GPC (Graphics Processing Clusters) นี่คือจำนวน GPC เดียวกันกับ Ampere GA102 GPU และ GPC เพิ่มเติมอีกหนึ่งตัวบน GA103 GPU GPU แต่ละตัวจะประกอบด้วย 6 TPC และ 2 SMs ซึ่งเป็นการกำหนดค่าเดียวกันกับชิปที่มีอยู่ SM (Streaming Multiprocessor) แต่ละตัวจะมีคอร์ย่อยสี่คอร์ซึ่งเหมือนกับ GA102 GPU สิ่งที่เปลี่ยนแปลงคือการกำหนดค่าหลัก FP32 และ INT32 แต่ละคอร์ย่อยจะมี 128 FP32 ยูนิต แต่ยูนิต FP32+INT32 ที่รวมกันจะสูงถึง 192 เนื่องจากยูนิต FP32 ไม่ได้ใช้คอร์ย่อยเดียวกันกับยูนิต IN32 คอร์ 128 FP32 แยกจากคอร์ 64 INT32

โดยรวมแล้ว แต่ละคอร์ย่อยจะประกอบด้วย 32 FP32 บวก 16 INT32 ยูนิต รวมเป็น 48 ยูนิต SM แต่ละตัวจะมีทั้งหมด 128 FP32 ยูนิต บวก 64 INT32 ยูนิต รวมเป็น 192 ยูนิต และเนื่องจากมีหน่วย SM ทั้งหมด 84 หน่วย (12 หน่วยต่อ GPC) เราจึงกำลังมองหาหน่วย FP32 จำนวน 12,288 หน่วย และ INT32 จำนวน 6,144 หน่วย รวมเป็น 18,432 แกน SM แต่ละรายจะรวมกำหนดการการตัดคำสองรายการ (32 เธรด/CLK) สำหรับการตัดคำ 64 รายการต่อ SM นี่คือการเพิ่มขึ้นของคอร์ 50% (FP32+INT32) และ Wraps/Threads เพิ่มขึ้น 33% เทียบกับ GA102 GPU

NVIDIA AD102 ‘Ada Lovelace’ GPU สำหรับเล่นเกม ‘SM’ บล็อกไดอะแกรม (เครดิตรูปภาพ: Kopite7kimi):

ย้ายไปยังแคช นี่เป็นอีกส่วนหนึ่งที่ NVIDIA ได้ให้การสนับสนุนอย่างมากเหนือ Ampere GPUs ที่มีอยู่ Ada Lovelace GPU จะแพ็ก L1 cache 192 KB ต่อ SM เพิ่มขึ้น 50% เมื่อเทียบกับ Ampere นั่นคือแคช L1 ทั้งหมด 4.5 MB บน AD102 GPU อันดับต้น ๆ แคช L2 จะเพิ่มขึ้นเป็น 96 MB ตามที่กล่าวไว้ในการรั่วไหล นี่เป็นการเพิ่มขึ้น 16 เท่าของ Ampere GPU ที่โฮสต์แคช L2 เพียง 6 MB แคชจะถูกแชร์ข้าม GPU

สุดท้าย เรามี ROP ซึ่งเพิ่มขึ้นเป็น 32 ต่อ GPC เพิ่มขึ้น 2 เท่าเมื่อเทียบกับแอมแปร์ คุณกำลังดู ROP สูงสุด 384 ROP บนเรือธงเจเนอเรชันถัดไป เทียบกับเพียง 112 บน Ampere GPU ที่เร็วที่สุด นั่นคือ RTX 3090 Ti นอกจากนี้ยังมีคอร์ 4th Generation Tensor และ 3rd Generation RT (Raytracing) รุ่นล่าสุดที่รวมเข้ากับ Ada Lovelace GPUs ซึ่งจะช่วยเพิ่มประสิทธิภาพ DLSS & Raytracing ไปอีกระดับ โดยรวมแล้ว Ada Lovelace AD102 GPU จะนำเสนอ:

  • 2x GPC (เทียบกับแอมแปร์)
  • แกนมากกว่า 50% (เทียบกับแอมแปร์)
  • แคช L1 มากกว่า 50% (เทียบกับแอมแปร์)
  • แคช L2 มากกว่า 16 เท่า (เทียบกับแอมแปร์)
  • ROP สองเท่า (เทียบกับแอมแปร์)
  • 4th Gen Tensor & 3rd Gen RT Cores

NVIDIA GeForce RTX 4090 ‘เป็นทางการ’ ข้อมูลจำเพาะ

NVIDIA GeForce RTX 4090จะใช้ 128 SMs จาก 144 SMs รวมเป็น 16,384 CUDA cores GPU จะมาพร้อมกับแคช L2 ขนาด 96 MB และ ROP ทั้งหมด 384 ตัว ซึ่งถือว่าบ้ามาก แต่เมื่อพิจารณาว่า RTX 4090 เป็นการออกแบบที่ลดขนาดลง อาจมีจำนวน L2 และ ROP ที่ต่ำกว่าเล็กน้อย ความเร็วสัญญาณนาฬิกายังไม่ได้รับการยืนยัน แต่เมื่อพิจารณาว่ากำลังใช้กระบวนการ TSMC 4N ความเร็วสัญญาณนาฬิกาอยู่ที่ 2.6 GHz และ NVIDIA อ้างว่ามีความเร็วมากกว่า 3 GHz ด้วยการโอเวอร์คล็อก ซึ่งคุณสามารถอ่านเพิ่มเติมได้ที่นี่

สำหรับข้อมูลจำเพาะของหน่วยความจำ GeForce RTX 4090 จะมีความจุ 24 GB GDDR6X ซึ่งจะถูกโอเวอร์คล็อกที่ความเร็ว 21 Gbps บนอินเทอร์เฟซบัส 384 บิต ซึ่งจะให้แบนด์วิดธ์สูงถึง 1 TB/s นี่เป็นแบนด์วิดธ์เดียวกันกับการ์ดกราฟิก RTX 3090 Ti ที่มีอยู่ และเท่าที่เกี่ยวข้องกับการใช้พลังงาน TBP ได้รับการจัดอันดับที่ 450W การ์ดจะใช้พลังงานจากคอนเน็กเตอร์ 16 พินเพียงตัวเดียวซึ่งให้พลังงานสูงถึง 600W โมเดลที่กำหนดเองจะเสนอเป้าหมาย TBP ที่สูงขึ้น

ประสิทธิภาพกราฟิกการ์ด NVIDIA GeForce RTX 4090

สำหรับประสิทธิภาพของ GPU มอนสเตอร์เหล่านี้ NVIDIA ได้แชร์ตัวเลขประสิทธิภาพในการคำนวณและการเล่นเกม และดูเหมือนว่า GeForce RTX 4090 จะเป็นการ์ดเกมตัวแรกที่แตะ 100 TFLOPs ที่คำนวณขีดจำกัดแรงม้า

เพียงเพื่อประโยชน์ของการเปรียบเทียบ:

  • NVIDIA GeForce RTX 4090: 90 TFLOPs (FP32) (สมมติว่านาฬิกา 2.8 GHz)
  • NVIDIA GeForce RTX 3090 Ti: 40 TFLOP (FP32) (1.86 GHz Boost clock)
  • NVIDIA GeForce RTX 3090: 36 TFLOPs (FP32) (1.69 GHz Boost clock)

ตามความเร็วสัญญาณนาฬิกาตามทฤษฎีที่ 2.8 GHz คุณจะได้รับประสิทธิภาพการประมวลผลสูงสุด 103 TFLOP และข่าวลือก็แนะนำ Boost Clock ให้สูงขึ้นไปอีก ตอนนี้ สิ่งเหล่านี้ฟังดูเหมือนพีคคล็อก คล้ายกับความถี่สูงสุดของ AMD ซึ่งสูงกว่านาฬิกา ‘เกม’ โดยเฉลี่ย ประสิทธิภาพการประมวลผลมากกว่า 100 TFLOPs หมายถึงแรงม้ามากกว่าสองเท่าเมื่อเทียบกับรุ่นเรือธง 3090 Ti แต่สิ่งหนึ่งที่ควรระลึกไว้เสมอว่าประสิทธิภาพการประมวลผลไม่ได้บ่งบอกถึงประสิทธิภาพการเล่นเกมโดยรวมเสมอไป แต่ถึงแม้จะเป็นเช่นนั้น มันจะเป็นการอัพเกรดครั้งใหญ่สำหรับพีซีสำหรับเล่นเกมและเพิ่มขึ้น 8.5 เท่าจากคอนโซลที่เร็วที่สุดในปัจจุบัน นั่นคือ Xbox Series X

นี่จะเป็นการเพิ่มประสิทธิภาพการประมวลผล 2 เท่าและประสิทธิภาพการเล่นเกมเพิ่มขึ้น 2 เท่าตามที่ NVIDIA ได้แสดงให้เห็นสำหรับการ์ดกราฟิกแต่ละรุ่นเมื่อเทียบกับรุ่นก่อน และสิ่งนี้ไม่ได้คำนึงถึงประสิทธิภาพหลักของ RT และ Tensor ซึ่งคาดว่าจะได้รับการปรับปรุงที่สำคัญเช่นกัน สาขา. การเพิ่มขึ้น 2-4 เท่าจาก RTX 3090 & RTX 3090 Ti จะก่อกวน อย่าง มาก

นักเล่นเกมควรคาดหวังว่าการเล่นเกม 4K จะราบรื่นเหมือนเนยบนกราฟิกการ์ดเหล่านี้ และด้วย DLSS เราอาจเห็น 60 FPS ที่เล่นได้ที่ความละเอียด 8K ซึ่ง NVIDIA ได้พยายามทำให้สำเร็จด้วย RTX 3090 series BFGPUs มาระยะหนึ่งแล้ว

ราคาและการวางจำหน่ายกราฟิกการ์ด NVIDIA GeForce RTX 4090

ตอนนี้มาถึงราคาแล้ว กราฟิกการ์ด NVIDIA GeForce RTX 3090 Ti & RTX 3090ไม่ต้องสงสัยเลยว่าเป็น GPU ชิปเดี่ยวที่แพงที่สุดในปัจจุบัน NVIDIA GeForce RTX 4090 จะวางจำหน่ายในราคา $1599 US สำหรับรุ่น Founders Edition และจะวางจำหน่ายในวันที่ 12 ตุลาคมนี้

กราฟิกการ์ด NVIDIA GeForce RTX 40 ซีรีส์มีข่าวลือว่าจะเปิดตัวกลางเดือนกรกฎาคม และในขณะที่เราได้เห็นฝาครอบที่เย็นกว่าของ RTX 4090 Ti รั่วไหลออกมาก่อนหน้านี้ NVIDIA ยังคงปล่อยตัวแปรที่ไม่ใช่ Ti ก่อนด้วยตัวแปร RTX 4090 Ti ที่โจมตี ตลาดมากในภายหลัง แต่นี่ไม่ใช่ครั้งแรกที่ NVIDIA เปิดตัว SKU ระดับไฮเอนด์ในช่วงเริ่มต้นของรุ่นต่อไป เรือธง RTX 2080 Ti เปิดตัวพร้อมกับกลุ่มผลิตภัณฑ์ที่เหลือแม้ว่า GTX 1080 Ti รุ่นก่อนก็ปรากฏตัวขึ้นหลายเดือนหลังจากการเปิดตัวกลุ่มผลิตภัณฑ์เริ่มต้น RTX 3090 เปิดตัวพร้อมกับการ์ดซีรีย์ RTX 30 ในบรรทัดเริ่มต้น แต่ 3090 Ti มาช้ากว่าหนึ่งปี คราวนี้ NVIDIA สามารถเปิดตัวทั้งครอบครัวตั้งแต่เริ่มต้นและไปรีเฟรชกลางรอบในภายหลัง แต่ยังคงต้องรอดู

ข้อมูลจำเพาะเบื้องต้นของ NVIDIA GeForce RTX 40 Series:

ชื่อการ์ดจอ NVIDIA GEFORCE RTX 4090 NVIDIA GEFORCE RTX 4080 16G NVIDIA GEFORCE RTX 4080 12G NVIDIA GEFORCE RTX 3090 TI NVIDIA GEFORCE RTX 3080
ชื่อ GPU เอด้า เลิฟเลซ AD102-300? เอด้า เลิฟเลซ ค.ศ.103-300? เอด้า เลิฟเลซ AD104-400? แอมแปร์ GA102-225 แอมแปร์ GA102-200
โหนดกระบวนการ TSMC 4N TSMC 4N TSMC 4N ซัมซุง 8 นาโนเมตร ซัมซุง 8 นาโนเมตร
ขนาดตาย 608mm2 ~450mm2 ~450mm2 628.4mm2 628.4mm2
ทรานซิสเตอร์ 76 พันล้าน จะแจ้งภายหลัง จะแจ้งภายหลัง 28 พันล้าน 28 พันล้าน
CUDA Cores 16384 9728 7680 10240 8704
TMUs / ROPs จะแจ้งภายหลัง จะแจ้งภายหลัง จะแจ้งภายหลัง 320 / 112 272 / 96
แกนเทนเซอร์ / RT TBD / TBD TBD / TBD TBD / TBD 320 / 80 272 / 68
นาฬิกาฐาน 2230 MHz 2210 MHz 2310 MHz 1365 MHz 1440 MHz
เพิ่มนาฬิกา 2520 MHz 2510 MHz 2610 MHz 1665 MHz 1710 MHz
FP32 คอมพิวเตอร์ 90 TFLOPs 49 TFLOPs 40 TFLOPs 34 TFLOPs 30 TFLOPs
RT TFLOPs จะแจ้งภายหลัง จะแจ้งภายหลัง จะแจ้งภายหลัง 67 TFLOP 58 TFLOPs
Tensor-TOPs จะแจ้งภายหลัง จะแจ้งภายหลัง จะแจ้งภายหลัง 273 TOPs 238 ท็อปส์
ความจุหน่วยความจำ 24 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X 12 GB GDDR6X 10 GB GDDR6X
เมมโมรี่บัส 384 บิต 256 บิต 192 บิต 384 บิต 320 บิต
ความเร็วหน่วยความจำ 21.0 Gbps 23.0 Gbps 21.0 Gbps 19 Gbps 19 Gbps
แบนด์วิดธ์ 1008 GB/วินาที 736 GB/วินาที 504 GB/วินาที 912 Gbps 760 Gbps
TBP 450W 320W 285W 350W 320W
ราคา (MSRP / FE) $1599 US $1199 US 899 เหรียญสหรัฐ $1199 $699 US
เปิดตัว (ความพร้อมใช้งาน) ตุลาคม 2022 พฤศจิกายน 2022 พฤศจิกายน 2022 3 มิถุนายน 2564 วันที่ 17 กันยายน 2563

ณ ตอนนี้ มีข่าวลือออกมาว่าจะเปิดตัวกลางเดือนกรกฎาคม ดังนั้นเราจึงต้องรออีกสองเดือนเพื่อดูว่ามันจะไปได้ดีแค่ไหน!

แหล่งที่มา : 

                      wccftech.com