NVIDIA เปิดเผยผลทดสอบเบื้องต้นของ Vera CPU ชิปเซิร์ฟเวอร์ Arm รุ่นใหม่ที่บรรจุ 88 คอร์ "Olympus" ซึ่งตามรายงานจาก Phoronix ระบุว่าสามารถทำคะแนนสูงกว่า Grace รุ่นก่อนถึง 63% และยังนำหน้า AMD EPYC 9575F กับ Intel Xeon 6980P ในชุดทดสอบเดียวกัน ทั้งนี้ผลดังกล่าวมาจากฮาร์ดแวร์ก่อนการผลิตจริง จึงควรติดตามตัวเลขสุดท้ายก่อนสรุป

ตัวเลขที่ Phoronix วัดได้ — Vera นำหน้าทั้ง EPYC และ Xeon

ตามรายงานที่ Wccftech อ้างอิงจาก Phoronix ผลการทดสอบในรูปแบบ Geomean (ค่าเฉลี่ยเรขาคณิต) ของชุดเบนช์มาร์กทั้งหมดแสดงให้เห็นว่า NVIDIA Vera มีประสิทธิภาพเหนือกว่าคู่แข่งในตลาดปัจจุบันอย่างชัดเจน

CPUจำนวนคอร์ผลเทียบกับ Vera
NVIDIA Vera88 คอร์ Olympusเกณฑ์อ้างอิง
NVIDIA Grace72 คอร์Vera เร็วกว่า 63%
AMD EPYC 9575F64 คอร์ Zen 5 / 5GHzVera เร็วกว่า 10%
Intel Xeon 6980P128 คอร์ (Granite Rapids)Vera เร็วกว่า 55%

Phoronix สรุปว่า Vera คือ "ARM Linux Server Processor ที่มีประสิทธิภาพสูงสุดเท่าที่เคยทดสอบมา" อย่างไรก็ตาม ผลดังกล่าวเป็นค่าเฉลี่ยรวมของชุดทดสอบเฉพาะ ไม่ใช่ตัวเลขสำหรับทุกสถานการณ์การใช้งาน

สถาปัตยกรรม Olympus — ออกแบบเองครั้งแรกในรอบ 10 ปี

คอร์ Olympus ที่อยู่ใน Vera ถือเป็นการออกแบบ CPU ภายในองค์กรของ NVIDIA อย่างสมบูรณ์ครั้งแรกนับตั้งแต่สถาปัตยกรรม Denver ซึ่งห่างกันราว 10 ปี Grace รุ่นก่อนใช้คอร์ Arm Neoverse V2 สำเร็จรูป แต่ Olympus สร้างขึ้นใหม่ทั้งหมดบนพื้นฐาน Arm v9.2-A

จุดเด่นของสถาปัตยกรรมนี้ประกอบด้วย:

  • Front-end 10-wide สำหรับการดึงและถอดรหัสคำสั่ง พร้อม Neural Branch Predictor
  • Spatial Multi-Threading แบ่งทรัพยากรทางกายภาพเพื่อรัน 2 ฮาร์ดแวร์เธรดต่อคอร์ รวม 88 คอร์ 176 เธรด
  • รองรับ RAM สูงสุด 1.5TB LPDDR5x (SOCAMM) พร้อมแบนด์วิดท์หน่วยความจำ 1.2TB/s และ NVLink-C2C ที่ 1.8TB/s
  • ตัวชิป CPU มีทรานซิสเตอร์รวม 22,700 ล้านตัว

ข้อมูลที่ยังขาดหาย — ประสิทธิภาพต่อวัตต์ยังไม่เปิดเผย

ประเด็นสำคัญที่ต้องระวังคือ Phoronix ระบุว่าไม่ได้รับอนุญาตให้เผยแพร่ผลทดสอบ Performance per Watt (ประสิทธิภาพต่อการใช้พลังงาน) ซึ่งเป็นตัวชี้วัดหลักในการประเมิน CPU สำหรับดาต้าเซ็นเตอร์

NVIDIA เองอ้างว่า Vera มีประสิทธิภาพสูงกว่า x86 รุ่นปัจจุบัน 50% และมีประสิทธิภาพต่อวัตต์ดีกว่าถึง 2 เท่า รวมถึงความหนาแน่นต่อแร็คสูงกว่า 4 เท่า แต่ตัวเลขเหล่านี้ยังไม่ได้รับการยืนยันจากการทดสอบอิสระ

ฮาร์ดแวร์ที่ใช้ทดสอบยังเป็นตัวอย่างก่อนการผลิตจริง ดังนั้นตัวเลขสุดท้ายอาจเปลี่ยนแปลงได้หลังจากการปรับแต่งพลังงานและการเพิ่มประสิทธิภาพก่อนจัดส่ง

Vera Rubin NVL72 และการส่งมอบให้ OpenAI, Anthropic, SpaceX, Oracle

NVIDIA ประกาศว่า Vera เข้าสู่การผลิตเต็มรูปแบบแล้ว โดยส่งมอบแร็ค CPU ชุดแรกให้กับ OpenAI, SpaceX, Anthropic และ Oracle ด้วยตนเอง นับเป็นครั้งแรกที่ NVIDIA จำหน่าย CPU เป็นผลิตภัณฑ์แยกต่างหากในเชิงพาณิชย์

ในระดับแร็ค ผลิตภัณฑ์หลักคือ Vera Rubin NVL72 ซึ่งรวม Rubin GPU 72 ตัวกับ Vera CPU 36 ตัว โดยมีสเปกสำคัญดังนี้:

ตัวชี้วัดค่าของ Vera Rubin NVL72
จำนวน Rubin GPU72 ตัว
จำนวน Vera CPU36 ตัว
ประสิทธิภาพ NVFP4 Inference3.6 EFLOPS

Rubin GPU มีทรานซิสเตอร์ 33,600 ล้านตัว รองรับ HBM4 สูงสุด 288GB และแบนด์วิดท์หน่วยความจำ 22TB/s NVIDIA อ้างว่าเมื่อเทียบกับ Blackwell สามารถลดจำนวน GPU ลงเหลือ 1 ใน 4 สำหรับการเทรน MoE และลดต้นทุนต่อโทเค็นลงเหลือ 1 ใน 10 สำหรับ MoE Inference

สำหรับการเข้าถึงผ่านคลาวด์ NVIDIA ระบุพาร์ทเนอร์เปิดตัวได้แก่ AWS, Google Cloud, Microsoft Azure, Oracle Cloud รวมถึง CoreWeave, Lambda, Nebius และ Nscale โดยคาดว่าจะพร้อมให้บริการในช่วงครึ่งหลังของปี 2026

คู่แข่งรุ่นถัดไปกำลังตามมา — EPYC Venice และ Diamond Rapids

แม้ตัวเลขของ Vera จะน่าประทับใจ แต่การแข่งขันยังไม่จบ AMD กำลังเตรียม EPYC Venice ที่ใช้คอร์ Zen 6 ซึ่งเข้าสู่การผลิตแล้วและมีกำหนดเปิดตัวในช่วงครึ่งหลังของปี 2026 ขณะที่ Intel เองก็เตรียม Diamond Rapids ไว้รับมือ นอกจากนี้ Qualcomm และ Arm ยังพัฒนา CPU สำหรับดาต้าเซ็นเตอร์ที่มุ่งเป้าตลาด Agentic AI เช่นกัน

กล่าวอีกนัยหนึ่ง ผลเบนช์มาร์กครั้งนี้แสดงให้เห็นความได้เปรียบของ Vera เหนือรุ่นปัจจุบัน แต่การเปรียบเทียบกับคู่แข่งรุ่นถัดไปยังต้องรอผลทดสอบที่ครบถ้วนกว่านี้ Wccftech รายงานว่า NVIDIA ตั้งเป้าครองอันดับหนึ่งด้านการจัดหา CPU ในปี 2026 พร้อมเป้าหมายรายได้จาก Vera ที่ 2 หมื่นล้านดอลลาร์สหรัฐ (ประมาณ 720,000 ล้านบาท)

สำหรับผู้ใช้บริการ AI Cloud ในไทยและภูมิภาคเอเชียตะวันออกเฉียงใต้ การที่ AWS, Google Cloud และ Microsoft Azure อยู่ในรายชื่อพาร์ทเนอร์เปิดตัวหมายความว่าโครงสร้างพื้นฐาน AI ที่ขับเคลื่อนด้วย Vera อาจเข้าถึงได้ผ่านบริการคลาวด์ที่ใช้งานอยู่แล้ว ซึ่งอาจส่งผลให้ความเร็วในการตอบสนองของบริการ AI และต้นทุนการประมวลผลปรับตัวดีขึ้นในระยะกลาง

แหล่งที่มา