หัวเว่ยประกาศเปิดตัวสถาปัตยกรรม AI รุ่นใหม่ “SuperPoDs” และ “SuperClusters” บนเวที HUAWEI CONNECT 2025 ชูแนวคิดเชื่อมต่อชิป AI จำนวนมหาศาลให้ทำงานเสมือนเป็นคอมพิวเตอร์เครื่องเดียว เพื่อตอบโจทย์การฝึกและให้บริการโมเดลขนาดใหญ่ระดับองค์กรและศูนย์ข้อมูล[1][2]
หัวใจคือเทคโนโลยี SuperPoD Interconnect โครงข่ายเชื่อมต่อความหน่วงต่ำแบนด์วิดท์สูง ที่ออกแบบให้รวมศูนย์การจัดการคอมพิวต์ เครือข่าย การจัดเก็บ และซอฟต์แวร์ในระดับแร็ก ไปจนถึงการรวมหลาย SuperPoD เป็น “SuperCluster” เพื่อสเกลแรงประมวลผลได้แบบเป็นขั้นบันได คล้ายแนวทางของผู้เล่นชั้นนำ แต่เน้นเปิดกว้างและทำงานร่วมกับชิป Ascend รุ่นใหม่ของหัวเว่ยได้เต็มประสิทธิภาพ[3][4]
คุณสมบัติเด่นที่ประกาศมีดังนี้:
- การเชื่อมต่อสูงสุดระดับหลายหมื่นการ์ดในหนึ่งคลัสเตอร์ โดย SuperPoD สามารถต่อรวมกันเป็น SuperCluster เพื่อมองเห็นเป็นโหนดตรรกะเดียว ลดโอเวอร์เฮดการกระจายงานและการสื่อสารข้ามโหนด[5][6]
- ระบบซอฟต์แวร์และการจัดการแบบรวมศูนย์สำหรับงานฝึกและเสิร์ฟโมเดล รองรับการขยายแบบยืดหยุ่นตั้งแต่ระดับตู้แร็กไปจนถึงศูนย์ข้อมูลขนาดใหญ่[7]
- สถาปัตยกรรมเครือข่ายความหน่วงต่ำ ออกแบบแข่งกับโซลูชันสื่อสารระหว่างชิปของผู้ผลิตรายอื่น เพื่อลดคอขวดของงาน LLM และงานมัลติโมดัลสมัยใหม่[8]
ด้านตัวเลขประสิทธิภาพและโร้ดแมป หัวเว่ยระบุชุดระบบ Atlas 950 SuperPoD และ 960 SuperPoD ที่ใช้ NPU ตระกูล Ascend รุ่นใหม่ โดยรุ่นท็อปสามารถรวมได้ถึง 15,488 NPU ต่อหนึ่ง SuperPoD และเมื่อรวมเป็น Atlas 950 SuperCluster จำนวน 64 SuperPoD จะได้เครื่องระดับศูนย์ข้อมูลมากกว่าสิบพันตู้ เชื่อมโยงด้วยใยแก้วนำแสง ให้สมรรถนะสูงสุดราว 524 ExaFLOPS (FP8) สำหรับงานเทรนนิ่ง และแตะระดับ 1 ZettaFLOPS (FP4/MXFP4) สำหรับงานอินเฟอเรนซ์ ตามการรายงานเชิงเทคนิคจากสื่อสายฮาร์ดแวร์[9][10]
บริบทการแข่งขันก็สำคัญ การเปิดตัวครั้งนี้เกิดขึ้นท่ามกลางข้อจำกัดด้านการเข้าถึงฮาร์ดแวร์จากต่างประเทศของบริษัทเทคจีน การมีโครงสร้างพื้นฐาน AI ทางเลือกที่สเกลได้ ทำให้ลูกค้าในประเทศสามารถเดินหน้าพัฒนาโมเดลขนาดใหญ่ได้ต่อเนื่อง ขณะที่หัวเว่ยชี้ว่า SuperPoDs และ SuperClusters รุ่นล่าสุดตั้งเป้าเป็นระบบที่ทรงพลังที่สุดในโลก และจะทยอยวางจำหน่ายตามโร้ดแมปของชิป Ascend ตั้งแต่ปี 2026 เป็นต้นไป[11][12][13]
แหล่งอ้างอิง: ข่าวประชาสัมพันธ์และบทความเทคนิคของหัวเว่ย พร้อมบทวิเคราะห์จากสื่อเทคระดับสากล และรายงานโร้ดแมปชิป AI เพื่อประกอบการตรวจสอบข้อมูล[14][15][16][17][18][19][20]
