การปฏิวัติการระบายความร้อนด้วยของเหลวของ Nvidia สำหรับเซิร์ฟเวอร์ AI
การใช้พลังงานของชิป AI ที่ล้ำสมัยนั้นเพิ่มขึ้นอย่างต่อเนื่อง ซึ่งกลายเป็นตัวเร่งให้เซิร์ฟเวอร์ DGX AI รุ่นต่อไปเปลี่ยนมาใช้การระบายความร้อนด้วยของเหลว TDP (พลังการออกแบบเชิงความร้อน) ปัจจุบันของ H100 GPU รุ่นเรือธงของ Nvidia อยู่ที่ 700W ซึ่งเกินขีดจำกัดของการระบายความร้อนด้วยอากาศแบบเดิม คาดว่า Nvidia จะเปิดตัว GPU B100 สถาปัตยกรรม Blackwell โดยมี TDP ประมาณ 1,000W ในปลายปีนี้ และการระบายความร้อนด้วยของเหลวจะมีความจำเป็นอย่างแน่นอนในเวลานั้น

สำหรับระบบคอมพิวเตอร์ประสิทธิภาพสูง การระบายความร้อนด้วยของเหลวมีข้อได้เปรียบที่สำคัญหลายประการเหนือการระบายความร้อนด้วยอากาศ:
ประสิทธิภาพการถ่ายเทความร้อนที่ดีเยี่ยมช่วยให้ส่วนประกอบที่มี TDP สูงกว่าสามารถระบายความร้อนได้เต็มที่
เนื่องจากความต้องการพัดลมความเร็วสูงลดลง การทำงานจึงเงียบขึ้น
การออกแบบระบบมีความหนาแน่นมากขึ้น และแผงระบายความร้อนและพัดลมขนาดใหญ่ก็ใช้พื้นที่น้อยลง
ศักยภาพในการดักจับและการนำความร้อนเหลือทิ้งกลับมาใช้ใหม่ในตัวแลกเปลี่ยนความร้อนระหว่างของเหลวและของเหลว

ด้วยการใช้การระบายความร้อนด้วยของเหลว Nvidia สามารถทำงานเกินขีดจำกัดประสิทธิภาพของตัวเร่งความเร็ว AI ต่อไปได้ โดยไม่ถูกจำกัดโดยระบบทำความเย็น เนื่องจากความซับซ้อนของภาระการฝึกอบรมปัญญาประดิษฐ์เพิ่มขึ้นอย่างต่อเนื่อง และการใช้พลังงานของฮาร์ดแวร์ที่เกี่ยวข้องเพิ่มขึ้น สิ่งนี้จึงเป็นสิ่งสำคัญ เซิร์ฟเวอร์ DGX AI ของ Nvidia บรรจุ GPU หลายตัวไว้ในระบบที่ได้รับการปรับปรุงให้เหมาะสมสำหรับปริมาณงาน AI ซึ่งได้รับการยอมรับอย่างรวดเร็วโดยองค์กรขนาดใหญ่ ผู้ให้บริการระบบคลาวด์รายใหญ่ เช่น Google Cloud, Meta และ Microsoft ได้ปรับใช้ระบบ DGX ในศูนย์ข้อมูลของตน ในช่วงไม่กี่ปีที่ผ่านมา ในขณะที่องค์กรต่างๆ จำนวนมากขึ้นเรื่อยๆ พยายามที่จะใช้ประโยชน์จากพลังการเปลี่ยนแปลงของปัญญาประดิษฐ์ การนำระบบปัญญาประดิษฐ์ของ Nvidia DGX มาใช้ก็เติบโตขึ้นอย่างมาก

ระบบ Nvidia DGX อาจใช้การออกแบบการระบายความร้อนแบบแช่ขั้นสูงที่ใช้ของเหลวอิเล็กทริก การระบายความร้อนของชิปโดยตรงจะปั๊มของเหลวอิเล็กทริกโดยตรงไปยังชิป GPU และส่วนประกอบทางความร้อนอื่นๆ โดยไม่จำเป็นต้องใช้แผ่นเย็น ทำให้สามารถถ่ายเทความร้อนได้โดยตรงมากขึ้น สามารถรองรับระดับ TDP ที่สูงมาก (500W+) บนชิปตัวเดียว ทำให้ได้ระบบที่มีความหนาแน่นมากขึ้น

เนื่องจากปัญญาประดิษฐ์ยังคงพัฒนาอย่างรวดเร็วอย่างน่าประหลาดใจ โครงสร้างพื้นฐานฮาร์ดแวร์ที่รองรับจึงต้องพัฒนาไปพร้อมๆ กัน การระบายความร้อนด้วยของเหลวเป็นเทคโนโลยีสำคัญที่ช่วยให้เครื่องเร่งความเร็วสามารถขยายไปสู่ระดับประสิทธิภาพที่ไม่เคยมีมาก่อน การเปลี่ยนแปลงครั้งนี้ไม่ได้ปราศจากความท้าทาย เนื่องจากศูนย์ข้อมูลต้องการการเปลี่ยนแปลงโครงสร้างพื้นฐานการทำความเย็นด้วยของเหลวและการพัฒนาโปรแกรมการบำรุงรักษาใหม่ ประโยชน์ของประสิทธิภาพการใช้พลังงาน ความหนาแน่น และประสิทธิภาพจึงมีความสำคัญและไม่สามารถละเลยได้






