AI服务器严重缺货造成价格上涨是为什么?AI服务器价格上涨给相关企业带来困境AI 服务器价格上涨给相关企业带来了成本压力和出货量下降的困境。一方面,对于AI服务器生产商来说,由于核心零部件GPU价格上涨和供应紧张,导致其生产成本增加和出货量受限。另一方面,对于AI服务器使用者来说,例如云服务商和终端用户,由于AI服务器价格上涨和供应不足,导致其使用成本增加和算力资源匮乏。
据行业媒体报道,“现在英伟达GPU严重缺货,服务器厂商缺少核心零部件,一定程度上影响了相关企业的出货量。”而为了应对增加的订单量,英伟达也向台积电追加预订1万片先进封装产能,以满足AI顶级规格芯片的生产。但这些措施仍然难以解决短期内的供需矛盾。另外,在国内可用于训练AI大模型的A100大约有4万~5万个,供应相当吃紧。一些云服务商已严格限制内部使用这些先进芯片,以将其保留至需要强力运算的任务。而对于终端用户来说,在线租用云端AI服务器也变得更加昂贵和困难。
面对AI 服务器价格上涨和供应紧张的问题,业界正在寻求各种解决方案。其中主要有以下几个方向:- 增加GPU产能:这是最直接也最困难的方案。由于全球芯片产业链的复杂性和脆弱性,在短期内很难实现大幅提升GPU产能。不过,在中长期来看,随着台积电、三星等芯片制造商扩大投资和产能,在国内也有多家企业在积极布局国产GPU芯片,在未来或许可以缓解GPU供应紧张的问题;- 优化AI模型:这是一个技术层面的方案。通过优化AI模型的结构、参数、算法等方式,可以降低模型对算力资源的消耗。例如,在NLP领域有一种叫做知识蒸馏的技术方法,可以将一个大型模型(教师模型)训练出来的知识传递给一个小型模型(学生模型),使得小型模型可以在保持较高精度的同时减少运算量。
- 利用边缘计算:这是一个架构层面的方案。通过利用边缘计算技术,在离数据源更近、更分散、更灵活的边缘节点上进行数据处理和分析,并将结果返回给云端或终端设备。这样可以减少对云端中心化算力资源的依赖和消耗,并提高数据处理效率和安全性;- 探索新型硬件:这是一个创新层面的方案。通过探索新型硬件设备和技术来提升或替代传统GPU芯片在人工智能领域中的作用。例如,有一种叫做神经网络处理器(NPU)的专用芯片,可以针对神经网络的特点进行优化设计,提高运算速度和效率;还有一种叫做光子计算的新兴技术,可以利用光子代替电子进行数据传输和处理,实现超高速度和超低功耗的计算。