芯片问题之所以不用担心,主要基于以下几个原因:
1. 系统优化弥补单点不足:华为通过系统工程的方法,实现了“非摩尔补摩尔”的效果,即在单芯片技术上可能落后的情况下,通过系统层面的优化来提升整体性能。这种优化包括了对计算、内存、通信的极致优化调度,以及结合昇腾特点的亲和设计和数学算法创新。
2. 群计算补单芯片:面对单个GPU或单个服务器难以处理的大规模神经网络模型,集群算力成为趋势。华为构建了巨型算力基础设施CloudMatrix 384超节点,通过全对等高速互联架构,实现了算力的高效协同。
3. 提升算力利用率:华为通过系统工程的优化和资源的高效调度,提升了芯片算力利用率。例如,在MoE大模型训练中,模型算力利用率从30%提升到45%以上,这在硬件没有改变的情况下,通过系统优化实现了性能的显著提升。
4. 开放合作促进进步:华为坚持开放策略,与合作伙伴、高校等共同研发和创新,共享技术成果,这种开放合作的态度有助于华为不断取得技术突破。
5. 硬件工程和基础软件的深厚积累:华为在电子信息领域,尤其是硬件工程和基础软件方面有很深的积累,这使得华为有能力构建和维护复杂的算力系统。
6. 昇腾算力的实际应用效果:昇腾算力不仅能够支撑工业级推理能力,还高效训练出了不同尺寸的大模型,展现了其在超大规模MoE训练性能上的优势。
综上所述,尽管在单芯片技术上可能存在差距,但通过系统优化、群计算、开放合作等多方面的努力,华为能够有效应对外部技术封锁带来的挑战,并为中国AI产业的发展提供了坚实的算力支持。