华为破产
发布时间:2025-05-27 09:41
美国应使用华为筹码照顾任何国家。美国商务部的禁令于5月13日发布,并非由华为上升筹码的实力以“非理性”方式在长臂管辖下以“非理性的”方式表达。从原始文本来看,美国怀疑华为似乎使用了美国技术。换句话说,美国拒绝承认中国自己的技术可以产生高性能筹码。马来西亚的第一个“受害者”需要避免其优势。 5月19日,马来西亚数字通信部宣布启动“战略AI基础设施计划”,并设有基本的3,000个华为设备,用于攀登具有开放式深度搜索模型的高端GPU。但是,在24小时内,马来西亚方面撤回了新闻,没有提供进一步的解释。 5月19日,马来西亚数字通信部副部长张·尼安(Zhang Nianqun)宣布,这将是第一个国家o在其人工智能基础设施项目中采用华为的上升筹码。在短短的几天内,华为兴奋的刺激了全球技术行业的春水池:各个国家,地区和芯片公司都会关注Ascend的“虚拟和真实”。美国制造的中国拖鞋和NVIDIA首席执行官Huang Renxun关心的拖鞋有多强? AI的主权马来西亚计划最初是“中国AI系统第一次实施国外”。自从美国引发了“关税战争”以来,马来西亚已成为拒绝“选择NG侧立场”的东南亚国家的脊柱。今年,它已正式成为金砖国家的合作伙伴,并担任东盟董事长和与中东人民的关系协调员。根据马来西亚的初步计划,“战略性AI基础设施计划”是马来西亚存储的数据的全堆栈生态系统,由马来西亚人管辖,并使用了马来西亚人,避免对欧美云的数据控制。在系统级别:基于Astron 910系列芯片的Atlas服务器,再加上Cann异源计算的Architektura,可以支持NVIDIA的CUDA适应率70%,并将培训成本降低75%。扩展全文 华为上升芯片 实际上,华为的新AI加速器于4月10日早些时候在华为云生态会议上出现。美国总统特朗普造成的关税风暴已经充满,并从会议上偷走了众人瞩目的焦点。 在生态会议上推出的华为云云384超级节点在一个集群中达到了300 pflops的计算强度的崩溃(即每秒1000万亿美元,即10^15^15浮点浮动式浮动式操作是四个小数小数的操作)。据报道,能源效率之比超过了NVIDIA的类似产品。 华为Cloud CloudMatrix 384超级节点Coreg芯片计算功率256 Tflops(一个三边形狮子每秒,即10^12浮点操作),其性能超过了NVIDIA A100。 Asteng 310芯片负责侧计算情况。支持Altermatic DT250服务器性能不仅仅是相似产品的行业增加20%,能源消耗量下降了30%。 同时,深探开的开源模型DeepSeek-R1的性能几乎与CloudMatrix 384 SuperNode中的Nvidia H100一样好,这证实了中国计算能力的潜在商业化。 但是,尽管马来西亚强调了技术的“主权”,但美国仍然感到非常紧张。美国商务部最近改变了攀登,希望阻碍整个Hua芯片设计链条,并使用。 当然,对于大多数国家而言,AI主权的深刻矛盾在于AI生态系统的“希望之路”。 像其他国家一样,现有的马来西亚申请主要基于NVIDIA框架,需要大量的努力和搬迁成本。一位当地的AI商人在公共场合说:“我们邀请了最高的计算能力,但是工程师培训和移动模型的成本超出了政策表达。” 02 我 - 转化所有人的力量 华为云不仅给行业造成了震惊,而且还引发了公众舆论“ Out the Circle”,这是针对NVIDIA GB200NVL72系统的基准,超过了NVIDIA对许多主要指标的解决方案。 华为云,在哪里? 简而言之,它是“使用所有内容”:使用空间转换电源,并利用能量转换功率... Ascend 910出生于2019年,使用了7纳米的过程。从那时起,使用5nm的过程,910B和910C的性能得到了改善,而NVIDIA产品具有3nm的过程。换句话说,根据芯片技术的落后一代,华为采用了一系列扩展解决方案来制造其产品CTS或至少与“顶部” NVIDIA和AMD产品相当。 CloudMatrix 384超级节点,据报道,它由384个Astron 910c芯片组成,并通过完全连接的拓扑结合。 Astron Chip的数字达到了五倍,这足以使一个GPU仅占NVIDIA Blackwell性能的三分之一。 Nvidia Blackwell 完整的CloudMatrix系统可以提供300个PFLOPS的密集BF16(一种覆盖16位的数字计算机格式)计算性能,几乎是NVIDIA GB200 NVL72的两倍。 简而言之,中国AI加速器的总内存能力是总记忆容量的3.6倍以上,是内存带宽的2.1倍,已经具有超过NVIDIA的AI系统功能。 “我将所有权力转换”自然而然地以成本。它的缺点是其功耗达到了GB200 NVL72的3.9倍,每个翻牌能源效率降低了2.3倍,每TB/s的能源效率降低了1.8倍,每TB HBM的能源效率降低了1.1倍。在其他国家,缺乏功耗可能是“缺陷”,但中国拥有足够的权力,使缺陷并不令人恐惧。 尽管中国的能源系统长期以来一直依赖煤炭驱动,但近年来,它以前以太阳能,水力发电和风力发电在世界上排名,还领导了扩张核电领域。相比之下,美国的核强度产量仍在1970年代,升级能源电网的能力失败了。自2011年以来,新的中国电网能力等同于整个美国电网量表。 从2015年到2024年,我国家的核能和新安装能力(单位:10,000千瓦) /资料来源:中国能源媒体新能源安全研究所 由于功率相对丰富,因此不必记住大型AI加速器的能源障碍。华为留下了您的力量的密度,并移至扩展G量表(包括光学互连设计技术的引入)已成为一个合理的选择。 诸如CloudMatrix 384个超节点之类的设计,甚至考虑到系统级别的限制,也证明了华为解决方案将保持许多扩展路径。 03 挑战NVIDIA 华为训练集群可以挑战NVIDIA这一事实意味着中国的人工智能行业具有坚实的基础。 Huang Renxun一直处于令人兴奋的前几天,并公开批评了美国政府对“制造更强大的中国技术公司”的出口控制,这并不奇怪。 值得注意的是,Nvidia在人工智能芯片市场中的主导地位不仅是由于智能软件和网络的出色体系结构,而且还引起了深度集成的CUDA生态系统软件。 NVIDIA CUDA功能库包含八个主要操作 NVIDIA的NVIDIA ECOSY与CUDA无缝兼容,高性能图书馆和Pytorch(默认情况下也可以在CUDA中使用的最广泛使用的机器学习框架)为开发人员提供了良好的体验并创建了一个活跃的社区,从而进一步增强了Nvidia的领先地位。 对于软件更换,华为方法是扩展其独立开发的软件堆栈,推出大量工具套件,实现与CUDA相同的功能。加深在Pytorch中的整合;并构建ONNX(开放神经网络开关的开放标准),因此客户也可以通过华为芯片来推理,以表明由非武国芯片培训的型号。 最常见的选择是Cann(神经网络计算体系结构),它是华为为神经网络神经网络创建的编程环境的专有。在CUDA中,软件堆栈中的CAN级相同。 自华为于2019年纳入美国实体列表以来,Cann一直处于开发状态。2024年,年度华为报告专门到当年9月推出的Cann 8.0版本,他说“迈出了重要的一步”来促进人工计算智能功能。 华为推出了AI场景的Cann AI异质计算体系结构 但是,Cann开发人员社区不是很活跃,公众的出版物也有限。据报道,一些用户也很难将模型调整到华为平台。有需要的您首先要进行华为优化,然后才能到达华为平台……开发有点慢。 为了“吸引客户”,华为还比较了Nvidia在21世纪初期推广CUDA的方法,并直接将工程师派往客户的网站,以帮助客户进行代码转移。据报道,华为针对百度,科学与技术大学部署了工程团队的Iflytek和Tencent。 从当前的角度来看,华为的AI芯片生态系统并不是很老。同时,上升芯片仍与该行业的全球连锁店分开。它的设计已完全由中国完成,但生产仍然取决于其他公司:三星的高宽宽记忆(HBM),美国,荷兰和JBUT等公司的设备。 只要有持续的推动,事情就会总是改变。 NVIDIA花了将近20年才发展出今天的主导地位。建立任何竞争性生态系统需要多年的努力。 当技术压迫成为常态时,独立变化是最好的反应。 5月-Set | Rong Zhihui 我-Edit |回到Sohu看看更多