7月5日 融了8个亿!还要颠覆英伟达?Sohu芯片真这么厉害…

7月5日 融了8个亿!还要颠覆英伟达?Sohu芯片真这么厉害…

00:00
05:07

【王煜全 要闻评论】粉丝群已经开通

欢迎加入前哨粉丝群,在这里你可以和科技投资人、创业者、各行业专业人士互动沟通,分享心得体会,也可以第一时间了解到前哨相关活动动态,结交志同道合的小伙伴。


入群方式:
微信扫码下方二维码即可入群


如果您想洽谈合作,请添加创新地图的微信:innovationmap ,并附上简介。


你好,我是王煜全,这里是王煜全要闻评论。


最近,Sohu芯片火了。别误会,此Sohu非彼搜狐,而是由两位哈佛大学辍学的学生创立的公司Etched,所推出的芯片,代号为Sohu。


据称,一台搭载8块Sohu的服务器,性能可媲美160块英伟达的H100芯片,速度整整快了20倍!Sohu在处理700亿参数的Llama 3模型时,其吞吐量竟高达每秒50万tokens,大概相当于每两秒生成一本西游记。创始人之一Gavin Uberti自信满满地表示,在Transformer领域,Sohu绝对是速度之王。


所以,资本也是比较追捧,继去年6月份完成500多万美元的种子轮融资后,最近他们又完成了1.2亿美元的A轮融资(约合8亿元人民币)。年轻的哈佛大学辍学学生,两年内推出了性能碾压英伟达的芯片,并获得了高额融资,这简直是最好的创新神话。


图片

Gavin Uberti(中间)


然而,如果你冷静下来细品,Sohu芯片虽火,但要真正“击败”英伟达,恐怕还有很长的路要走。


Sohu属于ASIC芯片(Application Specific Integrated Circuit),即特定用途集成电路,为特定任务而生的。当年比特币挖矿还很火的时候,很多人就开始使用ASIC芯片了,而不是英伟达的GPU。


Etched公司也做了相关说明:他们是“将Transformer网络架构烧录到芯片里”,实现了三倍于英伟达GPU的FLOPS利用率,以及Transformer推理速度的飞跃,让Sohu在算力和功耗等方面均展现出超越传统GPU的卓越性能。这就像长期专注于某一领域的专家(ASIC芯片),其工作效率必然远胜于杂而不精的通才(GPU)。


但问题来了,为什么英伟达不涉足ASIC领域呢?


首先,我们需要明确,AI芯片被分为训练芯片和推理芯片。训练芯片注重绝对的计算能力和精度,需要具有一定的通用性。英伟达的GPU就是训练芯片的典型代表。推理芯片则更看重能效、时延和成本等综合指标,而且可以具有一定的专用性。今天所介绍的sohu芯片,就是典型的推理芯片。当然,英伟达GPU也可以用于推理。


很明显,现阶段大模型的训练需求正在井喷,未来随着文生视频、多模态大模型的普及,训练芯片、也就是英伟达GPU的需求还会持续爆发。


而且,把ASIC芯片用于AI领域,并非Etched首创。今年2月,初创公司Groq就用自研的LPU芯片(Language Processing Units),其文本生成推理速度较GPU飙升十倍,而能耗却骤降至十分之一。


当然,最著名的,莫过于谷歌2013年研发的TPU(Tensor Processing Unit),专为机器学习量身打造,据称在神经网络计算方面展现出了显著优于英伟达GPU的性能。而且,TPU可以用于AI大模型的训练。


图片


此外,比较著名的,还有特斯拉的Dojo芯片、微软的Maia 100等等。而且如Meta、OpenAI、亚马逊AWS等等都纷纷表态在自研AI芯片,大概率也是定制化的芯片。


但是,需要注意的是,虽然有自研芯片,这些巨头仍然需要购买大量的英伟达GPU。


可见,Etched不仅伤害不到英伟达,而且强者环伺,挑战重重。Etched的创新之处,头部企业其实很快就能学去。也就是说,这是典型的产业增强型创新,而不是产业颠覆式的创新。


所以,下次再有芯片公司宣称可以颠覆英伟达,我们需要从两个维度审慎考量。


第一,要看这家公司能否突破或绕过英伟达的CUDA平台,抢占数据中心业务。很显然,目前即便是AMD、英特尔等芯片巨头也做不到。英伟达同时仍在通过持续高投入,不断推出一系列加速库和工具,不断优化CUDA平台。


第二,要看这家公司能否在高速互联技术上取得突破,从而能够构建大规模的数据中心。英伟达的NVLink技术传输速度远超同行水平,可以让成千上万个GPU连在一起协同工作。最关键的是,英伟达的技术是经过大量工程实践验证的,运行稳定,大大降低了训练中断的风险。


我曾说过,在各大公司都强调平台的实战性、争分夺秒抢夺算力的当下,英伟达的GPU就相当于AK47,虽然可能打得没那么准,但不卡弹、皮实耐用,一定是大家的首选。


但我更想强调的是,对于中国的芯片产业,sohu芯片给了我们两点启示。


首先,ASIC芯片可以是中国厂商的发力点,作为解决AI算力短缺的一剂良药。寒武纪、地平线以及阿里的平头哥都在不同领域发布了ASIC芯片。当然,虽然ASIC的理论性能远高于GPU,但初始投入巨大,失败概率较高,仍然是有一定难度的。


其次,更重要的是,AI芯片这个弯道已经显现,中国芯片产业应该围绕AI芯片尽快形成产业生态,实现“弯道超车”。我曾提出过“产业生态的木桶原理”,即在新产业出现之初,不要总想着另辟蹊径,把某个长板做得特别长,而是应该让一堆短板一同协作,一起长成长板。


科技是这个时代最大的红利。相信你也是关心中国科技产业发展、希望有所作为的弄潮儿。把握机会,贵在前瞻性的分析。我们在过去8年,积累了系统且经过事实验证的科技产业分析体系,一定会对你有所帮助,欢迎前来学习探讨,先人一步、看清未来。


以上就是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享,欢迎关注全球风口微信号,报名加入。


王煜全要闻评论,我们明天见。

图片


回放地址

长按扫描二维码加入科技特训营,可观看所有直播和回放。


图片

以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!