腾讯的芯事

通联网络是国内著名的虚拟主机和域名注册提供商。独创的第6代虚拟主机管理系统,拥有在线数据恢复、Isapi自定义,木马查杀等30余项功能.千M硬件防火墙,为您保驾护航!双线虚拟主机确保南北畅通无阻!

腾讯的芯事

2022年6月15日 云服务器 0

那是2019年1月。加入腾讯,Lynda正准备撸起袖子,大干一场,却劈面遭遇“一问三没有”。

Lynda正好想参与芯片研发的全过程,倒不怕从头开始。但她实在没料到,连仿真工具、验证环境、验证流程这些必备品都能 “三无”。

众所周知,芯片研发高门槛、高投入、高风险,而验证工程师就是守门员。软件开发尚可后期不断改bug,芯片如果设计问题没被前期验证发现,一旦流片,只能沦为一块“砖头”。

因此,很多芯片公司对设计工程师与验证工程师的人员配比是1:3。而在蓬莱实验室,Lynda只有一个并肩作战的验证同事,和一行代码都没有的验证条件。

这时候,Lynda才开始明白Henry口中的“从零开始”意味着什么,以及她面临着怎样一场艰难的战役。

在腾讯云副总裁、云架构平台部总经理谢明看来,芯片这场战役,腾讯“蓄谋已久、势在必行”。

这个团队肩负着QQ等国民级应用的后台架构,站在腾讯海量业务数据冲刷的前线,深刻地明白底层技术创新对上层应用的放大价值。

让用户访问相册的速度更快、体验更顺滑,成了一个很急迫的需求。转化成相应的技术问题,就是图片能否更快地转码?能否在不损画质的情况下压缩?能否以更低的成本存储?

伴随着软件架构上永无止尽的自我超越,团队敏锐地察觉到,只有在硬件上也作出创新,才能实现更深层次的突破。

一圈研究之后,他们决定先拿FPGA(可编程阵列逻辑)试水。FPGA相比起芯片容错率高,但在吞吐率、延迟、功耗和灵活性等维度上都很平衡。尤其是在处理海量数据603138)时,FPGA相比GPU具有超低延时的显著优势。

事实验证了这种判断。2015年,团队集中力量研发的图片编码FPGA,取得了比CPU编码和软件编码更高的压缩率和更低的延时,也帮助QQ相册很大程度上降低了存储成本。他们看到了在FPGA方向探索和深入的可能性。

2016年前后,由AlphaGo引爆的AI热潮更把FPGA拉入了主流视野。团队通过FPGA对深度学习模型的CNN算法进行加速后,处理性能达到通用CPU的4倍,而单位成本仅为1/3。

FPGA效果虽好,但技术门槛比较高,“如果把FPGA云化,是不是一个能够扩大应用的解决路径?”

带着这样的期待,2017年1月20日,腾讯云推出了国内首款FPGA云服务器,希望以云计算的方式,将FPGA能力推广到更多企业。

从效果上来说,在FPGA云服务器上进行FPGA硬件编程的企业,确实能将性能提升至通用CPU服务器的30倍以上,而只需支付相当于通用CPU约40%的费用。以一家著名的基因检测公司为例,传统用CPU需要检测一周的基因序列,FPGA可以压缩到数小时完成。

然而,残酷的现实给团队从头到脚浇了盆冷水,云化后的FPGA,没能如预期般迅速席卷整个行业。

一方面,许多企业还是无法独立胜任FPGA开发,需要更加上层的服务;另一方面,GPU成本的迅速下降,也给FPGA造成了巨大的冲击。

云端商业化的受挫,把团队的热情从巅峰一下子打到了谷底,同时也把一个问题赤裸裸地抛到整个团队的眼前:FPGA对业务的价值究竟有多大?FPGA还能继续做吗?

时间进入2019年。那是人工智能规模化应用的元年,内外部业务都提出了对AI芯片的强烈诉求。

这个问题被提出来的时候,管理层有

发表评论

您的电子邮箱地址不会被公开。