“基础数据中心架构师,顾名思义,就是数据库及人工智能基础设施的设计者、搭建者,主要服务于互联网后台的大型数据中心建设。”
当你接收到精准的短视频推送,当你跟阿尔法狗围棋大战……这一切能实现的背后,都离不开一个词儿:大数据。
“数字经济时代,我们要给数据赋能,让数据服务大众。如何做到这一点?首先需要新一代的基础设施,而数智技术搭建的正是这样一种大平台。”天云数据CEO雷涛,一直坚持在做数据基础设施的搭建者。
雷涛说,用一个形象的比喻,数字基建就相当于工程建设里的筑地基。在数字经济里,基础设施既包括数字的供给,也包含数据的使用,那么在数据的供需两侧,无论存储还是计算,都需要搭建一个大平台,这就是混合负载数据库。
“我们要通过数字经济,去重新改造原来的工业基础设施。”雷涛说,早期的数据使用者,就像卓别林电影《摩登时代》里流水线上的工人,他们只是坐在生产线上拧扳手,但最终出来什么商品,或许永远都不知道。而早期数据分析就相当于拧扳手的环节,来个数据分析一下,但分析的结果却无从得知。
雷涛深知,在大数据时代,不能再去做流水线工人,而是要去设计流水线该怎样生产,也就是要成为一名设计者、一名工程师,让流水线根据自己的设计来生产产品。“相当于我画了一个图纸,通过我们搭建的大平台自动产出,缔造出来像‘阿尔法狗’这样的大模型。”
2010年,雷涛毅然决然跳到了分布式计算框架的新阵营,带领团队布局国产自研数据库,“这是一个企业的硬核,且数据库作为一个具有国家属性的产品,必然与国家命运与共,唯有这样,信息安全才能得到保障。”但当时并没有任何行业经验可借鉴,意味着只能自主创新,别无他路。
可在自主创新中,最难的是到底做工程还是做产品。其实做一个数据库工程并不难,把应用场景打磨好,一两年时间就可以实现快速盈利。但雷涛果断选择了“做原创”。
“做原创产品,才是下一代产品的核心命脉,工程只是在上一代产品上做延续性创新,无法支撑基础设施。”雷涛把几乎全部的资金都用在了研发上,可最初推向市场的时候,却经常被客户质疑。
但这所有的难,并没有让雷涛打退堂鼓,他最终开发出一套基于Go语言纯自研的HTAP数据库产品Hubble。这套数据库通过中国软件测评中心的源代码测试,系统自主研发率达到99.62%,完全符合国家信创战略,解决了基础设施“卡脖子”的难题。
有了自研的数据库,就有了未来面对国际巨头能够立足的底气与根本。雷涛说,现在机器传感物联网的数据时代已经到来,大量的数据通过设备或者产业服务产生出来,“而在我们搭建的基础设施之下,能诞生更多类似ChatGPT的智能应用。我们只要把数字基建搭好,把平台不断完善,数据就能真正服务于每一个人。”雷涛对此充满信心。
(原标题:基础数据中心架构师雷涛 筑牢大数据“地基”)
来源:北京日报 记者 骆倩雯
流程编辑:u019