他把半个机房浓缩进小盒子 用GPU将数据库处理性能提升100倍

时间:2017-07-11 18:32

Zerone团队的每位成员都用超级英雄做代号。

 

  导语“你就叫我星爵好了,他是我最仰慕的超级英雄,也是我在团队里的代号。”

  自2005年飞赴美国留学,4年后年进入Oracle公司,从事数据库项目12c核心研发工作,到2015年归国创业,这位创始人始终认为自己像漫威漫画中的“星爵”一样,在探索新世界。

  去年4月,星爵组建起一支5人团队,研发一款基于GPU基础架构的新型OLAP数据库,取名Zerone。据星爵透露,该数据库与传统内存数据库相比,可以将数据处理性能提高30~100倍,同时降低10倍硬件成本、20倍计算能耗。

  该项目已于去年4月完成天使轮融资,现阶段正在进行Pre-A轮融资中。

他把半个机房浓缩进小盒子 用GPU将数据库处理性能提升100倍

 
   注星爵承诺文中数据无误,为其真实性负责,铅笔道已备份录音速记,为内容客观性背书。

  归国创业

  星爵站在旧金山机场门口,手中握着飞回北京的机票,推着三只行李箱,回头看了一眼背后的蓝天白云,有那么一丝恋旧。

  让他没想到的是,再一次回到美利坚,已是一年半之后。

  自2009年从美国研究生毕业后,星爵从酷寒之地飞到了春暖花开的旧金山。在那里,他加入了Oracle 12c项目团队,负责云端多租户数据库的研发工作。“Oracle当时在做的项目让我感觉很有前瞻性,可以将数据库做成下一代云服务,诱惑很大。”

  六年时间飞逝而过,随着12c项目迭代完成,星爵思考下一步职业发展方向。“Oracle产品研发周期是5年,我进去时刚好11g版本收尾,然后为12c做立项、调研工作。能够在这么大公司经历一个完整的产品迭代,我觉得没有遗憾了。”

  就像他最喜欢的漫威英雄“星爵”始终坚信自己的征途应该在浩瀚星海,星爵在思考创业的可能。“在美十年间,我每年会回一次国。每次踏上国土都会感觉经济发展势头迅猛,尤其很多国内团队也在研发赶超欧美的技术,所以回国创业将是一次机会。”

  话虽如此,但是回国前他还是经历了一番纠结和挣扎。当他面对着满屋杂乱的行李时,心里几次悄悄打了退堂鼓。“需要处理车、房子、家具等物品,心里容易烦躁。这时候就会跑到电脑跟前打一局英雄联盟,或是去做一些其他事情放松身心。”

  终于在2015年5月,星爵义无反顾地站在了机场门口。飞机落地,他做的第一件事便是寻找同窗好友。 “我去美国读书时他就已经在硅谷工作了,我进入Oracle都工作结束了,他还在原公司就职,尽管待遇不菲,但是人生轨迹就像火车,始终是被设计好的。”

  比起画饼的话语,星爵用数字打动了好友。“在OLAP数据库领域,全球市场份额约为每年190亿美元,预计在2020年可达到250亿美元规模。”而星爵想做一款基于GPU硬件,应用于人工智能的新一代OLAIP(On-line Analytical and Intelligent Processing)数据库系统——Zerone。

  提升100倍性能

  在星爵看来,基于GPU的OLAIP数据库很快将会取代传统OLAP数据库,原因在于CPU自身处理性能的局限性。“现在一块CPU最多几十个核,而一块英伟达的GPGPU(General Purpose GPU)可以内嵌五千多个计算核心,对于数据的分析处理能力不止上升了两个量级。”

  而市场上现有的分布式处理技术,都是基于CPU架构研发的,“复杂的算法虽然可以提高数据库运算效率,但是就代码来讲不够简洁和优雅。GPU的发展正好迎合了自硬件层面提升数据库处理速度的需求。”

  星爵想到,如果能够用一台以GPU为核心的集群代替传统机房和数据中心,就会将企业的硬件成本降低10倍,能耗降低20倍。“用一个可以放在桌上的小黑盒子和多服务器的大型机房做对比,当然是选择前者更划算。”

Nvidia GPU与CPU算力对比图

 

Nvidia GPU与CPU算力对比图

  Zerone可以使用GPU的多处理核心进行超大规模并行数据处理。比之传统的分布式数据库需要分割提供数据存储、管理、分析环节,Zerone可以提供数据库和人工智能计算(Tensorflow、MXNet和Caffe等)之间的数据通道,将前述功能融为一体,在一个库中进行操作。“打通数据库分析流程后,数据工作者的效率可以提升70%以上。”