Language
<< 返回文章列表

数据库一体机简史:从Britton-Lee到zData,专用硬件和通用硬件之抉择

2026年3月16日
,
z
D
a
t
a
X
,
E
x
a
d
a
t
a
,
,
盖国强
7

在上一篇《从Britton-Lee的陨落到Exadata和zData的智能复兴》中,我们讲述了Britton-Lee(图1是其公司标志)的创业历程。从1979年创立,到1981年推出世界上第一台大规模量产的商业数据库机,Britton-Lee是这一领域的绝对前瞻者。

1989年5月,Brittion-Lee更名为ShareBase,展示了其向数据库软件转型的决心,然而此时距离鲍勃·爱泼斯坦(Bob Epstein)出走创立Sybase已经5年。他们的转型并不顺利,1990年6月,ShareBase被Teradata收购。从1979年创立到1990年被收购,Britton-Lee用11年的发展历程验证了专用硬件与通用硬件之间路线选择的成败。


图1 Britton-Lee公司标志及后期更名为ShareBase后的公司标志

在创立Britton-Lee之前,大卫·布里顿(David L. Britton)和杰弗里·李(Geoffrey M. Lee)曾经于1977年联合创立国际存储器公司(IMI),销售了业界首款8英寸温彻斯特(Winchester)磁盘驱动器。随后,他们为巴斯夫公司(BASF)在德国建立了一家8英寸温彻斯特磁盘驱动器制造厂。作为企业家,他们相信关系数据库模型代表着一个日益受到关注且充满机遇的领域,于是联系了加州大学伯克利分校Ingres项目的负责人。通过对此课题的讨论和研究,他们认为软硬件结合的系统,能够解决仅基于软件方法的关系系统中存在的许多固有问题。这就是Britton-Lee创立的机缘。

图2 左二站立者为保拉·霍索恩

Britton-Lee的创始人中,除了前文提及的鲍勃·爱泼斯坦等四位来自加利福尼亚大学伯克利分校Ingres项目组外,还有两位知名的创始团队成员来自迈克尔·斯通布雷克(Michael Stonebraker)的团队。这两位分别是保拉·霍索恩1(Paula Hawthorn,见图2)和迈克・乌贝尔(Michael Ubell),二人是夫妻。霍索恩深受爱泼斯坦的器重,在爱泼斯坦离职后,她成为Britton-Lee的工程副总裁。此后,她又先后在多家初创公司担任研发副总裁。她被公认为数据库系统领域的重要专家和先驱之一。她还创立了多个女性计算机科学组织,并推动制定多项平权行动计划,以支持该领域的学生。

保拉·霍索恩(Paula Hawthorn)于1996年成为加州大学伯克利分校电子工程与计算机科学系首位女性杰出校友。她是社会进步的不懈倡导者。1979年,她正在攻读电气工程博士学位时,与同为"开创者"的Barbara Simons和Susan Eggers共同创立了学生组织“计算机科学与工程女性”(WiCSE),并参与创建了计算机科学重返校园项目(CS Reentry Program)。该项目鼓励拥有其他学科学位的女性重返校园学习计算机科学。霍索恩曾在德士古公司(Texaco)工作,并在那里对计算机产生了浓厚兴趣。她在加州大学伯克利分校师从Michael Stonebraker并获得博士学位,随后在惠普、劳伦斯伯克利国家实验室以及多家颇具影响力的初创公司工作。尽管现已退休,霍索恩仍是一位坚定的社会活动家。

保拉·霍索恩于1943年出生于俄克拉何马城(Oklahoma City)。她在休斯顿大学学习期间数学成绩非常突出,原本计划成为一名数学老师,但由于参与民权抗议活动而被捕(当时美国社会仍普遍存在种族隔离与种族歧视),她被禁止在德克萨斯州教书。在个人生活方面,她18岁离家与丈夫结婚,26岁生下第一个孩子,28岁生下第二个孩子,随后离婚。尽管如此,她仍坚持完成学业,并于1974年获得休斯顿大学的硕士学位。之后,她带着孩子进入加州大学伯克利分校攻读电气工程和计算机科学的博士学位,师从图灵奖得主迈克尔·斯通布雷克。当时,斯通布雷克的职业生涯也刚刚起步。霍索恩与斯通布雷克同龄(均出生于1943年),她也是斯通布雷克的第一位女博士生。

霍索恩与斯通布雷克的相识颇具偶然性。她初到伯克利时原本想学习操作系统,但当时计算机资源极为稀缺。负责操作系统课程的老师告诉她:“你可以独自使用计算机的时间只有从午夜到凌晨三点。”当时霍索恩已有两个孩子,无法在深夜留在学校,因此一度考虑退学。但是她在休斯顿的导师劝她不要离开,并建议她去找斯通布雷克。她的导师说:“那里还有另一位教授,他从事数据库研究工作,有自己的计算机,你可以在他的计算机上运行你的实验。”

于是,霍索恩去找斯通布雷克,对他说:“我对底层操作系统方面的研究很感兴趣。”斯通布雷克回应道:“这对我来说其实并不太有吸引力,不过如果你真的很优秀,我们或许可以接收你。”就这样,霍索恩加入了斯通布雷克的研究项目,并且表现优异。她后来回忆说:“当时在斯通布雷克的项目中担任首席程序员的鲍勃·爱泼斯坦(后来成为Sybase的创始人)最终向斯通布雷克推荐了我,说我做得很好,并决定雇佣我。于是我就这样加入了Ingres项目。”也正是在Ingres项目组,她遇到了自己的第二任丈夫迈克・乌贝尔。

保拉·霍索恩于1979年获得博士学位,她是那个时代少有的女博士之一。据她回忆,她在伯克利入学时,一个90人的班级里只有两名女生,另外一位是芭芭拉·布卢斯坦·西蒙斯(Barbara Bluestein Simons,曾担任ACM主席)。

保拉·霍索恩为Ingres项目做出了重要贡献。她在博士论文《关系型数据库管理系统的性能评估与增强》Evaluation and Enhancement of the Performance of Relational Database Management Systems)中对几种不同的数据库机进行性能评估,以确定哪些因素对数据库性能的影响更为关键。最终她发现,工作负载特征在很大程度上决定了专用硬件对数据库系统性能的影响,数据库机对性能具有极大的提升作用。

图3 迈克尔·斯通布雷克

博士毕业之后,霍索恩决定与几位同事一起加入Britton-Lee,围绕数据库机的理念展开创业。然而斯通布雷克(见图3)并不认同数据库机的理念,他说:“好吧,也许目前确实如此(数据库机对性能有所帮助),但只要等到通用机器变得更快,我们就不需要专用的数据库设备了。”霍索恩则反驳说:“但我们同样可以让专用硬件变得更快。”

在经历过Britton-Lee公司的实践之后,霍索恩坦言:“结果证明我错了,斯通布雷克总是对的。”在那之后,霍索恩追随斯通布雷克,加入了他创办的Illustra公司,开始打造通用数据库产品。Britton-Lee的实践表明,在摩尔定律2的作用下,通用硬件的性能进化速度往往快于专用硬件——因为有更多的人投入到通用硬件的开发中,同时规模效应也发挥着重要作用。事实上,今天的数据库一体机最关键的能力之一正是集成与优化能力。只要具备可靠集成新型硬件的能力,就能够持续通过硬件创新提升数据库处理超大规模数据的能力。

摩尔定律由英特尔联合创始人戈登·摩尔于1965年提出,指集成电路上可容纳的晶体管数量大约每18至24个月翻一倍,性能同步提升而成本不变。该定律揭示了半导体技术指数级进步的规律,成为信息技术快速发展的核心驱动力,推动计算能力持续增强、单位成本大幅下降。近年来,由于物理极限和制造成本的挑战,行业正通过3D封装、Chiplet等创新技术延续其发展精神。

值得注意的是,虽然Teradata长期坚持专用硬件路线,但如今的Teradata(尤其是Teradata Vantage平台)也已经实现了硬件解耦。核心组件BYNET已经演变为软件形态(Virtual BYNET),可以运行在标准的InfiniBand或以太网上。目前,Virtual BYNET已经可以运行在AWS、Azure和Google Cloud等公有云的通用硬件上。

我们身处不同的历史时期,往往难免受到时代视角的局限。要理解历史上的某一种产品形态,就必须深入了解当时各方面的技术条件与约束。以史为鉴,方能洞察未来。

zData诞生于软件定义存储(Software-defined storage,SDS)时代。这一时期的硬件能力已经大幅提升,因此zData从起步阶段就支持通用的开放硬件架构,并专注于在存储特性方面对数据库进行针对性优化。在2010年代,键挑战在于:虽然闪存存储、InfiniBand网络以及软件定义存储等技术都已出现,但它们在核心数据库生产环境中的应用还非常有限,zData必须实现卓越的可靠性、可用性、稳定性和性能,才能被用户真正接受。这四个方面的核心价值主张,主要通过云和恩墨持续投入zStorage3的研发来实现。

zStorage是云和恩墨针对数据库应用自主研发的高性能分布式块存储。相比支持多种协议(块/文件/对象协议)的传统架构,zStorage的架构更精简,数据处理单元由变长改为定长,处理机制更简单,减少了1/3写I/O处理流程,三节点集群可以达到300万以上的IOPS随机读写性能,P99时延小于0.8毫秒。zStorage兼具分布式存储的高扩展性、软件定义云化能力与集中式存储的低时延,以及丰富的数据保护特性,可以为数据库提供云化的高性能、高可靠、高扩展数据底座。

在可靠性方面,zStorage采用Raft协议保障多副本一致性与完整性,实现“数据不丢”;通过端到端校验,并将校验和写入元数据区,精准检测静默错误,确保“数据不错”。该方案支持2副本和3副本冗余模式,分别可实现5个9(99.999%)和9个9(99.9999999%)的数据可靠性,从而最大程度保障用户数据在运行过程中的安全性。

在可用性方面,zStorage在保证数据一致性的前提下优先实现高可用设计。当存储节点数量≥5时,系统可容忍任意2个节点故障而业务不中断;磁盘故障时I/O挂起≤2秒,节点或交换机故障时I/O挂起≤10秒。同时,zStorage的智能网络稳态自治引擎(Intelligent Network Stability Autonomy Engine,INSAE)攻克业界难题“非对称网络故障”,保障该场景下服务不中断。

非对称网络故障是指故障节点只与部分节点能连通。如图4所示,图中节点1与节点4之间不通,但与节点2和3都是相通的。在这种情况下,节点1和节点4上作为Leader的数据副本就不能向对方复制副本数据,从而导致I/O挂起。zStorage通过两种方案解决了此问题:

  • 方案1:将节点1或节点4踢出集群;

  • 方案2:通过节点2或节点3转发节点1和节点4之间的网络通信。

zStorage会实时探测网络连通情况,在两种方案中选择影响最小的一种进行处理,以保证I/O正常。


图4 非对称网络故障及zStorage的解决方案

进入2020年代,整个环境再次发生变化,信创产业在国内蓬勃发展。云和恩墨也更加深刻地体会到自主研发为用户带来的价值。zData数据库一体机的早期版本主要支持Intel处理器,后来逐步扩展到支持ARM架构,如今更是进一步支持鲲鹏和海光处理器,实现了全栈国产化。在存储介质方面,zData最初支持HDD与SSD混合架构,其中SSD主要作为缓存;随后逐步演进为支持全SSD架构。在当前存储价格持续攀升的背景下,zData X又新增了智能零感压缩引擎(Intelligent Zero-Impact Compression Engine,IZICE),可以通过无感压缩实现2~10倍的空间压缩率,从而显著降低用户的存储成本。在某保险客户的财险场景中,zData X的智能零感压缩引擎特性(如图5所示),通过冷热数据分层压缩,帮助用户节省了近10倍存储空间,避免了迫在眉睫的存储扩容,有效缓解了扩容压力,切实为用户创造了卓越价值。


图5 zData X的智能零感压缩引擎(IZICE)特性

图6 SQL in Silicon的示意图

其实,从专用硬件到通用硬件,Oracle的一体机路线也经历过纠结与尝试。在收购Sun公司之后,Oracle尝试通过研发专用处理器实现SQL in Silicon(见图6)级别的性能加速与安全提升,并进行了M7、M8等多代处理器的研发。如果能够将某些特定的SQL操作下推到处理器内部执行,那么对性能的提升将是惊人的,Oracle当时也曾公布了十分亮眼的测试数据(如图7所示)。但随后Oracle很快放弃了SPARC处理器路线,转而专注于和Intel在通用处理器上进行合作。

图7 Oracle数据库和CPU结合的优化示意

其实早在2013年,Oracle就曾基于Sun的SPARC T5处理器打造的8路服务器,在TPC官网测得了单机850万tpmC的打榜纪录(如图8所示)。T5芯片制程仅仅28纳米,但是直至今日,这个纪录都是值得一提的。Sun之一时辉煌,最终也只能在滚滚IT浪潮中归于沉寂。

图8 Oracle在SPARC T5-8路服务器上测得的性能纪录

从Britton-Lee到Oracle,虽然专用硬件设计具有令人艳羡和期待的能力,但事实最终证明,专用硬件高昂的成本和封闭的生态,使其在与通用硬件的竞争中逐渐失去优势。然而,世事并无绝对,在每一波新的技术浪潮来临之际,总会有创新产品的机遇。当云计算与AI时代到来后,专用硬件领域也再次出现了试图改变世界的新一轮探索。

 

 

本篇最后的延展是关于保拉·霍索恩的。在她的职业生涯中,霍索恩曾在惠普、劳伦斯伯克利国家实验室、Britton-Lee、Illustra、Informix工作,并为多家初创公司提供咨询。她以强大的亲和力和高效的管理能力而闻名。在Britton-Lee工作期间的一次大型活动上,创始人大卫·布里顿介绍说:“这就是我们的大地母亲(This is our earth-mother), Paula!”。从那之后,霍索恩便有了一个正式的外号“Mom”。她回忆说:“那会儿所有的女性意识都已经觉醒了,但我说:‘没关系。’甚至有些工程师在我还没大到能当他们妈的时候,就已经管我叫‘老妈’了。”

在任何地方,她都被视为团队的守护神。霍索恩和吉姆·格雷(Jim Gray)一家是挚友。当吉姆·格雷于2007年1月28日在海上失踪后,霍索恩全力投入到组织和协调搜救资源的工作中。吉姆·格雷的妻子唐娜·卡恩斯(Donna Carnes)写下过一段深情的感激之言:“我要感谢保拉(Paula)在过去一年中提供的所有帮助和安慰,特别是她在整个水下搜寻过程中陪伴着我。保拉,我想吉姆会说我欠你大约一百万瓶Ridge仙粉黛(我正在努力)。但最重要的是,我想让你知道,在那段漫长而艰难的水下搜寻过程中,你带来了多么积极的改变。”

2022年,伯克利计算机科学校友迈克尔·奥尔森4(Michael Olson)在母校设立了保拉·霍索恩研究生奖学金,以“帮助改善历史上长期由男性主导的科技领域中的性别不平等”。

迈克尔·奥尔森(Michael Olson)于1992年获得加州大学伯克利分校计算机科学硕士学位,随后继续攻读博士学位一年,但最终并未完成。在本科和研究生期间,奥尔森是Postgres项目的主要开发人员。1993年5月,奥尔森离开博士项目,加入Illustra公司,并随着Illustra被并购而加入Informix公司。1996年,奥尔森与博斯蒂克夫妇共同创立Sleepycat公司并担任CEO。2008年,他参与创建Cloudera并担任首席执行官直至2013年,之后他担任Cloudera的首席战略官(CSO)。2019年,奥尔森离开了Cloudera。

参考文献: