|
|
51CTO旗下网站
|
|
移动端

2020年开源数据库行业状态报告

在未来五年甚至十年内,即使用最激进的方式估算,全部业务都运行在云上是不现实的。实际上如果以行业增长为模型,即使未来5年内20%的内部数据库是自建部署的,而80%的数据都在云中(已经是一个很激进的数字),这仍是一个250亿美元的市场。

作者:杨建荣的学习笔记来源:今日头条|2020-05-13 15:25

2020年开源数据库行业状态报告

本文翻译、整理自 Matt Yonkovit 撰写的博客文章,原文共分为四部分:

  1. Baseline Data and the Size of the Market

  2. Migrating from Proprietary Software to Open Source

  3. The Most Popular Open Source Databases 2020

  4. When is Open Source Not Really Open

以下是前3篇的主要内容。

# 数据库市场

首先看下Gartner去年的数据:

  • 全球数据库管理系统收入约为460亿美元

  • 总体同比增长约18%

  • 云数据库占了这一增长的68%

这里的 “云数据库” 定义可能有些争议:有些人用 “云数据库” 来指代在云服务上运行的任何数据库,有些仅指在云提供商的数据库即服务(DBaaS)中运行的数据库。但无论哪种方式,这种增长与趋势都说明:数据库行业的游戏规则已经变。

在未来五年甚至十年内,即使用最激进的方式估算,全部业务都运行在云上是不现实的。实际上如果以行业增长为模型,即使未来5年内20%的内部数据库是自建部署的,而80%的数据都在云中(已经是一个很激进的数字),这仍是一个250亿美元的市场。

# 混合与多云环境

很多公司并未采用单一的云厂商,他们的大多数业务都运行在混合环境和多云环境中。调查数据显示,有61%的企业已经拥有混合环境。

2020年开源数据库行业状态报告

很多公司的业务部署,都采用了可移植性的战略,以确保它们可以在不同的环境中运行。Run Anywhere/Run Everywhere 已成为未来应用程序设计的必要条件。

# 开源数据库市场增长

数据库是一个很大的市场,并且会越来越大。云和开源数据库的增长速度甚至超出了行业平均水平,由于公开信息很少,目前很难得到具体的相关数字。Gartner对整个市场发表了一些报告,却并未具体讨论规模和成长。像Oracle这样的公司也并未透露其与开源数据库有关的特定收入。

通过不同的公司、云提供商、分析师等提供的可用市场数据来估计,这一细分市场的年收入在7-8亿美元之间。这包括从云提供商处购买开源软件数据库。

开源数据库的增长率远高于行业平均水平,总体看来约为45-50%。一些供应商增长更迅速,MongoDB报告在第三季度,他们的Atlas DBaaS占其总收入的40%(去年同期为21%)。Atlas在最近一个季度的收入增长了185%以上。

从商用到开源

开源数据库增长的两个重要因素:

  • 新应用程序的开发

  • 来自传统商用数据库的迁移

目前很多公司的大型复杂业务仍运行在传统商用数据库上,考虑到导致迁移风险与成本,商用与开源共存的现象很普遍。

比如:

SQL Server+MySQL或Oracle+MySQL

2020年开源数据库行业状态报告

值得注意的是,并非所有的迁移都是简单的后端数据库替换,更多的是关于整个技术堆栈的替换,并且涉及从上到下的重做。

例如,从Oracle迁移到MongoDB 可能需要使用完全重新设计的云原生应用来替换整个原有架构,这里可以看到对复杂应用程序所做了更大的调整。

# 谁在推动当前的开源和云数据库增长?

一句话答案:开发人员

2020年开源数据库行业状态报告

过去,DBA或基础架构团队通常会努力整合,并降低所使用技术的复杂性。这使许多公司过于依赖单一的商用数据库产品(比如 Oracle 或者 SQL Server全家桶)但现在这种情况已经成为历史,更多优秀专业的数据库产品被设计出来。开发人员和架构师越来越多的倾向于选择这些新技术,多数据库的趋势日益明显。

2020年开源数据库行业状态报告

在当前的数据库环境中,开发人员有着比以往更多的选择。我们已经在很多大型公司中看到了相同的模式。

2020年开源数据库行业状态报告

各个开发团队选择了不同的技术。而DBA、SRE、SA等角色将接管并长期支持这些技术。当然这会使公司内部形成极其复杂的技术矩阵。

随着使用的熟练和效率的提升,基础架构团队逐渐成为“产品开发团队”,构建自动化的工具和架构,以支持变化迅速的技术堆栈。复杂的环境可能导致许多问题,而且难以整合到单个数据库技术中,但这是未来一个重要趋势。

# 2020年最受欢迎的开源数据库

下表对比了3个来源的数据:

Percona调查问卷、DB-Engines排名、Stack-Overflow调查问卷。

尽管存在一些差异,但在不同的调查和来源中,最受欢迎的开源数据库排名大致相似。

2020年开源数据库行业状态报告

DB-engines显示,开源与商业数据库的差距正在缩小:

2020年开源数据库行业状态报告

根据DB-engines的数据,以下是根据总体受欢迎程度的排名。截至2020年3月,MySQL的流行度仍是PostgreSQL和MongoDB的2倍。

2020年开源数据库行业状态报告

Stack-Overflow 每年都会进行大型开发人员调查(2019年有90,000名受访者)。以下是开源数据库 2018-2019年之间的使用率差异。

2020年开源数据库行业状态报告

1、MySQL数据库速览:

2020年开源数据库行业状态报告

MySQL可以用一字概括:稳

  • 具有最大的安装基础,DB-Engines排名比下一名高出2倍以上,如果算上所有分支版甚至可以超过oracle,无愧为最流行的开源数据库。

  • 尽管占有率很大,但许多公司都在运行各种不同的MySQL。

  • Oracle本身有数量可观的MySQL Enterprise(与Community社区版相比有一些功能差异,并且是付费的)。

  • Percona也具有适用于MySQL自己的版本,该版本100%的开源,并且包含增强功能和企业功能。

  • 也有许多公司运行自己的定制版本。

2020年开源数据库行业状态报告

MySQL的优点:

  • 庞大的安装基础

  • 易于上手

  • 长期的追溯与完善

  • 第三方服务的全面覆盖

  • 替代方案丰富

  • 良好的社区贡献

适用的场景:

  • 大量用于后端的第三方应用程序

  • Web应用程序

  • 电子商务:零售客户群通过MySQL支撑了爆发式增长的业务

  • 新应用程序开发一直是MySQL的最佳选择

MySQL社区:

  • 自从MySQL被收购Oracle之后,在稳定性和功能上都大大增强

  • Percona之类的公司已经在性能、可扩展性和功能方面为MySQL带来了全新的改进

  • Facebook、阿里巴巴、腾讯和其他公司为社区贡献了许多代码和功能

  • 生态系统中的新公司也在积极参与贡献力量。例如,PlanetScale等公司提供的Vitess横向扩展方案。

对MySQL未来的看法:

  • 会持续对现有功能进行完善与改进,但不会有大规模的创新、飞跃。

  • MySQL社区将致力于使其对开发人员更具吸引力,包括增加新功能、对开发人员更友好。

注意事项:

  • 对于大型的老旧应用,MySQL并不是很好的迁移目标

  • MySQL和MariaDB之间仍然存在差异(它们是不同的)

  • 人才紧缺,真正的专家总是不容易找到

  • 一直在稳定而渐进的创新,但没有全面的增强

2、PostgreSQL数据库速览:

2020年开源数据库行业状态报告

PostgreSQL已有23年的历史了,在过去的几年中,PG出现了大规模的普及和增长。DB-Engines显示其受欢迎度在过去四年中翻了一番。无论是云厂商的数据,还是分析师的经验都证明了这一爆炸性增长。

PostgreSQL的大部分增长来自老旧业务的迁移。PG良好的开放性也促进了其使用率的增长,可以在第三方程序、硬件和系统中进行嵌入、修改和加强。

2020年开源数据库行业状态报告

PostgreSQL的优点:

  • PostgreSQL是完全开放的,其背后没有任何公司实体,这使其成为一个真正的开放项目。

  • 开放的许可使它易于根据需要进行部署、嵌入和修改。

  • 具有完善的功能和完整的存储过程语言。

  • 对于大多数传统数据库开发人员和DBA而言,学习和提升更容易。

  • 有很多企业扩展和功能选项可用。

  • 在服务支持和DBaaS上有很多选择空间

适用的场景:

  • 旧版数据库迁移,PG在整合企业功能和过存储过程语言方面做得非常出色,这使其成为非常流行的迁移目标。

  • PostgreSQL的丰富功能集和强大特性,是业务构建新的OLTP应用的好选择。

  • GIS应用程序:PostgreSQL中的地理空间支持非常强大。

  • 边缘和嵌入式系统:许可证的开放性使其成为嵌入第三方项目、产品和系统的绝佳选择。(比如很多国产数据库)

PostgreSQL社区:

  • PostgreSQL社区是强大而热情的。

  • 主流云厂商、第三方提供商(如Percona,EnterpriseDB,CrunchyData,2ndQuadrant,Pivotal)和大型企业都对PostgreSQL有所贡献。

  • 提供支持和服务的公司很多,其中很多公司在标准PG数据库上提供增强功能。

对PostgreSQL未来的看法:

  • 目前PostgreSQL受重视程度很高,前途光明,预计会持续增长。

  • PostgreSQL的开放许可能导致更多“兼容”产品,用户有被锁定风险。

  • 注意,并非所有的PostgreSQL产品都是真正的开放,有些只是“开放源代码兼容(open source compatible)”。

注意事项:

  • 并非所有PG服务提供者都是开放的,DB选型前要注意,以确保可移植性。

  • 一些第三方扩展和附加组件的使用需要额外的工作量

  • 组件的支持程度很依赖其作者

  • 很多功能对于精通传统关系概念的人来说更容易学习,但对新入门者却不易掌握。

3、MongoDB 速览:

2020年开源数据库行业状态报告

在2020财年第三季度的财务业绩中,MongoDB宣布总收入为1.094亿美元,同比增长52%。其中MongoDB Atlas收入占第三季度总收入的40%,同比增长超过185%。Atlas拥有庞大的用户体量,截至2019年10月31日,已有超过15,900名客户使用。

MongoDB收入增长的因素有很多:功能扩展、价格上涨和产品变更。但仅凭收入很难衡量MongoDB的总体使用率。DB-engines可以看到一些增长,但并没有上面公开的收入和客户数量显示的那么多;Stack-Overflow 调查显示MongoDB使用率较为平坦;Percona与MongoDB相关主题的Web流量同比增长了20%以上。

2020年开源数据库行业状态报告

MongoDB的优点:

  • 灵活的模式,NoSQL将模式控制权交给开发人员

  • 将文档数据无缝转换为JS/Go/Python/Java本地对象,而不是SQL数据结构。

  • MongoDB的高可用性设计一开始就围绕副本集构建,轻松实现了无停机维护和自动故障转移。

  • 内置水平扩展支持最多数百个分片,是通用数据库中最好的大数据解决方案。

适用的场景:

  • Web(尤其移动端) 能够同时实现“big”和“fast” ,将模式控制权交给开发人员,减少迁移迭代时间。

  • 游戏(尤其移动端) 存储灵活、强扩展能力以及更易用的分片

  • MongoDB灵活的文档存储非常适合快速发展变化的业务要求,使其成为许多SaaS业务的流行后端DB。

MongoDB社区:

  • IPO前:很多黑客与贡献者支持,更多的开放性。

  • IPO后:官方的MongoDB认证,极客精神缺失。

  • 与其他数据库相比,MongoDB社区的控制更严格。

MongoDB未来的看法:

  • MongoDB开发的精力正在远离核心数据库服务。

  • MongoDB Inc的前身是10gen,旨在成为在线服务的完整平台。目前的MongoDB在Atlas服务中添加了文本搜索,云自动化,移动集成等功能,但这些都是封闭源。

  • 由于主要功能都投入在Atlas中首发,使用MongoDB的企业是否会转移业务到其云平台么?

注意事项:

  • SSPL不是公认的开源许可证,并非所有人都认可MongoDB真正开源。

  • SSPL允许和禁止的内容存在不确定性,可能阻碍社区和第三方的使用。

  • 专注于Atlas作为其平台,存在被Atlas绑定的风险。

  • MongoDB是一个生态系统受到严格控制、限制性很大的开源项目。这意味着社区贡献以及第三方服务支持会逐渐落后。

4、MariaDB 速览:

2020年开源数据库行业状态报告

DB-Engines显示MariaDB在过去几年中取得了显著增长,但它的普及率不到MySQL的1/10。MariaDB在很多Linux发行版中是默认的,这有助于其在社区中的发展,但目前尚未取得重大的商业成功。

使用MySQL和MariaDB混合环境的公司的数量有所增加,但这通常不是战略决策导致,而是更多的偶然情况。MariaDB在云中的增长速度较慢,人们往往倾向于使用MySQL。

尽管MariaDB的增长正在全球范围内进行,但我们发现在北美以外地区(尤其是在欧洲和亚洲)增长的速度要快得多。

2020年开源数据库行业状态报告

MariaDB的优点:

  • MariaDB趋向于创新突破,提供了很多有趣的新功能来尝试解决各种问题。

  • 一直保持与MySQL的兼容性,MySQL用户更容易迁移并开始使用它。

  • MariaDB基金会非常乐于助人,专注于社区。

  • 列数据库允许混合使用,推动“智能交易(Smart Transactions)”。

适用的场景:

  • 快速开发,开发人员都喜欢MariaDB的简单易用和一些功能。

  • 与其前身一样,MariaDB在运行Web应用中享有很高的声誉。

  • Oracle的替代品:MariaDB试图将自己定位为Oracle的替代品,但在这个领域仍然落后于PostgreSQL。

MariaDB社区:

  • MariaDB分为MariaDB基金会和MariaDB公司。基金会负责基本代码,并通过赞助和其他方式提供资金。这两个实体并存,很难将它们分开。

  • MariaDB有大量用户,他们已经部署并热衷于使用MariaDB来处理各种工作,公司的知名度和数量也没有MySQL/PostgreSQL的那种规模,提供一些企业可以选择赞助的付费功能。

  • 看好MariaDB前景并为之投资的公司很多,如Booking.com,Microsoft,阿里巴巴,腾讯和IBM。

对MariaDB未来的看法:

  • MariaDB确实在为企业领域的竞争做准备,特别针对金融等行业。

  • 他们一直在试图避免成为MySQL的衍生产品。

  • MariaDB正在努力推出自己的GA版DBaaS。

  • 随着MariaDB进入企业领域,他们正在删除一些更具实验性的功能,从而专注于提供更精简,稳定的企业服务。

注意:通常很难将MariaDB基金会与MariaDB Corp.分开。

注意事项:

  • MariaDB不再完全与MySQL完全兼容,一旦迁移过来,就很难后退。

  • 但核心RDBMS与MySQL的重叠仍然很大,因此两个数据库之间的选择更取决于个人偏好。

  • 过去增加的新功能可能导致一些异常和问题。目前精简了很多,以实现更多企业应用。

【编辑推荐】

  1. IBM 开源用于简化 AI 模型开发的工具包 Elyra
  2. 5.6恳谈会:阅文新管理团队态度诚恳主动沟通 承诺革除行业顽疾
  3. 实用开源Javascript库,10大图像处理库推荐
  4. “开源最大的谎言是什么?”
  5. 开源比较大的谎言是什么?
【责任编辑:张燕妮 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

从头解锁Python运维

从头解锁Python运维

多维度详解
共19章 | 叱诧少帅

326人订阅学习

Active Directory 架构规划实战

Active Directory 架构规划实战

4类AD架构规划
共15章 | wx5918591c0084b

320人订阅学习

庖丁解牛Ceph分布式存储

庖丁解牛Ceph分布式存储

云计算存储的基石
共5章 | Happy云实验室

192人订阅学习

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO官微