像用“数据库”一样使用“大数据”!华为宣布河图引擎开源

新闻 大数据
华为 Cloud & AI 产品与服务总裁侯金龙宣布开源数据虚拟化引擎 HetuEngine(河图引擎),希望让伙伴像使用“数据库”一样使用“大数据”,让数据治理、使用更简单。

   11 月 19 日,华为在深圳举办了 2019 全球数据基础设施论坛。华为 Cloud & AI 产品与服务总裁侯金龙宣布,面向鲲鹏计算产业,全面启动数据基础设施战略,并开源数据虚拟化引擎 HetuEngine(河图引擎),希望让伙伴像使用“数据库”一样使用“大数据”,让数据治理、使用更简单。

  今年 9 月,华为在全联接大会上发布了“一云两翼双引擎”的鲲鹏计算产业布局,基于“鲲鹏+昇腾”双引擎,全面启航计算战略,为世界提供最强算力。今天华为又从数据角度对计算战略再一次进行了阐述。

  侯金龙表示,华为公司的愿景与使命是:“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”。在智能世界,算力成为新生产力,数据成为新生产资料,“5G、AI、云”成为新生产工具,将使能千行百业迈入智能时代。

  随着 5G、AI 和云的普及,数据量正以惊人的速度增长:从 1080P 到 4K、8K,视频数据量将提升 40 倍,从 4K 到 4K VR 要增加 6 倍以上;未来每辆自动驾驶汽车每天就会产生高达 64 TB 数据;深圳一个城市有超过 200 万摄像头,每天将产生 80 PB 数据,平均保存 30 天,大家希望保存更长时间;大量的数据过去只需存几天,现在需要保存几个月甚至永久保存

  根据预测,全球数据量将从 2018 年的 33 ZB 快速增长到 2025 年的 180 ZB。但是,产生的数据中仅有不到2% 被保存,而被保存的数据中仅有不到 10% 被应用。

  这些海量数据的增长背后是需要海量存储和计算的资源,数据增长是无限的,而存储资源却是有限的。

  华为希望,对数据的采、存、算、管、用实施端到端的整合和优化,让数据在全生命周期内更好用,数据的每比特发挥价值最大,数据的每比特成本最优

  为实现这个追求,华为打造融合、智能、开放的数据基础设施,让数据系统从孤立走向融合,从复杂走向智能,从封闭走向开放:

  1. 通过“打破数据处理与数据存储的边界”,实现数据高效共享和分析,降本增效。
  2. 通过“AI+ 存储+云”,实现数据全生命周期内智能管理和智能运营,让存储越用越快,价值越来越大。
  3. 通过“数据虚拟化引擎”,统一 SQL 语法,像使用数据库一样使用大数据。

  通过 10 余年技术积累和创新,华为在存储、数据库和大数据技术上实现了一系列突破,通过打破 4 堵墙,让数据的每比特发挥价值最大,数据的每比特成本最优。

  1. 打破存储内部系统墙:通过一套架构实现生产、分析、备份、归档的统一管理,一份数据在各个系统中平滑流动,减少拷贝,TCO 降低 30% 以上。
  2. 打破数据库与存储链路墙:通过算子下推实现近数据计算,减少存储层与计算层之间的数据交换,数据访问和处理性能提升 2 倍。
  3. 打破大数据与存储配置墙:通过存算分离实现资源灵活配置,计算不足扩计算,存储不足扩存储 。并通过弹性 EC、数据缩减技术减少冗余,整体 TCO 降低 30% 以上。
  4. 打破数据库与大数据协同墙:通过协同分析实现数据零搬迁,数据库和大数据共享一份数据,分析效率提升 100%。

  此外,针对目前大量业务需要跨平台、跨数据源协同分析,找数难、取数难、用数难等痛点,为了屏蔽数据类型差异、地域差异、语法差异,让数据治理简单,使用简单,华为推出了“河图引擎”。

  同时,为了更好地发展数据产业,今天侯金龙宣布开源河图引擎,开源版本的河图引擎叫 openHetu,将于 2020 年 6 月上线。

  华为将开源内核,开发者可以基于开源代码进行定制,包括数据源扩展、SQL 执行策略等,实现应用快速对接,提升开发效率。

  侯金龙最后表示,华为始终践行“平台+生态”策略,通过硬件开放,软件开源,使能伙伴,共建开放、繁荣的鲲鹏计算产业生态,共同迈入智能时代。

 

责任编辑:张燕妮 来源: 快科技
相关推荐

2013-08-22 10:17:51

Google大数据业务价值

2013-07-26 10:15:29

云计算大数据Hadoop

2017-11-06 14:18:03

2023-04-05 14:19:07

FlinkRedisNoSQL

2021-12-28 11:23:36

SQLServerExcel数据分析

2021-07-14 10:00:28

数据库SQL查询Linux

2017-04-26 14:02:18

大数据数据分析Excel

2021-01-21 11:31:26

AI 数据人工智能

2021-05-20 08:37:32

multiprocesPython线程

2022-08-03 08:52:35

Bytebase开源

2023-09-04 14:28:33

FlarumDiscourse开源

2012-10-26 12:33:58

视频会议视频通信华为

2017-06-23 08:18:17

2019-04-11 18:00:40

数据数据科学项目

2021-08-27 06:41:34

Docker ContainerdRun&Exec

2013-12-17 09:02:03

Python调试

2013-12-31 09:19:23

Python调试

2022-12-21 15:56:23

代码文档工具
点赞
收藏

51CTO技术栈公众号