0
点赞
收藏
分享

微信扫一扫

Apache Kylin,咱中国人自己的顶级项目!

Apache Kylin,咱中国人自己的顶级项目!

坚持原创,写好每一篇文章

如果想学习大数据的话,如果你不会Apache Kylin那就落伍了,Apache Kylin可以实现压秒级的查询,效率可以说非常的高,它是由我们中国团队研发并贡献给Apache组织的,成为了顶级项目,Kylin是麒麟的意思,可以说满满的中国风。

Apache Kylin可以做什么?

Apache Kylin的主要功能就是进行多维数据分析,随着数据量的增多,在进行数据分析的时候就会变得很慢,有了Apache Kylin,可以让我们在进行大数据分析的时候快速高效,像查询传统的数据库一样简单。它常常用于BI报表中,所谓BI就是Business Intelligence ,商业智能的意思,也就是把我们的数据变成有价值的东西,通过BI报表为商业服务,做成分析判断等等。

Apache Kylin的核心特点

大数据分析的时候一般我们需要的是统计结果,比如本年度的总的营业额是多少,而不太关注具体的数据明细,同时这个统计的结果的数据数目不会像数据明细一样疯狂的增长,基于这两个特点,Apache Kylin使用了预计算,所谓预计算是什么呢?顾名思义就是预先计算好。举个栗子🌰,某家口罩公司想看一下自己家的口罩卖的怎么样,统计一下十二月份的各种口罩销量情况,按照我们传统数据库的思路查询数据库中的销量明细表,然后按照口罩类型分类,排序返回结果。当口罩销量剧增的时候,查询也会越来越慢,我们不妨使用日期和口罩类型为维度,计算出销量会存储起来,这样查询需要的时候直接返回结果,存储数据的地方我们称之为数据仓库。这样的数据相当于二次数据,因为原数据已经丢失,数据库中保存的是按照维度统计的数据。

多维立方体分析

OLAP,on-Line Analytic Processing,在线分析处理的意思,它分为ROLAP基于关系型数据库的在线分析处理和MOLAP多维立方体分析,我们开发经常接触的MySQL这类的关系型数据库就是ROLAP,而Apache Kylin就是MOLAP。Kylin有维度和量度的概念,所谓维度是按照数据的什么字段进行分组,比如商品类型、日期等维度,所谓量度就是聚合值,比如销量。根据维度和量度得出的数据就是Cuboid物理视图,所有的维度按照这个量度组成的数据结果称为Cube。记住这个名词,我们以后的文章中可能经常提到它。

总结

这篇文章我们讲了为什么会出现Apache Kylin,Apache Kylin可以解决什么问题,以及它的核心技术点是MOLAP,以及介绍了维度、亮度、Cuboid、Cube的概念,了解这些概念对我们后续的Apache Kylin的学习很有帮助,这些概念都是基础。

❤️ 感谢大家

如果你觉得这篇内容对你挺有有帮助的话:

  1. 欢迎关注我❤️,点赞👍🏻,评论🤤,转发🙏
  2. 关注盼盼小课堂,定期为你推送好文,还有群聊不定期抽奖活动,可以畅所欲言,与大神们一起交流,一起学习。
  3. 有不当之处欢迎批评指正。
举报

相关推荐

0 条评论