0
点赞
收藏
分享

微信扫一扫

spark与tez比较

洛茄 2022-04-06 阅读 45


概述

    ​spark​号称比mr快100倍,而​tez​也号称比mr快100倍;二者性能都远程mr,为什么都能远超mr?使用场景有什么区别?两者各自的优势又是在哪里?本文主要探讨这些问题

为什么性能远超mr?

  • spark​与​tez​都是以dag方式处理数据

使用场景区别?

  • spark​更像是一个通用的计算引擎,提供内存计算,实时流处理,机器学习等多种计算方式,适合迭代计算
  • tez​作为一个框架工具,特定为hive和​pig​提供批量计算

优势体现?

  • spark​属于内存计算,支持多种运行模式,可以跑在standalone,yarn上;而​tez​只能跑在yarn上;虽然​spark​与yarn兼容,但是​spark​不适合和其他yarn应用跑在一起
  • tez​能够及时的释放资源,重用container,节省调度时间,对内存的资源要求率不高; 而​spark​如果存在迭代计算时,container一直占用资源;

总结

    ​tez​与​spark​两者并不矛盾,不存在冲突,在实际生产中,如果数据需要快速处理而且资源充足,则可以选择​spark​;如果资源是瓶颈,则可以使用​tez​;可以根据不同场景不同数据层次做出选择;这个总结同样也适合​spark​与mr的比较;


举报

相关推荐

0 条评论