大自然在召唤

关注

基于RDD的频繁模式的挖掘API

大自然在召唤

关注

阅读 59

2023-03-07

FP-growth

可调参数:

  • minSupport:被识别为频繁项集的最小支持度。例如,如果一个项目在 5 个事务中出现 3 个,则它的支持率为 3/5=0.6。
  • numPartitions: 用于分发工作的分区数。



相关推荐

书呆鱼

基于RDD的聚类算法API

书呆鱼 80 0 0

爪哇驿站

【R】【频繁模式挖掘Apriori算法实验】

爪哇驿站 63 0 0

大师的学徒

数据仓库大作业--频繁模式挖掘

大师的学徒 18 0 0

Raow1

数据挖掘(3.1)--频繁项集挖掘方法

Raow1 65 0 0

高子歌

数据挖掘可以挖掘什么类型的模式?

高子歌 17 0 0

黄昏孤酒

RDD的特性 ---- RDD的缓存

黄昏孤酒 75 0 0

郝春妮

RDD的特性 ---- RDD的checkpoint

郝春妮 99 0 0

前程有光

spark RDD 函数API指南

前程有光 71 0 0

月半小夜曲_

RDD的方法

月半小夜曲_ 170 0 0

yundejia

RDD如何分区,各种模式下的分区数目是怎样的?

yundejia 173 0 0

精彩评论(0)

0 0 举报