Windless
订阅/Feed
稗田千秋(i@wind.moe)

数据挖掘笔记其一 关联规则与Apriori

开个新坑,作为数据挖掘这门课的学习笔记,前面的部分理论就暂且省去。

"啤酒与尿布"的故事想必各位都有听过,这种从海量数据中获取有用信息,寻找数据间隐含关系的方法叫做关联规则学习(Association rule learning)。好比平时购物时所推荐的购物信息,就是从其用户的活动情况来生成推荐。

基本概念

项集(Itemset):项目集合,如果包含k个项,称为 k-项集。

频繁项集(Frequent Itemsets):支持度不小于给予的最小支持度的非空项集。

最大频繁项集(Maximum Frequent Itemsets):不是被其他元素所包含的项集。

稗田千秋
Apr.07 2017 ai
  • play_arrow

About this site

version:1.02 Alpha
博客主题: Lime
联系方式: i@wind.moe
写作语言: zh_CN & en_US
博客遵循 CC BY-NC-SA 4.0许可进行创作

此外,本博客会基于访客的Request Headers记录部分匿名数据用于统计(Logger的源码见Github),包含Referer, User-Agent & IP Address.个人绝不会主动将数据泄露给第三方