示例数据源格式如下,现需要统计每个group中uid的人数:
使用数据透视表默认情况下,只能选择“计数”得到每个group的行数,uid并没有去重;
解决办法:
示例数据源格式如下,现需要统计每个group中uid的人数:
使用数据透视表默认情况下,只能选择“计数”得到每个group的行数,uid并没有去重;
解决办法:
MySQL中group_concat函数可以将分组的指定字段合并成一行内容,用来作列转行比较合适。
完整的语法如下:
group_concat([DISTINCT] 要连接的字段 [Order BY ASC/DESC 排序字段] [Separator '分隔符'])
默认分隔符为英文逗号
示例:
select id,group_concat(distinct name) from table group by id;
需要注意的是合并后字段长度有默认限制
参考:
https://www.iteye.com/blog/hchmsguo-555543
http://www.mamicode.com/info-detail-1389878.html
https://www.cnblogs.com/franson-2016/p/6911631.html
https://www.cnblogs.com/llq1214/p/11202866.html
关联分析是数据挖掘体系中重要的组成部分之一,其代表性的案例即为“购物篮分析”。我们以数据挖掘软件Clementine自带的一个购物篮分析的数据为例,从多个方面来探讨这一方面的内容。
关联分析要解决的主要问题是:一群用户购买了很多产品之后,哪些产品同时购买的几率比较高?买了A产品的同时买哪个产品的几率比较高?可能是由于最初关联分析主要是在超市应用比较广泛,所以又叫“购物篮分析”,英文简称为MBA,当然此MBA非彼MBA,意为Market Basket Analysis。
如果在研究的问题中,一个用户购买的所有产品假定是同时一次性购买的,分析的重点就是所有用户购买的产品之间关联性;如果假定一个用户购买的产品的时间是不同的,而且分析时需要突出时间先后上的关联,如先买了什么,然后后买什么?那么这类问题称之为序列问题,它是关联问题的一种特殊情况。从某种意义上来说,序列问题也可以按照关联问题来操作。