扯淡：计算数组元素出现次数

看到一个编码题目，描述是，给定长度为n（比如15）的整数数组，求出所有出现次数大于n/3的整数。比如[3, 7, 3, 6, 3, 6, 3, 6, 7, 3, 53, 6, 3, 6, 6]。

然后当然有各种语言的答案，其中有个人写了个 Python 的代码，比较长，而且复杂，于是被人嘲讽Python丑哭。

[k for k,v in reduce(lambda acc,v: (acc.__setitem__(v,acc.get(v,0)+1),acc)[-1], l, dict()).items() if v>len(l)/3]

这种浆糊代码显然是一点都不 Pythonic 的。我觉得没理由 Python 解决这种小问题会这么复杂，何况这种 iterable 对象的次数统计，用 Python 的 collections 库刚刚好，何苦自己瞎折腾。

a = [3, 7, 3, 6, 3, 6, 3, 6, 7, 3, 53, 6, 3, 6, 6]
c = collections.Counter(a)
result = [i for i in c.keys() if c[i] > len(a)/3]

当然，collections 需要事先 import 一下，好像不是那么的能显示 Coder 自己的功夫，但是啊，Python 号称 Battery Included ，不就是让人充分利用这些内置库吗？

其实看到这个题目，我第一反应是用Perl，一行流：

@a = (3, 7, 3, 6, 3, 6, 3, 6, 7, 3, 53, 6, 3, 6, 6);
# 第一次 grep 找出符合条件的整数，第二次 grep 去重
@result = grep { !$j[$_]++ } grep { ++$i{$_} > @a/3 } @a;

玩一行流，Perl 的优势是极大的。

变量不用事先声明。

默认不开 strict 模式，直接使用 %i, %j 这两个 hash 是没问题的。
直接使用 hash 不会检查 key 是否存在，所谓 autovivification。

虽然 %i 这个 hash 里没有事先定义 @a 中的任何一个值作为 key，但是也可以直接拿值来计算。这个特性，有好有坏，但是我觉得还是好处居多。
隐形的类型转换。

比如这里的 $i{$_} 值是 undef 的时候，自增运算会变成 1。数组变量在 scalar 上下文中自动转换成数组的长度，所以可以直接使用 @a/3。

如果某个元素出现的次数远大于n/3，上面的代码在第一次grep的时候会做一些无用的比较，会把这个元素多次过滤出来，所以需要去重。避免这种情况可以使用用类似上面 Python 代码的流程。总之思路都是先创建一个以元素为key，以出现次数为value的hash。

@a = (3, 7, 3, 6, 3, 6, 3, 6, 7, 3, 53, 6, 3, 6, 6);
$h{$_}++ for @a;
$results = grep { $h{$_} > @a/3 } keys %h;

不过我也是无聊，好久不写博客，大半夜竟然发这种东西。