如何定义明星?
从统计学的角度来定义一个事件发生的频次,并以此作为衡量标准是一个简单有效的方法,所以如果要用到统计学来定义一个问题的话,一般都需要先对这个问题的性质进行定量分析(即需要这个问题的样本数量足够大)。比如我们想知道某个药物是不是有效的(治疗指数),通常就需要先收集足够的样本量以证明该药物的治愈率至少高于50%。 同理,如果要定义什么是“著名的”、“家喻户晓的”或者“明星级”的,也可以采用这样的方式:定义为一个事件发生频率达到或超过一定数值的水平(频数/概率),而这样的水平就是基于统计指标的阈值,超过这一数值就可以认为是一个“频繁出现的事件”了。
但是这里也有一个问题:对于一个事件的描述除了考虑其出现的频率还应考虑其出现的强度,因为强度可以说明这一事件对于用户的冲击程度大小,如果仅仅考虑出现频率而没有考虑到强度的因素的话,那么对一些轻微的影响可能会忽略不计了。比如我提问的一个问题有100个人关注,其中有10个人点了赞,那么这个问题对于我的影响度(也就是我喜欢的问题被赞的数量与问题总数量的比值)是10%;但是如果一个问题只有10个人点了个赞,但我喜欢这个问题,那么这个问题的影响度对我来说就是100% 了。 所以要综合考虑事件发生的频率和强度才能较完整地定义什么是“频繁的”、“显著的”等。