First I’d like to state that I’m not really a fan of signs(astrology). I just hear people talking about it. This post is done just for fun, do not take it as serious.

This post is originally posted at Wechat in Chinese, and I’m not planning to translate it here. But you can read the images. Still I’ve translated the only import part, that is, relax, read and forget.

昨天看公众号的时候看到个标题曰《全世界都在黑处女座》(具体什么座其实根本没留意), 诺奖结束还没太久就想,要不来统计一下诺奖与星座吧。

首先是十二星座的获奖分布:

  • 经济学:
  • 神的世界物理学
  • 大金牛:

我们这里再看一个有意思的数据,首先我们分学科计算各个星座的平均获奖个数, 然后用统计数据减去这个均值,得到一个每个学科内,各个星座获奖个数偏离平均值的数量:

这样计算没有考虑到某些星座的总人数可能就是有差异的, 但通过横向的比较仍然能看到一些异常值,例如, 可以看到对于物理学来说,巨蟹座的同学们更多,而摩羯比较少。

Data Source

首先需要一个可靠的数据源。记得之前看诺奖网站有一个列表,今天去看发现竟然提供了一个Developer API。 今年(2015)年的获奖者的生日数据仍缺失,所以近使用14年及以前的信息 (由于之前的图床offline,重新跑了一下截止2018年, 原文在这里)。

星座的计算方法

确实被玩晕了好久。参见Zodiac on wiki,不懂天文学就不解释了,主要是这一段:

Historically, these twelve divisions are called signs. Essentially, the zodiac is a celestial coordinate system, or more specifically an ecliptic coordinate system, which takes the ecliptic as the origin of latitude, and the position of the Sun at vernal equinox as the origin of longitude.

计算某日的星体位置使用Python + ephem,具体实现见这里。 也就是说没有简单采用某月某日的区间算法,而是根据天文坐标计算的。 另因为需要日期,所以忽略了所有不包含生日的获奖记录。

Again, just a toy.