上个月在Kaggle看到一个关于Kaggle自己的leaderboard数据可视化任务:表格形式反映比赛排名太枯燥,如何可视化地反映出比赛中随时间交替排名激烈的竞争场面?

To an observer, the leaderboard is a spreadsheet. They see funny team names, numbers with too many decimals, strange column titles, and none of the history behind the battle. We run a veritable nerd olympics, but instead of smashing the 100m world record, we're elbowing for a few decimal places of some esoteric quantity called a capped binomial deviance. It's faceless. It's cold. It fails to tell the story of the battle. And you know what that means?This means war.

提交上来的候选作品思路都差不多,时间为横轴排名为竖轴,可以一目了然看出排名随时间的变化趋势,并且也很容易看出一个队伍是从什么时间点加入比赛的,老外管这个叫Bumps Chart,还跟英国剑桥牛津的划船赛有关。后来Bumps Chart其实就曲线图,但是特别在只有两个时间点。

battles of the best

还有一个比较特别的作品使用Bubble Chart,横轴是每支队伍竖轴是比分,每个泡泡表示一个提交,加入比赛的时间点特别标出。想到ACM比赛就可以这么进行数据可视化处理(当然现在的表格表示挺好的):比赛队伍/通过的题目数/提交次数/程序耗时/时间有五维,比赛队伍用不同颜色泡泡表示,通过的题目数是竖轴,程序耗时是横轴,提交次数可以用泡泡大小来表示,最后时间轴左右拖动显示一个时间点的比赛状态。可以参照Hans Rosling在2006年TED大会上的演讲:数据可视化透视世界发展状况。
kaggle WaterGunRaceChart