阿里大数据竞赛——穿越到甄嬛传,你有几分胜算?

jopen 10年前

        又是一年选秀开始,于是宫里宫外又开始了明争暗斗。如何才能挑出合皇上口味的好秀女,当好主子的左膀右臂?可能还要花很多功夫。

        你知道皇上喜欢聪明的嬛嬛,喜欢明艳的华妃,喜欢得体的皇后,那你怎么知道皇上喜不喜欢新来的秀女呢?

        (皇上,左边是不是别有一番风味?——你一定是在逗我(╯‵□′)╯︵┻━┻)

阿里大数据竞赛——穿越到甄嬛传,你有几分胜算?

        好吧,现代的审美在宫里估计是站不住脚,但如果运用现代技术,比如机器学习算法,也许可以帮上你一些忙。

        要预测小主未来的受宠程度,自然是以宫中已有的主子们作为样本。各位娘娘千姿百态,你便首先要将大家的特点(attribute)加以归类,方便日后的总结。而对应的皇上的态度基本分为三类:朕喜欢,朕不喜欢,偶尔朕还觉得挺逗比的。

        然后聪明的你会去找@留一手给各位娘娘都打个单项分(方便谋划起见,请将他的分数调整为正数),然后与皇上的态度联系起来:        

嫔妃

容貌

家世

脾气

人际关系

皇上态度

甄嬛

         

沈眉庄

         

安陵容

         

华妃

         

皇后

         

吃货淳贵人

         

        像这样已经存在并被分类(皇上态度已经明确)的情报,我们称之为前车之鉴(training set)。

        有了情报,你就可以用很多种办法来处理它们,比如将这些分数调整比重相加得出一个总评分,总评分越高对应皇上越喜欢。这样,你大概可以算出皇上 喜欢温婉大方的白富美学霸,而且似乎美貌和温婉占的比重更大一些。为了验证这个评判法则,你可以选一些一开始尚未加入前车之鉴情报集、新发现的嫔妃 (testing set)进行验证。

        在验证的过程中,你才会知道神马叫做人算不如天算。总有一些姑娘虽然百般不符合你的预测,仍然得了皇上的宠幸。这就说明——皇上的眼瞎了?才不 是呢!是你需要修改你的评判法则了!这时你可以再加入一个改进因子(learning rate),每次如果预测结果与实际不符,你就得做出一定的修正。

        如此一来,你便可以将每年的选秀都当成你的八卦演练场了。当再有新人进宫的时候,你只需再分析一下新人的各个属性特征,就可以大概猜出这位小主 的前途。随着新人的不断进入,你的这个评判法则也会越来越趋于准确。当然,前提是皇上的口味保持一致。如果皇上性情大便,啊不,大变,那有可能原有的模型 都要推倒重来了。

        好吧,我们的机器学习算法看起来还不错,也为你的宫斗进阶之路提供了指引。如果你是女人,请你按照主子的喜好去努力,也许哪一天你就是下一个 容!嬷!嬷!(奴婢可是当年大明湖畔的夏雨荷!!!)如果你是一个#可爱的男孩子#,恭喜你,是一块苏培盛接班人的好材料……#注定孤独一生#

阿里大数据竞赛——穿越到甄嬛传,你有几分胜算?

        在 21 世纪的天猫,就有那么一群兢兢业业的可爱的男孩子,他们每时每刻都在寻找新的方式来揣测各位主子的意思,希望能给为屏幕前的皇上老佛爷们挑出最合各位口味的商品。这,就是我们[人见人爱花见花开妹子你们怎么还不到碗里来]的天猫算法团队。

        除了并肩作战之外,这些算法达人之间还会展开各种激烈的厮杀啃咬……来比赛谁更懂主子的心意!就是传说中的”阿里巴巴大数据竞赛内部赛——天猫 推荐算法大挑战”!那么高大上的名字想来你也还没听说过,不过随着天猫数据的开放,你也将有机会可以小试身手,看看面对看不见的主子们,你有几分胜算!

        少年们,继续加油,多多提高姿势水平啊!当年宫里那些个公公嬷嬷,都不知道比你高到哪里去了!

        阿里巴巴大数据竞赛——天猫推荐算法大挑战正式启动,给你真实的数据,解决真实的问题。百万大奖,等你挑战!快来参赛吧~~~

        参赛猛戳:http://102.alibaba.com/competition/addDiscovery/index.htm

阿里大数据竞赛——穿越到甄嬛传,你有几分胜算?

        大赛官方微博:@2014 阿里巴巴大数据竞赛

        大赛技术交流微博:@2014 阿里大数据竞赛技术交流