@解名缰 @达芬奇的鸡蛋 你们上报纸了耶!你羡慕那些出口就会吟诗的文人吗?现在可以不用再羡慕他们了!因为有一位理科生“yixuan”闲来无事,把《全宋词》拿出来“捣鼓”,算出了其中的99个高频词汇。熟记这些高频词,你就可以随性所欲进行创作了!你还可以用“无序”的数字来创造一首“美妙绝伦”的宋词,圆周率也可以哦! 简化宋词就是“东风何处在人间” 署名为“yixuan”的网友在个人博客里写道:“突然想看看宋词里面什么样的意象是最常见的,比如可以做个频率分析什么的。当然文本挖掘需要分词,我没法在其中花太多时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。”比如“犹解嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。”大家一致分析这位网友一定是个理科生。 随后, “yixuan”贴出了他算出来的高频词,排在前面的分别是:1、1485 2、东风(1382)3、何处(1230)4、人间(1202)5、风流(857) 6、归去(812)7、春风(802)8、西风(779)9、归来(771)10、江南(765)……至于为什么第一名是数字,他解释:“排在第一的是无效字符,这跟数据源有关。”这个结果一出来,一位网友就一语道破了“玄机”,“原来,最流行的宋词就是‘东风何处在人间’啊!” 生日、手机号 随意组合都很美 还有更绝的呢!署名为“达芬奇的鸡蛋”的果壳网友不知怎么地,就想到了拿大家都会背一点的圆周率进行创作,两个数字一断,对照高频词表,一首“华丽丽”的词就出来了!还附上了说明,特别像模像样。《清平乐·圆周率》回首明月(一看就是抒情诗),悠悠心事空(果然,貌似失恋了),西湖何事寂寞中(触景生情),风吹斜阳匆匆(回忆那天下午的艳遇),芳草平生斜阳(平生见过最美的太阳和芳草,都是因为那里有你的身影),风吹寂寞今日(到现在就剩我自己),一枝富贵年年(好花美丽年年开,好景宜人不常在),断肠长安不知(我的思念远方的你可知道)? 看完这首诗,网友们一边膜拜,一边自己的创作灵感也被打开了。“丘寒”留言道:“试着用某个号码创作了一首:天上相思,芳草年年,昨夜江南,回首一笑多情。”“零Ronnie”很有创作激情:“我的生日:年年江上,江南春风;我的手机号:明月芳草去年,江南阑干归去……还真挺上口的!我也能做诗人了哈哈!” 理科生欢呼:消灭文科生的日子来了 可是这么一来,文科生又不淡定了,一群文科生跳起来反击。“雯名霞迩”大叫:“统统拖出去,斩了!这让学中文的人情何以堪啊!”“Rockfish”代表理科生还击:“理科宅男们消灭文科生的日子到来了!拿起你的计算器,消灭文艺青年吧!”“可可”童鞋呼唤:“就让科技小清新来得更猛烈些吧!” 还有一群网友七嘴八舌讨论着。“沌世界”淡定地说:“不知宋词的粉丝看了是不是有一种偶像破灭的感觉。”“家杰仕”童鞋也总结道:“文艺男女已经阻止不了技术宅作诗了!”网友“Rakin”点评:“理科生文艺得真凶猛!”“焰心Spring”呼吁:“想文艺一回的同学请转!”“ChanIm”表示:“当时学写诗的时候超鄙视这些,现在淡定了,因为没那么多愁善感了。”“思念的秋天”感慨:“穿越必备!”“NetCharm”说:“背熟了,随便组合一下,写出来的也不会太烂。”“huahualipo”童鞋还提出了意见:“高人,能不能把平仄也加上……如果平仄太困难,至少考虑一下词尾押韵如何?韵脚也就十来个,每个都分配一个数值,然后每隔一行,末尾的词就只从一个值下选。这样会大大增加仿真度啊!”