趣味编程-现代诗词中的高频词语

2018-09-04 19:57:47 / 3716 / 编程代码

提起诗词,大家首先想到的,都是唐诗宋词。

相信任何一个人都能随口朗诵出“床前明月光,疑是地上霜”的诗句。

诗词作为古代文学的经典载体,浓缩了作者太多了的感情和思想,很多都值得现在的我们去品味,去学习。

然而,今天我们不说古代诗词,谈一谈不为人熟知的现代诗词。

现代诗词,顾名思义,就是现代人所写,按照平仄押韵做的诗词。

因为古字和今字有所不同,所以用的平仄押韵也有所变化。

古代诗词,一般使用的都是平水韵词林正韵

现代诗词中,也可以用古韵写,也可以使用中华新韵(今韵)来书写诗词。

如果没有按照平仄来写的诗词,称之为古诗词或者打油诗。因为在唐朝之前,那时候诗还没有形成平仄的规矩,所以那时候都是不按照平仄的。

例如大家熟知的诗经,就是古诗词。

作为一个喜欢诗词的程序员(平时也会写上几首烂诗,歌以咏志),我也想着能不能用代码来做一些有趣的事情。

正好,那天在网上看到一个git项目,有个程序员统计了唐诗宋词中出现的高频词语,激发了我浓厚的兴趣。

附上这个有趣的git项目地址,有兴趣的同学可以去看看:

chinese-poetry-古诗词数据以及统计

古代的都统计了,那么现代的呢?

于是我花了一点时间,采集了16万首现代诗,5万首现代词来进行数据分析。

作品当然也是良莠不一的,不过能保证平仄格律大部分都是正确的,经过校验的。

因为我是一个使用着全世界最好语言php的工作者,所以代码全部都是使用php来完成的。

涉及到中文分词的部分,可以看我写的博文SCWS中文分词PHP扩展详细安装说明

至于爬取的数据以及接口,这个很抱歉,不方便提供,因为毕竟我们要保护各位作者以及相应网站的版权问题。

然后,我做了下面这个网站,向你详细展示了一些统计出来的数据:

http://shici.lovefc.cn (最好使用电脑端,谷歌内核浏览器访问,我没做适应手机端的访问页面)

从数据中随机出的这首现代词,我挺喜欢的!

另外小声嘀咕: 如果你们运气够好,能够随机到一个作者叫"临风"的人的诗词,那就是本宝宝无疑了。

shi.lovefc.cn

虽然现代诗词比较冷门,但是我觉得大家也不要视其为糟粕。

很多作者的诗词都是很好的,而且确实也是表达个人思想的一种方式,而不是无病呻吟。

望周知!


  • 很强,我也很喜欢诗词歌赋,当时都很想选文科去了,无奈为五斗米折了腰,现在当了码农。见到站长如此厉害,赶紧种草

    回复
gravatar头像