猜想：内容挖掘工具在反腐方面的应用

但凡我们觉得讨厌的文风，自然有它独特的用词和结构，如此一来就完全可以纳入内容挖掘的范畴，并且用目前已有的技术进行分析，我突然有这么一个猜想：

首先已经有检察机构的同志们在致力于构建一个相对完备的贪官信息库，由此我们反查他们曾经的讲话、文章，并进行分析，找出其特点，再把那些等待提拔的同志曾经的讲话、文章拿来分析（比如情感分析、具有假大空的那种性质的高频词等等），和咱们那些腐败官员的文风一比，大致也就可以算出一个此人腐败的几率了。

这比反剽窃的要求更高，希望技术进步得更快一些。也希望有兴趣的机构给些赞助，这是个看得到收益的好事儿。

发表评论