专利择要显示,本申请公开了一种短信文本模版的提取方法、提取装置、打算机可读存储介质及做事器,该方法包括:获取短信数据,对短信数据进行聚类,得到多个短信的分类凑集;在聚类过程中记录并处理每条短信的公共文本部分,得到每个分类凑集对应的公共文本;将分类凑集中的每条短信与公共文本进行比拟,得到每条短信的非公共文本部分;将所有非公共文本部分进行处理,得到模版变量的取值规则,将公共文本和模版变量的取值规则作为模版。通过提取出含有变量规则的短信文本模版,可以使终端将短信与模版进行比拟进行审核,当短信命中某一个模版后,就不须要连续进行人工审核,直接下发短信,极大的节约了审核的韶光以及提高了人工审核的效率。
本文源自金融界