新的联想文本测试接口
<p>新的联想文本开发</p>
<p><strong>数据存储位置:</strong></p>
<ol>
<li>数据存储在一个单独的redis中</li>
</ol>
<p><strong>数据类型</strong>
使用集合</p>
<p><strong>数据范围:</strong>
新闻、演员</p>
<p><strong>键名:</strong>
存放文本长度为1-5字
Associate:Text:Short:文本:Set</p>
<p>存放文本长度为6-12个字
Associate:Text:Middle:文本:Set</p>
<p>存放文本长度为12个字以上
Associate:Text:Long:文本:Set</p>
<p><strong>切词:</strong>
前缀词根:
1.取前四个词作为前缀词根</p>
<p><strong>结巴切词:</strong></p>
<ol>
<li>切词的词根少于10个,都作为词根</li>
<li>词根大于10个,根据文本长度从长到短保留10个。
结巴切词词根满足条件注意:</li>
<li>词根长度大于1 且不能为标点符号 或者是词根大于占总文本长度15%</li>
</ol>
<p><strong>测试</strong>
只做对象的标准名</p>