生词分析接口2
<p><strong>简要描述:</strong> </p>
<p><strong>文章分析底层:</strong>
文章分析接口底层调用函数:analyzeArticleData
底层函数路径为:PandoraSearch\SearchAndRecommentdation\SentenceSegmentation\SentTokenization5.py
底层函数返回结果格式:</p>
<pre><code>入参:
{
u'paragraph': [{
u'html_class': u'div',
u'title': u'',
u'belong': u'',
u'word_count': 84,
u'sentences': [u'这些路段正在施工,请绕行!还有这些信息,一定要看'],
u'match_analysis_result': u'',
u'par_num': u'par_1',
u'sent_count': 2
},
{
u'html_class': u'div',
u'title': u'',
u'belong': u'',
u'word_count': 84,
u'sentences': [u'秋天养球根花卉,不注意这5点开花难;做好这4点,花开艳丽满屋香'],
u'match_analysis_result': u'',
u'par_num': u'par_1',
u'sent_count': 2
}], u'articleInfo': {
u'word_num': 760,
u'list_img': u'[]',
u'article_title_md5': u'fbe146a5fb0cc91240c6adf5c8c53c4f',
u'source_key_words': [],
u'all_tags': [],
u'match_analysis_result': u'',
u'category': u'\u8d22\u7ecf',
u'view_count': 0,
u'article_img_num': 0,
u'title': u'\u7b2c\u56db\u5c4a\u4e2d\u56fd\u521b\u4e1a\u521b\u65b0\u535a\u89c8\u4f1a\u542f\u5e55 5G\u8d4b\u80fd\u5531\u4e3b\u89d2',
u'download_time': u'',
u'article_img': u'[]',
u'comment_count': 0,
u'article_html_content': u'',
u'content_md5': u'',
u'username': u'',
u'_summary': u'\u3000\u3000\u4e2d\u65b0\u793e\u4e4c\u5170\u5bdf\u5e038\u670812\u65e5\u7535 (\u8bb0\u8005 \u674e\u7231\u5e73)\u7b2c\u56db\u5c4a\u4e2d\u56fd\u521b\u4e1a\u521b\u65b0\u535a\u89c8\u4f1a(\u7b80\u79f0\u521b\u535a\u4f1a)12\u65e5\u5728\u5185\u8499\u53e4\u81ea\u6cbb\u533a\u4e4c\u5170\u5bdf\u5e03\u5e02\u542f\u5e55\u3002\u4e0e\u5386\u5c4a\u521b\u535a\u4f1a\u4e0d\u540c\u7684\u662f\uff0c\u4eca\u6b21\u521b\u535a\u4f1a5G\u5df2\u7ecf\u6210\u4e3a\u4e3b\u89d2\u3002\u3000\u3000\u672c\u5c4a\u521b\u535a\u4f1a\u4e3b\u9898\u4e3a\u201c5G\u6539\u53d8\u793e\u4f1a\uff0c\u79d1\u6280\u5f15\u9886\u672a\u6765\u201d\uff0c\u4e3b\u529e\u65b9\u5728\u5f00\u5e55\u4eea\u5f0f\u524d\u5c31\u505a\u8db3\u4e86\u5173\u4e8e5G\u7684\u201c\u529f\u8bfe\u201d\uff0c\u4f17\u591a\u53c2\u4f1a\u5609\u5bbe\u4e0d\u4ec5\u5728\u73b0\u573a\u4f53\u9a8c\u52305G\u624b\u673a\u5e26\u6765\u7684\u201c\u901f\u5ea6\u611f\u201d\uff0c\u8fd8\u73b0\u573a\u53c2\u89c2\u4e86AR\u535a\u7269\u9986\u30015G\u52a8\u611f\u4eff\u751f\u673a\u5668\u4eba\u4ee5\u53ca\u667a\u80fd\u89c6\u9891\u4e91\u3001\u65b0\u80fd\u6e90\u98de\u673a\u7b49\u3002\u3000\u3000',
u'publish_time': u'2019-08-12 17:52:00',
u'link': u'http://www.chinanews.com/cj/2019/08-12/8924510.shtml',
u'article_author': u'',
u'has_extern_link': 1,
u'_source': u'\u4e2d\u65b0\u793e\u65b0\u95fb'
}
}</code></pre>
<pre><code>返回结果
{
'number_words': [u '5', u '4'],
'kw_dict': {
u '秋天': {
'adj_score': 1.0,
'w': 1.0,
'freq': 1,
'txt': u '秋天',
'type': 'normal',
'nw': 1
},
u '满屋': {
'pkey': u 'c41_Uksjrzfo',
'adj_score': 0.23846153846153847,
'w': 292.0,
'freq': 1,
'txt': u '满屋',
'type': 'normal',
'nw': 0
},
u '球根': {
'pkey': u 'c77_MwyTca2C',
'adj_score': 0.8252941176470587,
'w': 241.0,
'freq': 1,
'txt': u '球根',
'type': 'normal',
'nw': 0
}
},
u 'articleInfo': {
u 'word_num': 760,
u 'list_img': u '[]',
u 'article_title_md5': u 'fbe146a5fb0cc91240c6adf5c8c53c4f',
u 'source_key_words': [],
'ccomp': {
u 'c41': 1,
u 'c77': 1
},
u 'all_tags': [(u '秋天', 1.0), (u '球根', 0.8252941176470587), (u '满屋', 0.23846153846153847)],
u 'match_analysis_result': u '',
u 'category': u '财经',
u 'view_count': 0,
u 'article_img_num': 0,
u 'title': u '第四届中国创业创新博览会启幕 5G赋能唱主角',
u 'download_time': u '',
u 'article_img': u '[]',
u 'comment_count': 0,
u 'article_html_content': u '',
u 'content_md5': u '',
u 'username': u '',
u '_summary': u ' 中新社乌兰察布8月12日电 (记者 李爱平)第四届中国创业创新博览会(简称创博会)12日在内蒙古自治区乌兰察布市启幕。与历届创博会不同的是,今次创博会5G已经成为主角。 本届创博会主题为“5G改变社会,科技引领未来”,主办方在开幕仪式前就做足了关于5G的“功课”,众多参会嘉宾不仅在现场体验到5G手机带来的“速度感”,还现场参观了AR博物馆、5G动感仿生机器人以及智能视频云、新能源飞机等。 ',
u 'publish_time': u '2019-08-12 17:52:00',
'new_words': [(u '秋天', 1)],
u 'link': u 'http://www.chinanews.com/cj/2019/08-12/8924510.shtml',
u 'article_author': u '',
u 'has_extern_link': 1,
u '_source': u '中新社新闻'
},
'time_words': [],
'kw_smap': {
u '秋天': [('para2_0', 1.0)],
u '满屋': [('para2_1', 0.23846153846153847)],
u '球根': [('para2_0', 0.8252941176470587)]
},
u 'paragraph': [{
u 'html_class': u 'div',
'name': 'para1',
u 'title': u '',
u 'belong': u '',
u 'word_count': 84,
u 'sentences': [u '这些路段正在施工,请绕行!还有这些信息,一定要看'],
u 'match_analysis_result': u '',
u 'par_num': u 'par_1',
u 'sent_count': 2
}, {
u 'html_class': u 'div',
'name': 'para2',
u 'title': u '',
u 'belong': u '',
u 'word_count': 84,
u 'sentences': [u '秋天养球根花卉,不注意这5点开花难;做好这4点,花开艳丽满屋香'],
u 'match_analysis_result': u '',
u 'par_num': u 'par_1',
u 'sent_count': 2
}],
'sent_info': [{
'id': 'para1_0',
'mr': u '这些||路段||正在||施工||,||请||绕行||!||还有||这些||信息||,||一定||要||看'
}, {
'id': 'para2_0',
'mr': u '秋天||养||球根||花卉||,||不||注意||这||5||点||开花||难'
}, {
'id': 'para2_1',
'mr': u '做好||这||4||点||,||花||开||艳丽||满屋||香'
}]
}</code></pre>
<ul>
<li>备注:无</li>
</ul>