申请试用
HOT
登录
注册
 
Nouns优于 N-Grams

Nouns优于 N-Grams

poppy
/
发布于
/
1719
人观看
此备选工作流替换标准工作流,同时从文本中生成表示文本中名词的标记或特征列表,并且准备用作进一步分析的特征。这些名词和名词短语特征在分类类型分析中比词干标记更好,能够服务于N-gram服务的许多相同目的,同时也避免或消除了与标准工作流和N-gram相关的许多问题。该方法的主要限制是POS标签和解释在计算上是强烈的。然而,我们已经实现了我们的解决方案的规模已扩大到100的GB的文本,并相信这将合理地扩展到低TB范围内没有硬件的变化。
6 点赞
2 收藏
0下载
相关文档
确认
3秒后跳转登录页面
去登陆