发布于: 雪球转发:0回复:6喜欢:0
中文NLP目前问题多多,需要等待更好的词库出现
引用:
2016-09-23 12:11
接上一条,要是做文本挖掘的能把这种舆情数据都理解了那就无敌了[想一下].....

全部讨论

草木萤2016-09-26 20:07

所以。。。人肉标签大法好?

冰烬2016-09-23 15:06

没表述精确不好意思 我是指鉴于中文语法结构,在中文语境里做分析,建立词库的整体思路貌似不能套用

草木萤2016-09-23 14:41

当然不是套用呀,一个好的词库是基础工作之一,然后才是数据处理了

冰烬2016-09-23 13:59

光套用词库肯定不行,语法结构基础是不一样的……

草木萤2016-09-23 13:10

恩。。。这个可能好处理,但面对各种高级黑和嘲讽还有一些语法问题“杀死那个猎人的狗”就很麻烦了, 目前国内那些大学做的词库和海外的英文词库在标签的成熟度上完全没法比

普利尼9982016-09-23 13:02

这句话里含有公司名称,确定关联关系并判断出负面情绪不难吧