#眼下

关于眼下分词的想法

眼下分词性能比較差,仅仅有1.65M/s,同事在没有改变主要算法的情况下做了一点优化调整,到3.52M/s。但对性能的提升仍然不够明显。我感觉亟须解决几个问题:1.search时keyword分词也按多种粒度进行,然后分别sloppyphrase,最后or起来,因为大粒度分的词词频低,因此idf大。它们在排序时优先级更...
代码星球 ·2020-04-06