#law

词性标注算法之CLAWS算法和VOLSUNGA算法

背景知识 一、基于规则的词性标注方法1.原理  利用事先制定好的规则对具有多个词性的词进行消歧,最后保留一个正确的词性。2.步骤  ①对词性歧义建立单独的标注规则库  ②标注时,查词典,如果某个词具有多个词性,则查找规则库,对具有相同模式的歧义进行排歧,否则保留。  ③程序和规则库是独立的两部分。3.例子  ...

齐夫定律, Zipf's law,Zipfian distribution

齐夫定律(英语:Zipf'slaw,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(GeorgeKingsleyZipf)于1949年发表的实验定律。它可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是...
代码星球 ·2020-12-17

幂率定律及绘制Power-law函数

来自:Eastmount在我们日常生活中PowerLaw(幂次分布,Power-lawDistributions)是常见的一个数学模型,如二八原则。这个世界上是20%的人掌握80%的人的金钱去经营,20%的人口拥有80%的财富,20%的上市公司创造80%的价值,80%的收入来自20%的商品等。下图表示人类的财富幂律分布...

Amdahl's Law

  Amdahl'sLaw程序可能的加速比取决于可以被并行化的部分。如果没有可以被并行化的部分,则P=0,speedup=1,nospeedup。如果全部可以被并行化,P=1,speedupisinfinite(inthecory)。可以获得无穷大的加速比。如果50%可以被并行化,maxmumspeedup=2.  如...
代码星球 ·2020-04-06