#nlp

nlp词性标注的作用

词性标注 –除了语法关系,句中单词的位置(词性)标记也蕴含着信息,词的位置定义了它的用途和功能。宾夕法尼亚大学提供了一个完整的位置标记列表。下方代码则使用了NLTK库来对输入的文本进行词性标注。fromnltkimportword_tokenize,pos_tagtext="Iamlearning...
代码星球 ·2020-04-18

NLP中的预训练语言模型(一)—— ERNIE们和BERT-wwm

  随着bert在NLP各种任务上取得骄人的战绩,预训练模型在这不到一年的时间内得到了很大的发展,本系列的文章主要是简单回顾下在bert之后有哪些比较有名的预训练模型,这一期先介绍几个国内开源的预训练模型。一,ERNIE(清华大学&华为诺亚)  论文:ERNIE:EnhancedLanguageRepresen...

[NLP] TextCNN模型原理和实现

1.1论文YoonKim在论文(2014EMNLP)ConvolutionalNeuralNetworksforSentenceClassification提出TextCNN。将卷积神经网络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中的关键信息(类似于多窗口大小的ngram),从而能够更好地...

NLP之语言模型

 参考:https://mp.weixin.qq.com/s/NvwB9H71JUivFyL_Or_ENAhttp://yangminz.coding.me/blog/post/MinkolovRNNLM/MinkolovRNNLM_thesis.html语言模型本质上是在回答一个问题:出现的语句是否合理。在...
代码星球 ·2020-04-13

Python分词、情感分析工具——SnowNLP

本文内容主要参考GitHub:https://github.com/isnowfy/snownlpwhat'sthe SnowNLP  SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便...

NLP系列-中文分词(基于词典)

        词是最小的能够独立活动的有意义的语言成分,一般分词是自然语言处理的第一项核心技术。英文中每个句子都将词用空格或标点符号分隔开来,而在中文中很难对词的边界进行界定,难以将词划分出来。在汉语中,虽然是以字为最小单位,但是一篇文章...

NLP之关键词提取(TF-IDF、Text-Rank)

1.文本关键词抽取的种类:关键词提取方法分为有监督、半监督和无监督三种,有监督和半监督的关键词抽取方法需要浪费人力资源,所以现在使用的大多是无监督的关键词提取方法。无监督的关键词提取方法又可以分为三类:基于统计特征的关键词抽取、基于词图模型的关键词抽取和基于主题模型的关键词抽取。2.基于统计特征的有个最简单的方法,利用...

nlp基础(一)基本应用

1.问答系统,它主要是针对那些有明确答案的用户问题,而且通常面向特定的领域,比如金融,医疗,这一类的机器人。它的技术实现方案分为基于检索和基于知识库两大类。2.第二个任务型对话系统,大家看论文的时候看的大多数的对话系统都是任务型的,它也是面向特定的领域,而且是非常明确的领域。它是以尽快地正确的完成明确的任务为目标的,而...
代码星球 ·2020-04-10

【论文笔记】CNN for NLP

什么是ConvolutionalNeuralNetwork(卷积神经网络)?  最早应该是LeCun(1998)年论文提出,其结果如下:运用于手写数字识别。详细就不介绍,可参考zouxy09的专栏,主要关注convolution、pooling,个人理解是这样的,convolution是做特征检测,得到多个featur...
代码星球 ·2020-04-06

Machine Learning、Date Mining、IR&NLP 会议期刊论文推荐

核心期刊排名查询http://portal.core.edu.au/conf-ranks/http://portal.core.edu.au/jnl-ranks/1、机器学习推荐会议ICML——很难读懂,值得一读NIPS——主要看文章摘要ECML2、数据挖掘推荐会议:IC...

NLP里面的一些基本概念

1,corpus语料库acomputer-readablecollection oftextorspeech 2,utterance发音比如下面一句话:Idouhmain-mainlybusinessdataprocessing uh是fillers,填充词(Wordslikeuhandu...

2020年AI、CV、NLP顶会最全时间表

2019-09-0114:04:19 weixin_38753768 阅读数40 2020AI、CV、NLP主流会议时间表,包含会议举办的时间、地点、投稿截止日期、官方网址/社交媒体地址,还有H指数(谷歌学术的期刊会议评判标准,即过去5年内有至多h篇论文被引用了至少h次)。 2月...
代码星球 ·2020-04-03

NLP大赛冠军总结:300万知乎多标签文本分类任务(附深度学习源码)

     七月,酷暑难耐,认识的几位同学参加知乎看山杯,均取得不错的排名。当时天池AI医疗大赛初赛结束,官方正在为复赛进行平台调试,复赛时间一拖再拖。看着几位同学在比赛中排名都还很不错,于是决定抽空试一试。结果一发不可收拾,又找了两个同学一起组队(队伍init)以至于整...

超过 150 个最佳机器学习,NLP 和 Python教程

微信号&QQ:862251340微信公众号:coderpai简书地址:http://www.jianshu.com/p/2be3...我把这篇文章分为四个部分:机器学习,NLP,Python和数学。我在每一部分都会包含一些关键主题,但是网上资料太广泛了,所以我不可能包括每一个可能的主题。如果你发现好的教程,请告...

从 Quora 的 187 个问题中学习机器学习和NLP

原创 2017年12月18日20:41:19作者:chen_h 微信号&QQ:862251340 微信公众号:coderpai 简书地址:http://www.jianshu.com/p/ac1840abc63fQuora已经变成了一个获取重要资源的有效途径。许多的顶尖研...
首页上一页123下一页尾页