51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#nlp
nlp词性标注的作用
词性标注 –除了语法关系,句中单词的位置(词性)标记也蕴含着信息,词的位置定义了它的用途和功能。宾夕法尼亚大学提供了一个完整的位置标记列表。下方代码则使用了NLTK库来对输入的文本进行词性标注。fromnltkimportword_tokenize,pos_tagtext="Iamlearning...
代码星球
·
2020-04-18
nlp
词性标注
作用
NLP中的预训练语言模型(一)—— ERNIE们和BERT-wwm
随着bert在NLP各种任务上取得骄人的战绩,预训练模型在这不到一年的时间内得到了很大的发展,本系列的文章主要是简单回顾下在bert之后有哪些比较有名的预训练模型,这一期先介绍几个国内开源的预训练模型。一,ERNIE(清华大学&华为诺亚) 论文:ERNIE:EnhancedLanguageRepresen...
代码星球
·
2020-04-15
NLP
中的
训练
语言
模型
[NLP] TextCNN模型原理和实现
1.1论文YoonKim在论文(2014EMNLP)ConvolutionalNeuralNetworksforSentenceClassification提出TextCNN。将卷积神经网络CNN应用到文本分类任务,利用多个不同size的kernel来提取句子中的关键信息(类似于多窗口大小的ngram),从而能够更好地...
代码星球
·
2020-04-14
NLP
TextCNN
模型
原理
实现
NLP之语言模型
参考:https://mp.weixin.qq.com/s/NvwB9H71JUivFyL_Or_ENAhttp://yangminz.coding.me/blog/post/MinkolovRNNLM/MinkolovRNNLM_thesis.html语言模型本质上是在回答一个问题:出现的语句是否合理。在...
代码星球
·
2020-04-13
NLP
语言
模型
Python分词、情感分析工具——SnowNLP
本文内容主要参考GitHub:https://github.com/isnowfy/snownlpwhat'sthe SnowNLP SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便...
代码星球
·
2020-04-13
Python
分词
情感
分析
工具
NLP系列-中文分词(基于词典)
词是最小的能够独立活动的有意义的语言成分,一般分词是自然语言处理的第一项核心技术。英文中每个句子都将词用空格或标点符号分隔开来,而在中文中很难对词的边界进行界定,难以将词划分出来。在汉语中,虽然是以字为最小单位,但是一篇文章...
代码星球
·
2020-04-12
NLP
系列
中文
分词
基于
NLP之关键词提取(TF-IDF、Text-Rank)
1.文本关键词抽取的种类:关键词提取方法分为有监督、半监督和无监督三种,有监督和半监督的关键词抽取方法需要浪费人力资源,所以现在使用的大多是无监督的关键词提取方法。无监督的关键词提取方法又可以分为三类:基于统计特征的关键词抽取、基于词图模型的关键词抽取和基于主题模型的关键词抽取。2.基于统计特征的有个最简单的方法,利用...
代码星球
·
2020-04-11
NLP
关键词
提取
TF-IDF
Text-Rank
nlp基础(一)基本应用
1.问答系统,它主要是针对那些有明确答案的用户问题,而且通常面向特定的领域,比如金融,医疗,这一类的机器人。它的技术实现方案分为基于检索和基于知识库两大类。2.第二个任务型对话系统,大家看论文的时候看的大多数的对话系统都是任务型的,它也是面向特定的领域,而且是非常明确的领域。它是以尽快地正确的完成明确的任务为目标的,而...
代码星球
·
2020-04-10
nlp
基础
基本
应用
【论文笔记】CNN for NLP
什么是ConvolutionalNeuralNetwork(卷积神经网络)? 最早应该是LeCun(1998)年论文提出,其结果如下:运用于手写数字识别。详细就不介绍,可参考zouxy09的专栏,主要关注convolution、pooling,个人理解是这样的,convolution是做特征检测,得到多个featur...
代码星球
·
2020-04-06
论文
笔记
CNN
for
NLP
Machine Learning、Date Mining、IR&NLP 会议期刊论文推荐
核心期刊排名查询http://portal.core.edu.au/conf-ranks/http://portal.core.edu.au/jnl-ranks/1、机器学习推荐会议ICML——很难读懂,值得一读NIPS——主要看文章摘要ECML2、数据挖掘推荐会议:IC...
代码星球
·
2020-04-06
Machine
Learning
Date
Mining
IR
NLP里面的一些基本概念
1,corpus语料库acomputer-readablecollection oftextorspeech 2,utterance发音比如下面一句话:Idouhmain-mainlybusinessdataprocessing uh是fillers,填充词(Wordslikeuhandu...
代码星球
·
2020-04-04
NLP
面的
一些
基本概念
2020年AI、CV、NLP顶会最全时间表
2019-09-0114:04:19 weixin_38753768 阅读数40 2020AI、CV、NLP主流会议时间表,包含会议举办的时间、地点、投稿截止日期、官方网址/社交媒体地址,还有H指数(谷歌学术的期刊会议评判标准,即过去5年内有至多h篇论文被引用了至少h次)。 2月...
代码星球
·
2020-04-03
2020年
AI
CV
NLP
顶会
NLP大赛冠军总结:300万知乎多标签文本分类任务(附深度学习源码)
七月,酷暑难耐,认识的几位同学参加知乎看山杯,均取得不错的排名。当时天池AI医疗大赛初赛结束,官方正在为复赛进行平台调试,复赛时间一拖再拖。看着几位同学在比赛中排名都还很不错,于是决定抽空试一试。结果一发不可收拾,又找了两个同学一起组队(队伍init)以至于整...
IT猿
·
2020-03-27
NLP
大赛
冠军
总结
300万
超过 150 个最佳机器学习,NLP 和 Python教程
微信号&QQ:862251340微信公众号:coderpai简书地址:http://www.jianshu.com/p/2be3...我把这篇文章分为四个部分:机器学习,NLP,Python和数学。我在每一部分都会包含一些关键主题,但是网上资料太广泛了,所以我不可能包括每一个可能的主题。如果你发现好的教程,请告...
IT猿
·
2020-03-27
超过
最佳
机器
学习
NLP
从 Quora 的 187 个问题中学习机器学习和NLP
原创 2017年12月18日20:41:19作者:chen_h 微信号&QQ:862251340 微信公众号:coderpai 简书地址:http://www.jianshu.com/p/ac1840abc63fQuora已经变成了一个获取重要资源的有效途径。许多的顶尖研...
IT猿
·
2020-03-27
学习
Quora
个问
题中
机器
首页
上一页
1
2
3
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他