#KL

常用模块一(os模块、序列化模块(json和pickle))

一、os模块      os模块是与操作系统交互的一个接口。  importos  #和文件和文件夹的操作有关os.makedirs('dirname1/dirname2')#可生成多层递归目录  os.removedirs('dirname1')#若目录为空...

Merkle Tree算法详解

转载自:http://blog.csdn.net/yuanrxdu/article/details/22474697MerkleTree是Dynamo中用来同步数据一致性的算法,MerkleTree是基于数据HASH构建的一个树。它具有以下几个特点:1、数据结构是一个树,可以是二叉树,也可以是多叉树(本BLOG以二叉树...
代码星球 ·2021-02-25

pickle and joblib

在训练模型后将模型保存的方法,以免下次重复训练。使用pickle模块或者sklearn内部的joblib一、使用pickle模块fromsklearnimportsvmfromsklearnimportdatasetsclf=svm.SVC()iris=datasets.load_iris()X,y=iris.data...
代码星球 ·2021-02-23

sklearn 中的Countvectorizer/TfidfVectorizer保留长度小于2的字符方法

在sklearn中的sklearn.feature_extraction.text.Countvectorizer()或者是sklearn.feature_extraction.text.TfidfVectorizer()中其在进行却分token的时候,会默认把长度<2的字符抛弃,例如下面的例子:x=['ilov...

信息,熵,联合熵,条件熵,互信息(信息增益),交叉熵,相对熵(KL散度)

自信息I表示概率空间中的单一事件或离散随机变量的值相关的信息量的量度。它用信息的单位表示,例如bit、nat或是hart,使用哪个单位取决于在计算中使用的对数的底。如下图:对数以2为底,单位是比特(bit)对数以e为底,单位是纳特(nat)如英语有26个字母,假设在文章中出现的概率相等,每个字母的自信息量(也称作编码长...

android开发使用setOnClickListener点击事件实现双击事件的解决方法

android没有提供给我们直接设置双击事件的方法,当然可以使用setOnTouchListener使用,这里提供一种简洁的实现方法使用kotlin实现代码如下:privatevarlastClickTime=0LtextView.setOnClickListener{valclickTime=System.curre...

python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess logging re正则

 python常用模块timerandomos模块sys模块json&pickleshelve模块xml模块configparserhashlib subprocessloggingre正则转自老男孩老师Yuan:http://www.cnblogs.com/yuanchenqi/artic...

MySqlBulkLoader的使用

mysql数据库:最近要写一个服务,跨库数据同步,目前数据量大约一万,以后会越来越多,考虑到扩展性,数据的插入操作就采用了MySqlBulkLoader。本文分两部分来写,第一部分写一下MySqlBulkLoader的使用,第二部分记录使用过程中出现的问题。我们先来定义个数据表student,表结构如下: 创...
代码星球 ·2021-02-19

2018年发表论文阅读:Convolutional Simplex Projection Network for Weakly Supervised Semantic Segmentation

记笔记目的:刻意地、有意地整理其思路,综合对比,以求借鉴。他山之石,可以攻玉。《ConvolutionalSimplexProjectionNetwork forWeaklySupervisedSemantic Segmentation》-20180724,一篇来自德国波恩大学与锡根大学的paper...

A brief introduction to weakly supervised learning(简要介绍弱监督学习)

by南大周志华摘要监督学习技术通过学习大量训练数据来构建预测模型,其中每个训练样本都有其对应的真值输出。尽管现有的技术已经取得了巨大的成功,但值得注意的是,由于数据标注过程的高成本,很多任务很难获得如全部真值标签这样的强监督信息。因此,能够使用弱监督的机器学习技术是可取的。本文综述了弱监督学习的一些研究进展,主要关注三...

论文笔记(7):Constrained Convolutional Neural Networks for Weakly Supervised Segmentation

UCBerkeley的DeepakPathak使用了一个具有图像级别标记的训练数据来做弱监督学习。训练数据中只给出图像中包含某种物体,但是没有其位置信息和所包含的像素信息。该文章的方法将imagetags转化为对CNN输出的label分布的限制条件,因此称为Constrainedconvolutionalneuraln...

论文笔记(6):Weakly-and Semi-Supervised Learning of a Deep Convolutional Network for Semantic Image Segmentation

这篇文章的主要贡献点在于:1.实验证明仅仅利用图像整体的弱标签很难训练出很好的分割模型;2.可以利用boundingbox来进行训练,并且得到了较好的结果,这样可以代替用pixel-level训练中的groundtruth;3.当我们用少量的pixel-levelannotations和大量的图像整体的弱标签来进行半监...

论文笔记(3):STC: A Simple to Complex Framework for Weakly-supervised Semantic Segmentation

论文题目是STC,即SimpletoComplex的一个框架,使用弱标签(imagelabel)来解决密集估计(语义分割)问题。2014年末以来,半监督的语义分割层出不穷,究其原因还是因为pixel级别的GroundTruth太难标注,因此弱监督成了人们研究的一个热门方向。作者的核心思想是提出了层层递进的三个DCNN。...
代码星球 ·2021-02-16

高性能python编程之协程(stackless)-乾颐堂

我们都知道并发(不是并行)编程目前有四种方式,多进程,多线程,异步,和协程。多进程编程在python中有类似C的os.fork,当然还有更高层封装的multiprocessing标准库,在之前写过的python高可用程序设计方法http://www.cnblogs.com/hymenz/p/3488837.html中提...

sklearn 数据预处理1: StandardScaler

作用:去均值和方差归一化。且是针对每一个特征维度来做的,而不是针对样本。【注:】并不是所有的标准化都能给estimator带来好处。“Standardizationofadatasetisacommonrequirementformanymachinelearningestimators:theymightbehave...
首页上一页12345...下一页尾页