KL主题的文章列表，还有KL的技术要点_第5页

BulkLoad加载本地文件到HBase表

将本地数据导入到HBase中BulkLoad会将tsv/csv格式的文件编程hfile文件，然后再进行数据的导入，这样可以避免大量数据导入时造成的集群写入压力过大。1、tsv格式的文件：字段之间以制表符分割2、csv格式的文件：字段之间以逗号,分割减小HBase集群插入数据的压力提高了Job运行的速度，降低了Job执行...

代码星球 ·2020-12-15

sklearn的estimator

在sklearn中，估计器(estimator)是一个重要的角色，分类器和回归器都属于estimator。在估计器中有有两个重要的方法是fit和transform。fit方法用于从训练集中学习模型参数transform用学习到的参数转换数据 ...

代码星球 ·2020-11-27

Sklearn数据集与机器学习

《统计机器学习》中指出：机器学习=模型+策略+算法。其实机器学习可以表示为：Learning=Representation+Evalution+Optimization。我们就可以将这样的表示和李航老师的说法对应起来。机器学习主要是由三部分组成，即：表示(模型)、评价(策略)和优化(算法)。表示(或者称为：模型)：Re...

代码星球 ·2020-11-27

Sklearn与特征工程

“数据决定了机器学习的上限，而算法只是尽可能逼近这个上限”，这句话很好的阐述了数据在机器学习中的重要性。大部分直接拿过来的数据都是特征不明显的、没有经过处理的或者说是存在很多无用的数据，那么需要进行一些特征处理，特征的缩放等等，满足训练数据的要求。我们将初次接触到Scikit-learn这个机器学习库的使用Scikit...

代码星球 ·2020-11-27

弱占优策略--Weakly Dominant Strategy

WeaklyDominantStrategyEquilibrium（均衡）。先说弱占优。一个策略弱占优就是说，无论其他人采取什么样的策略，这个策略的回报都大于等于其他策略的回报。如果所有人都使用他们的弱占优策略，那么这就是一个弱占优策略均衡严格占优策略就是，无论其他人采取什么策略，这个策略的回报都严格大于其他策略。严占...

代码星球 ·2020-11-25

hdu2660 Accepted Necklace (DFS)

ProblemDescriptionIhaveNpreciousstones,andplantouseKofthemtomakeanecklaceformymother,butshewon'tacceptanecklacewhichistooheavy.Giventhevalueandtheweightofeachpr...

代码星球 ·2020-10-21

Redmine backlogs 升级

刚装完1.0.3两天，1.0.4发布了，乘项目还没有开始，赶快升级。升级过程1.设置环境变量： RAILS_ENV=productionexportRAILS_ENV 2.获取最新代码： cdredmine-2.3/plugins/redmine_backlogs g...

代码星球 ·2020-10-21

python打开.pkl的文件并显示里面的内容

pkl文件是pyhthon里面保存文件的一种格式，如果直接打开会显示一堆序列化的东西。正确的打开方式如下：importcPickleaspicklef=open('path')info=pickle.load(f)printinfo#showfile ...

代码星球 ·2020-10-13

交叉熵cross entropy和相对熵（kl散度）

交叉熵可在神经网络(机器学习)中作为损失函数，p表示真实标记的分布，q则为训练后的模型的预测标记分布，交叉熵损失函数可以衡量真实分布p与当前训练得到的概率分布q有多么大的差异。相对熵（relativeentropy）就是KL散度（Kullback–Leiblerdivergence），用于衡量两个概率分布之间的差异。对...

代码星球 ·2020-10-12

tekla是什么软件

Tekla是芬兰Tekla公司开发的钢结构bai详图设计软件，它是通du过先创建三zhi维模型以后自dao动生成钢结构详图和各种报表来达到方便视图的功能。由于图纸与报表均以模型为准，而在三维模型中操纵者很容易发现构件之间连接有无错误，所以它保证了钢结构详图深化设计中构件之间的正确性。同时Xsteel自动生成的各种报表和...

开发笔记 ·2020-10-09

Sklearn学习笔记

主要记python工具包sklearn的学习内容：链接点击这里。一、Regression& Classification　　1.1.GeneralizedLinearModels　　1.2.LinearandQuadraticDiscriminantAnalysis　　1.3.Kernelridger...

代码星球 ·2020-10-09

非负矩阵分解（1）：准则函数及KL散度

作者：桂。时间：2017-04-06 12:29:26链接：http://www.cnblogs.com/xingshansi/p/6672908.html 声明：欢迎被转载，不过记得注明出处哦~ 前言之前在梳理最小二乘的时候，矩阵方程有一类可以利用非负矩阵分解（Non-negativem...

代码星球 ·2020-10-09

Python机器学习（三十三）Sklearn 速查

Scikit-learn是一个开源Python库，它使用统一的接口实现了一系列机器学习、预处理、交叉验证和可视化算法。fromsklearnimportneighbors,datasets,preprocessingfromsklearn.model_selectionimporttrain_test_splitfro...

代码星球 ·2020-09-20

Python机器学习（三十二）Sklearn 支持向量机

前面章节尝试了K均值聚类模型，准确率并不高。接下来我们尝试一种新方法：支持向量机(SVM)。支持向量机支持向量机(supportvectormachine/SVM)，通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，其学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解。本系列教...

代码星球 ·2020-09-20

Python机器学习（三十一）Sklearn K均值聚类

到目前为止，我们已经非常深入地了解了数据集，并且把它分成了训练子集与测试子集。接下来，我们将使用聚类方法训练一个模型，然后使用该模型来预测测试子集的标签，最后评估该模型的性能。聚类(clustering)是在一组未标记的数据中，将相似的数据（点）归到同一个类别中的方法。聚类与分类的最大不同在于分类的目标事先已知，而聚类...

代码星球 ·2020-09-20