数据结构与算法主题的文章列表，还有数据结构与算法的技术要点_第75页

数据归一化Scaler-机器学习算法

//2019.08.03下午#机器学习算法的数据归一化(featurescaling)1、数据归一化的必要性：对于机器学习算法的基础训练数据，由于数据类型的不同，其单位及其量纲也是不一样的，而也正是因为如此，有时它会使得训练集中每个样本的不同列数据大小差异较大，即数量级相差比较大，这会导致在机器学习算法中不同列数据的权...

代码星球 ·2020-06-16

机器学习算法的整体流程（非常易懂）

1、机器学习算法的整体使用步骤如下：(1)从scikitlearn库中调用相应的机器学习算法模块；(2)输入相应的算法参数定义一个新的算法；(3)输入基础训练数据集利用scaler对其进行数据归一化处理(4)对于归一化的数据集进行机器学习算法的训练fit过程；(5)输入测试数据集对其结果进行预测predict;(6)将...

代码星球 ·2020-06-16

机器学习算法中的网格搜索GridSearch实现（以k-近邻算法参数寻最优为例）

机器学习算法参数的网格搜索实现：//2019.08.031、scikitlearn库中调用网格搜索的方法为：Gridsearch，它的搜索方式比较统一简单，其对于算法批判的标准比较复杂，是一种复合交叉批判方式，不仅仅是准确率。其具体的实现方式如下(以KNN算法的三大常用超参数为例)：#使用scikitlearn中的gr...

代码星球 ·2020-06-16

k-近邻算法采用for循环调参方法

//2019.08.02下午#机器学习算法中的超参数与模型参数1、超参数：是指机器学习算法运行之前需要指定的参数，是指对于不同机器学习算法属性的决定参数。通常来说，人们所说的调参就是指调节超参数。2、模型参数：是指算法在使用过程中需要学习得到的参数，即输入与输出之间映射函数中的参数，它需要通过对于训练数据集训练之后才可...

代码星球 ·2020-06-16

scikitlearn库中调用k-近邻算法的操作步骤

1、k近邻算法可以说是唯一一个没有训练过程的机器学习算法，它含有训练基础数据集，但是是一种没有模型的算法，为了将其和其他算法进行统一，我们把它的训练数据集当做它的模型本身。2、在scikitlearn中调用KNN算法的操作步骤如下（利用实际例子举例如下）：#1导入相应的数据可视化模块importnumpyasnpimp...

代码星球 ·2020-06-16

k-近邻算法原理入门-机器学习

//2019.08.01下午机器学习算法1——k近邻算法1、k近邻算法是学习机器学习算法最为经典和简单的算法，它是机器学习算法入门最好的算法之一，可以非常好并且快速地理解机器学习的算法的框架与应用。2、kNN机器学习算法具有以下的特点：(1)思想极度简单(2)应用的数学知识非常少(3)解决相关问...

代码星球 ·2020-06-16

随机森林算法通俗易懂版本

用通俗易懂的方式剖析随机森林 0.引言随机森林是现在比较流行的一个算法。对于回归和分类问题有很好的效果，它的内在的机理到底是什么呢？接下来将会用通俗易懂的方式讲一讲随机森林。 1.什么是随机森林随机森林分解开来就是“随机”和“森林&rdqu...

代码星球 ·2020-06-16

Python汉诺塔问题递归算法与程序

汉诺塔问题：问题来源：汉诺塔来源于印度传说的一个故事，上帝创造世界时作了三根金刚石柱子，在一根柱子上从上往下从小到大顺序摞着64片黄金圆盘。上帝命令婆罗门把圆盘从下面开始按大小顺序重新摆放在另一根柱子上。并且规定，在小圆盘上不能放大圆盘，在三根柱子之间一回只能移动一个圆盘，只能移动在最顶端的圆盘。有预言说，这件事完成时...

代码星球 ·2020-06-16

Python递归算法入门

递归是一种算法，它在编程里面有着广泛的应用：1.递归必须满足哪两个基本条件？一、函数调用自身二、设置了正确的返回条件2.思考一下，按照递归的特性，在编程中有没有不得不使用递归的情况？答：例如汉诺塔，目录索引（因为你永远不知道这个目录里边是否还有目录），快速排序（二十世纪十大算法之一），树结构的定义等如果使用递归，会事半...

代码星球 ·2020-06-16

论算法的实际应用——泡妞论

http://blog.csdn.net/sm9sun/article/details/53519226我们都知道，算法即解决问题的方法，我们衡量一个算法的优劣，可以用空间复杂度与时间复杂度来衡量。换做我们实际生活中，就是物质成本开销与时间成本开销。不同算法进行泡妞这一业务进行其物质成本开销与时间成本开销自然也不同。所...

代码星球 ·2020-06-16

数据结构之网络流入门(Network Flow)简单小节

网络流的相关定义：源点：有n个点，有m条有向边，有一个点很特殊，只出不进，叫做源点。汇点：另一个点也很特殊，只进不出，叫做汇点。容量和流量：每条有向边上有两个量，容量和流量，从i到j的容量通常用c[i,j]表示,流量则通常是f[i,j].通常可以把这些边想象成道路，流量就是这条道路的车流量，容量就是道路可承受的最大的车...

代码星球 ·2020-06-15

BZOJ 2038: [2009国家集训队]小Z的袜子(hose)【莫队算法裸题&&学习笔记】

TimeLimit:20Sec MemoryLimit:259MBSubmit:9894 Solved:4561[Submit][Status][Discuss]作为一个生活散漫的人，小Z每天早上都要耗费很久从一堆五颜六色的袜子中找出一双来穿。终于有一天，小Z再也无法忍受这恼...

代码星球 ·2020-06-15

基于比较排序的算法复杂度的下界

2019-04-28 20:51:54首先，所有基于比较的排序算法，都是以决策树模型作为依据的。对于待排序的n个元素，其所有可能的排序种数为n!，其决策树高度为h（即为排序算法比较的次数）高度为h的决策树，最多有叶子节点个，所以就有由斯特林近似公式：得其中，故，的渐近下界为【补充】如果...

代码星球 ·2020-06-14

数据结构-树状数组-区间修改单点求值-1750. 区间加和求值

2020-04-03 12:35:23问题描述：已知一个数列，你需要进行下面两种操作：1.将一个区间每一个数加上x2.求出某一个数的值输入：原数组为A。为了方便，A[0]为0.实际数列从A[1]开始。操作通过4元组给出。对于每个4元组（a,b,c,d）：如果a=0要求A[b]-A[c]区间的值都增加d(修改)...

代码星球 ·2020-06-14

数据结构-堆-堆维护-130. 堆化

2020-04-01 08:15:56问题描述：给出一个整数数组，堆化操作就是把它变成一个最小堆数组。对于堆数组A，A[0]是堆的根，并对于每个A[i]，A[i*2+1]是A[i]的左儿子并且A[i*2+2]是A[i]的右儿子。样例输入:[3,2,1,4,5]输出:[1,2,3,4,5]解释:返回任何一个合法...

代码星球 ·2020-06-14