#数据结构与算法

Learning to Rank算法介绍:RankNet,LambdaRank,LambdaMart

之前的博客:http://www.cnblogs.com/bentuwuying/p/6681943.html中简单介绍了LearningtoRank的基本原理,也讲到了LearningtoRank的几类常用的方法:pointwise,pairwise,listwise。前面已经介绍了pairwise方法中的RankS...

C++ STL算法系列6---copy函数

 现在我们来看看变易算法。所谓变易算法(Mutating algorithms)就是一组能够修改容器元素数据的模板函数,可进行序列数据的复制,变换等。我们现在来看看第一个变易算法:元素复制算法copy。该算法主要用于容器之间元素的拷贝,即将迭代器区间[first,last)的元素复制到由复制目标re...

使用sklearn进行K_Means聚类算法

首先附上官网说明 [http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#examples-using-sklearn-cluster-kmeans]再附上一篇翻译文档 http://blog.csd...

机器学习sklearn19.0聚类算法——Kmeans算法

一、关于聚类及相似度、距离的知识点 二、k-means算法思想与流程三、sklearn中对于kmeans算法的参数四、代码示例以及应用的知识点简介(1)make_blobs:聚类数据生成器 sklearn.datasets.make_blobs(n_samples=100,n_features=2,...

机器学习算法

计算机程序,是指为了得到某种结果而可以由计算机(等具有信息处理能力的装置)执行的代码化指令序列(或者可以被自动转换成代码化指令序列的符号化指令序列或者符号化语句序列)。通俗讲,计算机给人干活,但它不是人,甚至不如狗懂人的需要(《小羊肖恩》里的狗是多么聪明可爱又忠诚于主人)。那怎么让它干活呢,那就需要程序员用某种编程语言...
代码星球 代码星球·2021-02-12

机器学习(二)--- 分类算法详解

感觉狼厂有些把机器学习和数据挖掘神话了,机器学习、数据挖掘的能力其实是有边界的。机器学习、数据挖掘永远是给大公司的业务锦上添花的东西,它可以帮助公司赚更多的钱,却不能帮助公司在与其他公司的竞争中取得领先优势,所以小公司招聘数据挖掘/机器学习不是为了装逼就是在自寻死路。可是相比Java和C++语言开发来说,机器学习/数据...

机器学习系列------1. GBDT算法的原理

GBDT算法是一种监督学习算法。监督学习算法需要解决如下两个问题:1.损失函数尽可能的小,这样使得目标函数能够尽可能的符合样本2.正则化函数对训练结果进行惩罚,避免过拟合,这样在预测的时候才能够准确。GBDT算法需要最终学习到损失函数尽可能小并且有效的防止过拟合。以样本随时间变化对某件事情发生的变化为例,如下几副图形象...

机器学习中的算法(1)-决策树模型组合之随机森林与GBDT

版权声明:   本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com,本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系wheeleast@gmail.com。也可以加我的微博: @leftnoteasy 前言:...

机器学习中的算法——决策树模型组合之随机森林与GBDT

前言:决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fitting,虽然有一些方法,如剪枝可以减少这种情况,但是还是不够的。美国金融银行业的大数据算法:随机森林模型+综合模型...

Java垃圾收集算法

  相关阅读:  1、深入理解java虚拟机之java内存区域  2、深入理解java虚拟机之对象真的死了吗   标记清除算法分为“标记”和“清除”两个阶段,首先先标记出那些对象需要被回收,在标记完成后会对这些被标记了的对象进行回收;如下图:  这种算法的优点在于不需要对对象进行移动操作,仅对不存活的对象进行...
代码星球 代码星球·2021-02-12

java经典算法题50道

原文JAVA经典算法50题【程序1】  题目:古典问题:有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月后每个月又生一对兔子,假如兔子都不死,问每个月的兔子总数为多少?1.程序分析:兔子的规律为数列1,1,2,3,5,8,13,21....具体分析如下:f(1)=1(第1个月有一...
代码星球 代码星球·2021-02-12

使用位图算法来优化签到历史存储空间占用

实际开发中有这样的场景,用户每日签到,可获取相对应的积分赠送,如果连续签到,则可获得额外的积分赠送。本文主要讲解使用位图算法来优化签到历史记录的空间占用。当然如果业务中仅仅是获取连续签到的最大天数,使用一个计数器即可记录。 需求:1.记录一年的签到历史2.获取某月的签到历史3.获取过去几天连续签到的最大天数&...

ZooKeeper是以Fast Paxos算法为基础的

ZooKeeper是以FastPaxos算法为基础的,Paxos算法存在活锁的问题,即当有多个proposer交错提交时,有可能互相排斥导致没有一个proposer能提交成功,而FastPaxos作了一些优化,通过选举产生一个leader(领导者),只有leader才能提交proposer,具体算法可见FastPaxo...

Ribbon,主要提供客户侧的软件负载均衡算法。

Ribbon,主要提供客户侧的软件负载均衡算法。Ribbon客户端组件提供一系列完善的配置选项,比如连接超时、重试、重试算法等。Ribbon内置可插拔、可定制的负载均衡组件。下面是用到的一些负载均衡策略:简单轮询负载均衡加权响应时间负载均衡区域感知轮询负载均衡随机负载均衡Ribbon中还包括以下功能:易于与服务发现组件...

Java 数据结构

Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类:枚举(Enumeration)位集合(BitSet)向量(Vector)栈(Stack)字典(Dictionary)哈希表(Hashtable)属性(Properties)以上这些类是传统遗留的,在Java2中引入了一种新的框架-集合框...
代码星球 代码星球·2021-02-11
首页上一页...1415161718...下一页尾页