#STI

Boosting算法(一)

本章全部来自于李航的《统计学》以及他的博客和自己试验。仅供个人复习使用。Boosting算法通过改变训练样本的权重,学习多个分类器,并将这些分类器进行线性组合,提高分类性能。我们以AdaBoost为例。  它的自适应在于:前一个弱分类器分错的样本的权值(样本对应的权值)会得到加强,权值更新后的样本再...
代码星球 ·2021-02-20

hive中groupby和distinct区别以及性能比较

Hive去重统计先说核心:都会在map阶段count,但reduce阶段,distinct只有一个,groupby可以有多个进行并行聚合,所以groupby会快。 经常在公司还能看到。很多老人用distinct去重,很容易数据量大的时候的数据倾斜。感谢上次冲哥的指正。相信使用Hive的人平时会经常用到去重统计...

elasticsearch性能因素总结

 在预算充足的情况下。特别是一些高并发业务的搜索。硬件层面占用整个elasticsearch性能空间很大比例。1)内存:单实例的情况下,尽量分配32G,排序和统计都是以及内存计算的。2)硬盘:在条件允许下,尽量使用一些高性能io的硬盘,SSD3)CPU:在高并发的情况下,cpu的计算能力要求就很高了。cpu配...

Elasticsearch学习

Elasticsearch研究有一段时间了,现特将Elasticsearch相关核心知识、原理从初学者认知、学习的角度,从以下9个方面进行详细梳理。欢迎讨论……如:当系统数据量上了10亿、100亿条的时候,我们在做系统架构的时候通常会从以下角度去考虑问题: 1)用什么数据库好?(mysql、sybase、or...
代码星球 ·2021-02-19

elasticsearch开机自启

linux下开机自启:在/etc/init.d目录下新建文件elasticsearch并敲入shell脚本:#!/bin/sh#chkconfig:23458005#description:elasticsearchexportJAVA_HOME=/home/app/java/jdk1.8.0_201exportJAV...
代码星球 ·2021-02-18

elasticsearch简单实现

初次接触分布式是全文搜索引擎,之前都是spinx+coreseek,先简单实现初步了解先官方文档:https://www.elastic.co/guide/cn/elasticsearch/guide/current/logging.html一.基础概念:集群和节点:一个集群是由多个节点组成。每一个集群都有一个唯一的名...
代码星球 ·2021-02-18

[置顶] 【实战Elastic-Job】--详解当当网分布式作业框架

作业即定时任务.无需做复杂的控制,在指定的时间执行指定的任务.    时间驱动/事件驱动:内部系统一般可以通过事件来驱动,但涉及到外部系统,则只能使用时间驱动.如:抓取外部系统价格.每小时抓取,由于是外部系统,不能像内部系统一样发送事件触发事件.批量处理/逐条处理:批量处理堆积的...

论文笔记(8):BING: Binarized Normed Gradients for Objectness Estimation at 300fps

译文:《基于二值化赋范梯度特征的一般对象估计》摘要:通过训练通用的对象估计方法来产生一组候选对象窗口,能够加速传统的滑动窗口对象检测方法。我们观察到一般对象都会有定义完好的封闭轮廓,而且通过将相关图像窗口重置为固定大小,就可以通过梯度幅值进行区分。基于以上的观察以及复杂度的考虑,为了明确训练方法,我们将窗口固定为8*8...

The run destination "设备名称" is not valid for Running the scheme '项目名称'.

之前运行好好的,怎么会突然出现这个呢?开始百度发现都解决不了。 最后发现,这是XCode的一个bug。遇到这种情况只要Command+Q,退去XCode,然后再重新登入即可。...

ElasticSearch客户端注解使用介绍

Thebestelasticsearchhighleveljavarestapi-----bboss @ESId 用于标识实体对象中作为docid的属性,该注解只有一个persistent布尔值属性,用于控制被本注解标注的字段属性是否作为普通文档属性保存,默认为true-保存,false不保存,字段...

Elasticsearch 入门教程

全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称Elastic)是目前全文搜索引擎的首选。它可以快速地储存、搜索和分析海量数据。维基百科、StackOverflow、Github都采用它。Elastic的底层是开源库 Lucene。但是,你没法直接用Lucene,必...
代码星球 ·2021-02-16

LINQ标准查询操作符(三)——Aggregate、Average、Distinct、Except、Intersect、Union、Empty、DefaultIfEmpty、Range、Repeat

聚合函数将在序列上执行特定的计算,并返回单个值,如计算给定序列平均值、最大值等。共有7种LINQ聚合查询操作符:Aggregate、Average、Count、LongCount、Max、Min和Sum。Aggregate操作符对集合值执行自定义聚合运算。例如,需要列出所有产品类别清单,每个类别名称之间用顿号连接。以下...

使用windows server2012时FileZilla客户端连接时报150 Opening data channel for directory listing of "/" 响应:425 Can't open data connection

425Can'topendataconnection和读取目录列表失败问题解决这个问题主要是由于使用PassiveMode模式造成的,解决这个问题很简单:1、在ftp服务软件中设置指定端口地址范围,允许PassiveMode使用,比如60000-600202、然后在ftp服务器的系统防火墙上打开这些tcp端口,比如是6...

SQL DISTINCT 用法(去重)

现在以下数据查有出现的TeacherId 1SELECTTeacherIDFROMStudentViewCode结果有重复的ID出现确实查法:1SELECTTeacherIDFROMStudent2GROUPBYTeacherIDViewCode1SELECTDISTINCTTeacherIDFROMStud...
代码星球 ·2021-02-15

Springboot整合Elastic-Job(二)

上文我们讲到Springboot整合Elastic-Job整合的demo,只是简单的实现了主要功能。本文在上文基础上,进行新的调整。 Elastic-Job提供了事件追踪功能,可通过事件订阅的方式处理调度过程的重要事件,用于查询、统计和监控。Elastic-Job目前提供了基于关系型数据库两种事件订阅方式记录...
代码星球 ·2021-02-15
首页上一页...1617181920...下一页尾页