#数据结构与算法

关键词提取算法TF-IDF与TextRank

 一、前言  随着互联网的发展,数据的海量增长使得文本信息的分析与处理需求日益突显,而文本处理工作中关键词提取是基础工作之一。  TF-IDF与TextRank是经典的关键词提取算法,需要掌握。  二、TF-IDF2.1、TF-IDF通用介绍    TF-IDF,全称是TermFreque...

数据结构【顺序表】

 目录1、线性表定义2、线性表基本操作3、线性表的顺序存储及运算—顺序表4、顺序表的实现(C语言) 线性表是一种线性结构。线性结构的特点是数据元素之间是一种线性关系,数据元素“一个接一个的排列”。在一个线性表中数据元素的类型是相同的,或者说线性表是由同一类型的数据...
代码星球 ·2020-04-29

simhash算法:海量千万级的数据去重

简单易懂讲解simhash算法hash哈希:https://blog.csdn.net/le_le_name/article/details/51615931simhash算法及原理简介:https://blog.csdn.net/lengye7/article/details/79789206使用SimHash进行海...

数据结构【基础知识点总结】

  数据(Data)是信息的载体,它能够被计算机识别、存储和加工处理。它是计算机程序加工的原料,应用程序处理各种各样的数据。计算机科学中,所谓数据就是计算机加工处理的对象,它可以是数值数据,也可以是非数值数据。数值数据是一些整数、实数或复数,主要用于工程计算、科学计算和商务处理等;非数值数据包括字符...

Redis数据结构&命令手册

     Redis可以存储键与5种不同数据结构之间的映射,这五种数据结构类型分别为STRING(字符串)、LIST(列表)、SET(集合)、HASH(散列)、ZSET(有序集合)。    1.setsetkeyvalue[ex秒数]/[px毫秒数][nx]/[xx]作...

H264视频压缩算法

H264视频压缩算法现在无疑是所有视频压缩技术中使用最广泛,最流行的。随着x264/openh264以及ffmpeg等开源库的推出,大多数使用者无需再对H264的细节做过多的研究,这大降低了人们使用H264的成本。但为了用好H264,我们还是要对H264的基本原理弄清楚才行。今天我们就来看看H264的基本原理。H264...
代码星球 ·2020-04-22

两个矩阵相乘算法

两个矩阵相乘算法本来是处理两个矩阵的连乘求如何加括号使得中间的运算次数最少的问题,但是突然想到实现一下如何求连个矩阵连乘的算法,就实现了一下,挺简单的:注意程序围绕的思想:1.两个矩阵相乘,前一个矩阵的列等于一个矩阵的行2.拿前一个矩阵的每一行,依次的乘以后一个矩阵的每一列[cpp]viewplaincopy ...
代码星球 ·2020-04-22

决策树算法原理(上)

    决策树算法在机器学习中算是很经典的一个算法系列了。它既可以作为分类算法,也可以作为回归算法,同时也特别适合集成学习比如随机森林。本文就对决策树算法原理做一个总结,上篇对ID3,C4.5的算法思想做了总结,下篇重点对CART算法做一个详细的介绍。选择CART做重点介绍的原因是scikit-learn使用了优化版的...
代码星球 ·2020-04-22

什么是旅行商问题——算法NP、P、NPC知识

  学习程序员小灰——《什么是旅行商问题》笔记:旅行商问题  旅行商问题所描述的是这样一个场景:    有一个商品推销员,要去若干个城市推销商品。该推销员从一个城市出发,需要经过所有城市后,回到出发地。每个城市之间都有道路连通,且距离各不相同,推销员应该如何选择路线,使得总行程最短呢?    这...

什么是算法?——算法轻松入门

什么是算法?算法是利用计算机解决问题的处理步骤,简而言之,算法就是解决问题的步骤。算法不仅仅用于计算机的数据处理,现实世界中的各种问题也需要结合算法的概念来解决,其中,具有代表性的就是烹饪中用到的食谱,食谱是各种美味料理的制作方法,需要用一定的步骤表示出来。算法是古老智慧的结晶,是程序的范本,学习算法才能编写出高质量的...
代码星球 ·2020-04-22

对数及运算法则

  因为:y=ax  所以:x=logay  【定义】如果N=ax(a>0,a≠1),即a的x次方等于N(a>0,且a≠1),那么数x叫做以a为底N的对数(logarithm),记作:   x=logaN  其中,a叫做对数的底数,N叫做真数,x叫做“以a为底N的对数&rd...
代码星球 ·2020-04-22

Hash算法的讲解

散列表,又叫哈希表,它是基于快速存取的角度设计的,也是一种典型的“空间换时间”的做法。顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是紧密排列的,而是可能存在空隙。     散列表(Hashtable,也叫哈希表),是根据关键码值(K...
代码星球 ·2020-04-22

十大经典排序算法

前言说明十大排序算法可以说是每个程序员都必须得掌握的了,花了一天的时间把代码实现且整理了一下,为了方便大家学习,我把它整理成一篇文章,每种算法会有简单的算法思想描述,为了方便大家理解,我还找来了动图演示;这还不够,我还附上了对应的优质文章,看完不懂你来砍我,如果不想砍我就给我来个好看。术语解释有些人可能不知道什么是稳定...
代码星球 ·2020-04-22

路径规划: PRM 路径规划算法 (Probabilistic Roadmaps 随机路标图)

随机路标图-ProbabilisticRoadmaps(路径规划算法)路径规划作为机器人完成各种任务的基础,一直是研究的热点。研究人员提出了许多规划方法如:1.A*2.Djstar3.D*4.随机路标图(PRM)法5.人工势场法6.单元分解法7.快速搜索树(RRT)法等  传统的人工势场、单元分解法需要对空间中的障碍物...

信息摘要算法之四:SHA512算法分析与实现

前面一篇中我们分析了SHA256的原理,并且实现了该算法,在这一篇中我们将进一步分析SHA512并实现之。1、SHA简述尽管在前面的篇章中我们介绍过SHA算法,但出于阐述的完整性我依然要简单的说明一下SHA算法。SHA主要有SHA-1、SHA-224、SHA-256、SHA-384以及SHA-512。各种SHA算法的数...
首页上一页...8788899091...下一页尾页