#MHA

美团点评MySQL数据库高可用架构从MMM到MHA+Zebra以及MHA+Proxy的演进

本文介绍最近几年美团点评MySQL数据库高可用架构的演进过程,以及我们在开源技术基础上做的一些创新。同时,也和业界其它方案进行综合对比,了解业界在高可用方面的进展,和未来我们的一些规划和展望。在2015年之前,美团点评(点评侧)长期使用MMM(Master-MasterreplicationmanagerforMySQ...

simhash算法

1.SimHash与传统hash函数的区别  传统的Hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上仅相当于伪随机数产生算法。传统的hash算法产生的两个签名,如果原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节,所产生的签名也很可能...
代码星球 代码星球·2020-12-17

文件类似性推断 -- SimHash

近期调研了一下simhash算法,它主要用在谷歌网页去重中。网上有非常多原理性的介绍。既然能够用来推断文件的相似性,就想知道效果怎么样。simhash的准确度是否依赖于分词算法?是否和simhash的长度有关?在数据去重过程中,都是先对文件进行分块。而后得到关于这个文件的全部指纹(SHA-1 d...
代码星球 代码星球·2020-08-25

c#-SimHash匹配相似-算法

使用场景:Google的simhash算法//通过大量测试,simhash用于比较大文本,比如500字以上效果都还蛮好,距离小于3的基本都是相似,误判率也比较低。//从我的经验,如果我们假定N是每个块的大小,M是重叠的字符的数目,N=4和M=3是最好的选择  publicclassSimHashAnalyser:IAn...

MySQL高可用架构之MHA

MHA(Master HighAvailability)目前在MySQL高可用方面是一个相对成熟的解决方案,它由日本DeNA公司youshimaton(现就职于Facebook公司)开发,是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中,MHA能做到在0~30...

hp 使用curl模拟登录discuz以及模拟发帖(含formhash的实现)

php的curl真的是相当好用,网上一搜索相关文章都是关于curl模拟登陆的,很少人提供模拟discuz发贴的源码。本着共享的原则,我把自己测试成功的发帖代码贴出来。不足的地方,希望大家指正。<?php$discuz_url = 'http://127.0.0.1/discuz/';//论坛地...

simhash算法:海量千万级的数据去重

简单易懂讲解simhash算法hash哈希:https://blog.csdn.net/le_le_name/article/details/51615931simhash算法及原理简介:https://blog.csdn.net/lengye7/article/details/79789206使用SimHash进行海...

【PHP】(原创)之表单FORM的formhash校验,以TP3.2示例

1、目的:每次表单POST提交(ajax的POST也适用)过来数据,都必须校验formhash参数是否和服务器端的一致,不一致说明重复提交或者跨站攻击提交csrf2、原理:参照了KPPW的formhash生成和校验示例。将formhash的生成写入基类构造函数,每次登陆用户操作数据,都生成hash并进行比较。(用户未登...

MySQL高可用系列之MHA(二)

MHA提供了一系列配置參数。深入理解每一个參数的详细含义,对优化配置、合理使用MHA非常重要。非常多高可用性也都是通过合理配置一些參数而实现的。MHA包含例如以下配置參数,分别说明例如以下:hostname/ip/port(LocalOnly)hostname为MySQLServer的IP地址或主机名;ip为MySQL...

MySQL高可用方案MHA自动Failover与手动Failover的实践及原理

集群信息角色              IP地址        ServerID &nbs...

MySQL高可用方案MHA在线切换的步骤及原理

在日常工作中,会碰到如下的场景,如mysql数据库升级,主服务器硬件升级等,这个时候就需要将写操作切换到另外一台服务器上,那么如何进行在线切换呢?同时,要求切换过程短,对业务的影响比较小。MHA就提供了这样一种优雅的方式,只会堵塞业务0.5~2s的时间,在这段时间内,业务无法读取和写入。 集群信息角色&nbs...