51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#规模
Flashtext:大规模数据清洗的利器
在这篇文章中,我们将介绍一种新的关键字搜索和替换的算法:Flashtext算法。Flashtext算法是一个高效的字符搜索和替换算法。该算法的时间复杂度不依赖于搜索或替换的字符的数量。比如,对于一个文档有N个字符,和一个有M个词的关键词库,那么时间复杂度就是 O(N) 。这个算法比我们一...
IT猿
·
2020-03-27
Flashtext
大规模
数据
清洗
利器
如何利用Flink实现超大规模用户行为分析
各位晚上好,首先感谢大家参与我的这次主题分享,同时也感谢InfoQAI前线组织这次瀚思科技主题月!瀚思科技成立于2014年,按行业划分我们是一家安全公司。但和大家熟知的卖杀毒软件或者防火墙的传统安全公司不同。瀚思科技帮助各种中大型企业搭建安全大数据的分析平台,平台上应用的安全分析策略深度结合了多...
IT猿
·
2020-03-27
如何
利用
Flink
实现
超大规模
OpenStack大规模部署详解
https://blog.csdn.net/karamos/article/details/801304430.前言今年的2月22日,OpenStack发布了15个版本Ocata。走过了7年的发展岁月的OpenStack已经成为了云计算领域中最火热的项目之一,并逐渐成为IaaS的事实标准,私有云项目的部署首选。Open...
IT猿
·
2020-03-27
OpenStack
大规模
部署
详解
首页
上一页
1
2
3
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他