51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#各占
面试- 阿里-. 大数据题目- 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?
假如每个url大小为10bytes,那么可以估计每个文件的大小为50G×64=320G,远远大于内存限制的4G,所以不可能将其完全加载到内存中处理,可以采用分治的思想来解决。 Step1:遍历文件a,对每个url求取hash(url)%1000,然后根据所取得的值将url分别存储到1000个小文件(记为a0,a1,....
代码星球
·
2021-01-15
url
文件
面试
阿里
数据
java中 int、char、long各占多少字节数
所谓的占用字节数就是申请内存的时候所占的空间大小byte 1字节 最小值是-128(-2^7); 最大值是127(2^7-1);boolean 至少...
代码星球
·
2020-11-01
java
int
char
long
各占
在CC++中char 、short 、int各占多少个字节
在CC++中char、short、int各占多少个字节:#include<bits/stdc++.h>usingnamespacestd;intmain(){cout<<sizeof(char)<<endl;cout<<sizeof(short)<<endl;...
代码星球
·
2020-06-08
CC++
char
short
int
各占
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他