51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#Python数据可视化编程实战
tar命令--数据解档(三)解压.tar.gz文件报错 gzip:stdin:not in gzip format
毕竟是生产。。。。。提示以下信息: gzip:stdin:notingzipformat tar:Childreturnedstatus1 tar:Errorisnotrecoverable:exitingnow原因是:这个压缩包没有用gzip格式压缩,...
代码星球
·
2021-02-22
gzip
tar
命令
数据
解档
python中else与finally的总结
对try...except的补充:else子句的使用比在子句中添加其他代码更好,try因为它避免了意外捕获由try... except语句保护的代码未引发的异常。forarginsys.argv[1:]:try:f=open(arg,'r')exceptOSError:pr...
代码星球
·
2021-02-22
python
else
finally
总结
从json到python解析python,从bson到monogdb
JSON是JavaScriptObjectNotation的缩写,中文译为JavaScript对象表示法。用来作为数据交换的文本格式,作用类似于XML,而2001年DouglasCrockford提出的目的就是为了取代XML,它不是一种编程语言,仅用来描述数据结构。它只是一个字符串,它只是一个有规则的字符串,或者说带有...
代码星球
·
2021-02-22
python
json
解析
bson
monogdb
设置pycharm环境下python内存
有的时候在pycharm下的python需要加载很大的内存,那我们如何去修改pycharm的环境的内存呢?? 第一个栈内存,第二是堆内存。...
代码星球
·
2021-02-22
设置
pycharm
环境
python
内存
pandas中DataFrame和Series的数据去重
在SQL语言中去重是一件相当简单的事情,面对一个表(也可以称之为DataFrame)我们对数据进行去重只需要GROUPBY就好。selectcustId,applyNofromtmp.online_service_startloangroupbycustId,applyNo 但是对于pandas的DataFr...
代码星球
·
2021-02-22
pandas
DataFrame
Series
数据
去重
用Python调用Shell命令
Python经常被称作“胶水语言”,因为它能够轻易地操作其他程序,轻易地包装使用其他语言编写的库,也当然可以用Python调用Shell命令。用Python调用Shell命令有如下几种方式:os.system("Thecommandyouwant"). 这个调用相当直接,且是同步进行的,程序需要阻...
代码星球
·
2021-02-22
Python
调用
Shell
命令
mysql的数据库存放的路径以及安装路径
1.查看数据库的存放路径 进入mysql终端mysql>showvariableslike'%datadir%'; 2.查看文件安装路径[root@hadoop01etc]#whereismysqlmysql:/usr/bin/mysql/usr/lib64/mysql/usr/share/m...
代码星球
·
2021-02-22
路径
mysql
数据库
存放
以及
spark 三种数据集的关系(二)
一个Dataset是一个分布式的数据集,而且它是一个新的接口,这个新的接口是在Spark1.6版本里面才被添加进来的,所以要注意DataFrame是先出来的,然后在1.6版本才出现的Dataset,提供了哪些优点呢?比如强类型,支持lambda表达式,还有还提供了sparksql执行引擎的一些优化,DataFrame里...
代码星球
·
2021-02-22
spark
三种
数据
关系
dataframe转化(一)之python中的apply(),applymap(),map() 的用法和区别
平时在处理dfseries格式的时候并没有注意map和apply的差异 总感觉没啥却别。不过还是有区别的。下面总结一下: importpandasaspddf1=pd.DataFrame({"sales1":[-1,2,3],"sales2":[3,-5,7],}) ...
代码星球
·
2021-02-22
dataframe
转化
python
中的
apply
python面试题--连续出现最大次数
确实有段时间没怎么写python,手写还不上机是真的难受。而且break跳出循环最内一层的事情都要想一下才能写得出来。题目如下:寻找一个字符串最大连续出现次数,并放入字典中,s="aaccccababbbb"{'a':2,'b':4,'c':4}代码如下s="aaccccvbbbbbbbbbdddddddddeeede...
代码星球
·
2021-02-22
python
试题
连续
出现
最大
python的序列化模块
最近机器学习的模型需要序列化和反序列化,因为写个博客总结一下几个模型和数据等序列化的模块。...
代码星球
·
2021-02-22
python
序列化
模块
python中sys.argv[]用法
sys.argv[]的作用: 在运行python文件的时候往文件里面传递参数. 从函数外部获取到变量值 importsysarg=sys.argv[0]args=sys.argv[:...
代码星球
·
2021-02-22
python
sys.argv
用法
hive判断数据一个表是否在另一个表中(二)
...
代码星球
·
2021-02-22
hive
判断
数据
一个
是否
图数据库-ne04j入门
1...
代码星球
·
2021-02-22
数据库
-ne04j
入门
Newsgroups数据集研究
1.数据集介绍20newsgroups数据集是用于文本分类、文本挖据和信息检索研究的国际标准数据集之一。数据集收集了大约20,000左右的新闻组文档,均匀分为20个不同主题的新闻组集合。一些新闻组的主题特别相似(e.g. comp.sys.ibm.pc.hardware/comp.sys.mac.hardwa...
代码星球
·
2021-02-22
Newsgroups
数据
研究
首页
上一页
...
54
55
56
57
58
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他