#Python数据可视化编程实战

tar命令--数据解档(三)解压.tar.gz文件报错 gzip:stdin:not in gzip format

  毕竟是生产。。。。。提示以下信息:   gzip:stdin:notingzipformat   tar:Childreturnedstatus1   tar:Errorisnotrecoverable:exitingnow原因是:这个压缩包没有用gzip格式压缩,...

python中else与finally的总结

   对try...except的补充:else子句的使用比在子句中添加其他代码更好,try因为它避免了意外捕获由try... except语句保护的代码未引发的异常。forarginsys.argv[1:]:try:f=open(arg,'r')exceptOSError:pr...
代码星球 ·2021-02-22

从json到python解析python,从bson到monogdb

JSON是JavaScriptObjectNotation的缩写,中文译为JavaScript对象表示法。用来作为数据交换的文本格式,作用类似于XML,而2001年DouglasCrockford提出的目的就是为了取代XML,它不是一种编程语言,仅用来描述数据结构。它只是一个字符串,它只是一个有规则的字符串,或者说带有...

设置pycharm环境下python内存

有的时候在pycharm下的python需要加载很大的内存,那我们如何去修改pycharm的环境的内存呢??    第一个栈内存,第二是堆内存。...

pandas中DataFrame和Series的数据去重

在SQL语言中去重是一件相当简单的事情,面对一个表(也可以称之为DataFrame)我们对数据进行去重只需要GROUPBY就好。selectcustId,applyNofromtmp.online_service_startloangroupbycustId,applyNo 但是对于pandas的DataFr...

用Python调用Shell命令

Python经常被称作“胶水语言”,因为它能够轻易地操作其他程序,轻易地包装使用其他语言编写的库,也当然可以用Python调用Shell命令。用Python调用Shell命令有如下几种方式:os.system("Thecommandyouwant").  这个调用相当直接,且是同步进行的,程序需要阻...
代码星球 ·2021-02-22

mysql的数据库存放的路径以及安装路径

1.查看数据库的存放路径 进入mysql终端mysql>showvariableslike'%datadir%'; 2.查看文件安装路径[root@hadoop01etc]#whereismysqlmysql:/usr/bin/mysql/usr/lib64/mysql/usr/share/m...

spark 三种数据集的关系(二)

一个Dataset是一个分布式的数据集,而且它是一个新的接口,这个新的接口是在Spark1.6版本里面才被添加进来的,所以要注意DataFrame是先出来的,然后在1.6版本才出现的Dataset,提供了哪些优点呢?比如强类型,支持lambda表达式,还有还提供了sparksql执行引擎的一些优化,DataFrame里...
代码星球 ·2021-02-22

dataframe转化(一)之python中的apply(),applymap(),map() 的用法和区别

 平时在处理dfseries格式的时候并没有注意map和apply的差异  总感觉没啥却别。不过还是有区别的。下面总结一下: importpandasaspddf1=pd.DataFrame({"sales1":[-1,2,3],"sales2":[3,-5,7],}) ...

python面试题--连续出现最大次数

确实有段时间没怎么写python,手写还不上机是真的难受。而且break跳出循环最内一层的事情都要想一下才能写得出来。题目如下:寻找一个字符串最大连续出现次数,并放入字典中,s="aaccccababbbb"{'a':2,'b':4,'c':4}代码如下s="aaccccvbbbbbbbbbdddddddddeeede...

python的序列化模块

最近机器学习的模型需要序列化和反序列化,因为写个博客总结一下几个模型和数据等序列化的模块。...
代码星球 ·2021-02-22

python中sys.argv[]用法

 sys.argv[]的作用:     在运行python文件的时候往文件里面传递参数.     从函数外部获取到变量值 importsysarg=sys.argv[0]args=sys.argv[:...
代码星球 ·2021-02-22

Newsgroups数据集研究

1.数据集介绍20newsgroups数据集是用于文本分类、文本挖据和信息检索研究的国际标准数据集之一。数据集收集了大约20,000左右的新闻组文档,均匀分为20个不同主题的新闻组集合。一些新闻组的主题特别相似(e.g. comp.sys.ibm.pc.hardware/comp.sys.mac.hardwa...
代码星球 ·2021-02-22
首页上一页...5455565758...下一页尾页