51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#pandas
数据分析工具pandas简介
Pandas的名称来自于面板数据(paneldata)和Python数据分析(dataanalysis)。Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了 高级数据结构 和 数据操作工具,它是使Python成为强大而高效的数据分析环境的重要因素之一。一个强大的分析...
代码星球
·
2020-12-10
数据分析
工具
pandas
简介
pandas层级索引
下面创建一个Series,在输入索引Index时,输入了由两个子list组成的list,第一个子list是外层索引,第二个list是内层索引。示例代码:importpandasaspdimportnumpyasnpser_obj=pd.Series(np.random.randn(12),index=[['a','a'...
代码星球
·
2020-12-10
pandas
层级
索引
安装python的第三方库 geopandas
直接下载,geopandas的whl文件,如geopandas-0.6.3-py2.py3-none-any.whl,将会安装不成功。在安装它的依赖库Fiona的时候,提示缺少gdal的配置(GDLA_CONFIG,GDAL_VERSION环境变量)。而在安装python版本的gdal的时候,pypi上是源码包,安装...
代码星球
·
2020-11-05
安装
python
第三方
geopandas
10个高效的pandas技巧
Pandas是一个广泛应用于数据分析等领域的Python库。关于它的教程有很多,但这里会一些比较冷门但是非常有用的技巧。read_csv这是一个大家都应该知道的函数,因为它就是读取csv文件的方法。但如果需要读取数据量很大的时候,可以添加一个参数--nrows=5,来先加载少量数据,这可以避免使用错误的分隔符,因为并不...
开发笔记
·
2020-10-29
10个
高效
pandas
技巧
Python爬虫小白入门(十四)Python 爬虫 – 提取数据到Pandas DataFrame
Pandas是一个开放源码、BSD许可的库,为Python编程语言提供高性能、易于使用的数据结构和数据分析工具。把抓取到的数据存储到PandasDataFrame中,可以进一步对数据进行分析,是一种常见做法。本章例子,将从豆瓣网站上抓取北美电影排行榜,并放进DataFrame中。豆瓣网站上的北美电影排行榜网址,北美电影...
代码星球
·
2020-09-19
Python
爬虫
小白
入门
十四
Python机器学习(九十七)Pandas 绘图
Pandas的另一个优点是与Matplotlib的集成,可以直接绘制DataFrame和Series。注意:如没有安装Matplotlib,需首先安装:pipinstallmatplotlib。importmatplotlib.pyplotaspltplt.rcParams.update({'font.size':20...
代码星球
·
2020-09-19
Python
机器
学习
九十七
Pandas
Python机器学习(九十六)Pandas apply函数
与Python中的列表类似,可以使用for循环遍历DataFrame或Series,但是这样做(尤其是在大型数据集上)非常慢。Pandas中提供了一个高效的替代方案:apply()方法。语法DataFrame.apply(func)Series.apply(func)func –要对数据集中所有元...
代码星球
·
2020-09-19
Python
机器
学习
九十六
Pandas
Python机器学习(九十五)Pandas 有条件访问
有时需要根据条件,访问DataFrame中的数据。例如,找出电影数据集中,某个导演的电影:#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','description',...
代码星球
·
2020-09-19
Python
机器
学习
九十五
Pandas
Python机器学习(九十四)Pandas 访问行数据
访问行数据,有两个方法:.loc –使用索引名定位.iloc –使用索引序号定位示例中的数据以电影名作为索引:#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.column...
代码星球
·
2020-09-19
Python
机器
学习
九十四
Pandas
Python机器学习(九十三)Pandas 访问列数据
访问DataFrame中的Series,可以使用DataFrame['列名']方式。#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','description','di...
代码星球
·
2020-09-19
Python
机器
学习
九十三
Pandas
Python机器学习(九十二)Pandas 统计
在整个DataFrame上使用describe(),我们可以得到一个统计结果:importpandasaspd#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','des...
代码星球
·
2020-09-19
Python
机器
学习
九十二
Pandas
Python机器学习(九十一)Pandas 填充(Imputation)空值
除了删除空值,还有一种处理空值的方法是填充(Imputation)。让我们看看在revenue_millions列中填充缺失的值。首先,将该列提取到变量中:revenue=movies_df['revenue_millions']使用DataFrame['列名']可以获取1列数据,即一个Series。可以使用head查...
代码星球
·
2020-09-19
Python
机器
学习
九十一
Pandas
Python机器学习(九十)Pandas 去除null值
数据集中通常会包含null值或空值,对于空值的处理有2种方式:删除带有null的行或列用非空值填充null项要处理数据集中的null值,首先要找出DataFrame中的哪些单元格是空的:movies_df.isnull()输出rankgenredescriptiondirectoractorsyearruntimera...
代码星球
·
2020-09-19
Python
机器
学习
九十
Pandas
Python机器学习(八十九)Pandas 整理列名
关于数据集的列名,通常建议最好使用小写字母,删除特殊字符,并用下划线替换空格。有时数据集的列名可能不是很规范,需要整理修改理列名。获取DataFrame的列名,可以使用DataFrame.columns属性。movies_df.columns输出Index(['Rank','Genre','Description','...
代码星球
·
2020-09-19
Python
机器
学习
八十九
Pandas
Python机器学习(八十七)Pandas 去除重复
去除重复数据是一项常见操作,Pandas中,可以使用drop_duplicates方法。电影数据集没有重复的行,我们来制造一些重复行。temp_df=movies_df.append(movies_df)temp_df.shape输出(2000,11)append()将返回一个副本,不影响原始数据DataFrame。使...
代码星球
·
2020-09-19
Python
机器
学习
八十七
Pandas
首页
上一页
...
2
3
4
5
6
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他