#Panda

pandas函数应用

1.可直接使用NumPy的函数示例代码:#Numpyufunc函数df=pd.DataFrame(np.random.randn(5,4)-1)print(df)print(np.abs(df)) 运行结果:01230-0.0624130.844813-1.853721-1.9807171-0.539628-...
代码星球 ·2020-12-10

pandas数据对齐

是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN1.Series按行、索引对齐示例代码:s1=pd.Series(range(10,20),index=range(10))s2=pd.Series(range(20,25),index=range(5))print('s1:...
代码星球 ·2020-12-10

pandas索引操作

1.Series和DataFrame中的索引都是Index对象示例代码:print(type(ser_obj.index))print(type(df_obj2.index))print(df_obj2.index) 运行结果:<class'pandas.indexes.range.RangeIndex...
代码星球 ·2020-12-10

pandas数据结构

importpandasaspd Pandas有两个最主要也是最重要的数据结构: Series 和 DataFrameSeries是一种类似于一维数组的 对象,由一组数据(各种NumPy数据类型)以及一组与之对应的索引(数据标签)组成。类似一维数组的对象由数据和索引组成...
代码星球 ·2020-12-10

数据分析工具pandas简介

Pandas的名称来自于面板数据(paneldata)和Python数据分析(dataanalysis)。Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了 高级数据结构 和 数据操作工具,它是使Python成为强大而高效的数据分析环境的重要因素之一。一个强大的分析...

pandas层级索引

下面创建一个Series,在输入索引Index时,输入了由两个子list组成的list,第一个子list是外层索引,第二个list是内层索引。示例代码:importpandasaspdimportnumpyasnpser_obj=pd.Series(np.random.randn(12),index=[['a','a'...
代码星球 ·2020-12-10

安装python的第三方库 geopandas

 直接下载,geopandas的whl文件,如geopandas-0.6.3-py2.py3-none-any.whl,将会安装不成功。在安装它的依赖库Fiona的时候,提示缺少gdal的配置(GDLA_CONFIG,GDAL_VERSION环境变量)。而在安装python版本的gdal的时候,pypi上是源码包,安装...

10个高效的pandas技巧

Pandas是一个广泛应用于数据分析等领域的Python库。关于它的教程有很多,但这里会一些比较冷门但是非常有用的技巧。read_csv这是一个大家都应该知道的函数,因为它就是读取csv文件的方法。但如果需要读取数据量很大的时候,可以添加一个参数--nrows=5,来先加载少量数据,这可以避免使用错误的分隔符,因为并不...
开发笔记 ·2020-10-29

Python爬虫小白入门(十四)Python 爬虫 – 提取数据到Pandas DataFrame

Pandas是一个开放源码、BSD许可的库,为Python编程语言提供高性能、易于使用的数据结构和数据分析工具。把抓取到的数据存储到PandasDataFrame中,可以进一步对数据进行分析,是一种常见做法。本章例子,将从豆瓣网站上抓取北美电影排行榜,并放进DataFrame中。豆瓣网站上的北美电影排行榜网址,北美电影...

Python机器学习(九十七)Pandas 绘图

Pandas的另一个优点是与Matplotlib的集成,可以直接绘制DataFrame和Series。注意:如没有安装Matplotlib,需首先安装:pipinstallmatplotlib。importmatplotlib.pyplotaspltplt.rcParams.update({'font.size':20...

Python机器学习(九十六)Pandas apply函数

与Python中的列表类似,可以使用for循环遍历DataFrame或Series,但是这样做(尤其是在大型数据集上)非常慢。Pandas中提供了一个高效的替代方案:apply()方法。语法DataFrame.apply(func)Series.apply(func)func –要对数据集中所有元...

Python机器学习(九十五)Pandas 有条件访问

有时需要根据条件,访问DataFrame中的数据。例如,找出电影数据集中,某个导演的电影:#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','description',...

Python机器学习(九十四)Pandas 访问行数据

访问行数据,有两个方法:.loc –使用索引名定位.iloc –使用索引序号定位示例中的数据以电影名作为索引:#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.column...

Python机器学习(九十三)Pandas 访问列数据

访问DataFrame中的Series,可以使用DataFrame['列名']方式。#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','description','di...

Python机器学习(九十二)Pandas 统计

在整个DataFrame上使用describe(),我们可以得到一个统计结果:importpandasaspd#加载数据movies_df=pd.read_csv("IMDB-Movie-Data.csv",index_col="Title")movies_df.columns=['rank','genre','des...
首页上一页...23456...下一页尾页