#panda

pandas中的axis参数(看其他人的博客中产生的疑问点,用自己的话解析出来)

axis有两个值:axis=0或者axis=1看到很多资料都不太理解,把我个人理解说一下:下面这张图,在很多资料中都看到了,我只能说先死记住axis=0,代表跨行(注意看这张图的axis=0的箭头向下指),axis=1,代表跨列(注意看这张图的axis=1的箭头向右指,水平方向) 二维数据拥有两个轴:0轴沿着...

数据分析——Pandas的用法(Series,DataFrame)

我们先要了解,pandas是基于Numpy构建的,pandas中很多的用法和numpy一致。pandas中又有series和DataFrame,Series是DataFrame的基础。pandas的主要功能:具备对其功能的数据结构DataFrame,Series集成时间序列功能提供丰富的数学运算和操作灵活处理缺失数据,...

pandas DataFrame apply()函数(1)

之前已经写过pandasDataFrameapplymap()函数还有pandas数组(pandasSeries)-(5)apply方法自定义函数pandasDataFrame的 applymap() 函数和pandasSeries的 apply() 方法,都是对整个对象上个各个...
代码星球 ·2020-05-24

pandas DataFrame apply()函数(2)

上一篇pandasDataFrameapply()函数(1)说了如何通过apply函数对DataFrame进行转换,得到一个新的DataFrame.这篇介绍DataFrameapply()函数的另一个用法,得到一个新的pandasSeries:apply()中的函数接收的参数为一行(列),把一行(列)通过计算,返回一个...
代码星球 ·2020-05-24

pandas DataFrame(5)-合并DataFrame与Series

之前已经学过DataFrame与DataFrame相加,Series与Series相加,这篇介绍下DataFrame与Series的相加:importpandasaspds=pd.Series([1,2,3,4])df=pd.DataFrame({0:[10,20,30,40],1:[50,60,70,80],2:[9...

pandas Series的sort_values()方法

pandasSeries的 sort_values() 方法能对Series进行排序,返回一个新的Series:s=pd.Series([np.nan,1,3,10,5])升序排列:s.sort_values(ascending=True)11.023.045.0310.00NaNdtype:flo...

pandas DataFrame.shift()函数

pandasDataFrame.shift()函数可以把数据移动指定的位数period参数指定移动的步幅,可以为正为负.axis指定移动的轴,1为行,0为列.eg:有这样一个DataFrame数据:importpandasaspddata1=pd.DataFrame({'a':[0,1,2,3,4,5,6,7,8,9]...
代码星球 ·2020-05-24

pandas DataFrame applymap()函数

pandasDataFrame的 applymap() 函数可以对DataFrame里的每个值进行处理,然后返回一个新的DataFrame:importpandasaspddf=pd.DataFrame({'a':[1,2,3],'b':[10,20,30],'c':[5,10,15]})defad...

pandas的qcut()方法

pandas的qcut可以把一组数字按大小区间进行分区,比如data=pd.Series([0,8,1,5,3,7,2,6,10,4,9])比如我要把这组数据分成两部分,一半大的,一半小的,如果是小的数,值就变成'smallnumber',大的数,值就变成'largenumber':print(pd.qcut(data...
代码星球 ·2020-05-24

pandas DataFrame(3)-轴

和numpy数组(5)-二维数组的轴一样,pandasDataFrame也有轴的概念,决定了方法是对行应用还是对列应用:以下面这个数据为例说明:这个数据是5个车站10天内的客流数据:ridership_df=pd.DataFrame(data=[[0,0,2,5,0],[1478,3877,3674,2328,2539...
代码星球 ·2020-05-24

pandas DataFrame(4)-向量化运算

pandasDataFrame进行向量化运算时,是根据行和列的索引值进行计算的,而不是行和列的位置:1.行和列索引一致:importpandasaspddf1=pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]})df2=pd.DataFrame({'a':[10,20,...

pandas通过皮尔逊积矩线性相关系数(Pearson's r)计算数据相关性

皮尔逊积矩线性相关系数(Pearson'sr)用于计算两组数组之间是否有线性关联,举个例子:a=pd.Series([1,2,3,4,5,6,7,8,9,10])b=pd.Series([2,3,4,5,6,7,8,9,10,11])计算两组数据的线性相关性,就是,b是否随着a的增长而增长,或者随着a的增长而减小,或者...

pandas DataFrame(2)-行列索引及值的获取

pandasDataFrame是二维的,所以,它既有列索引,又有行索引上一篇里只介绍了列索引:importpandasaspddf=pd.DataFrame({'A':[0,1,2],'B':[3,4,5]})printdf#结果:AB003114225行索引自动生成了 0,1,2 如果要自己指定行...

pandas DataFrame(1)

之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法去计算某一行或某一列.但是,使用pandasDataFrame可以解决这一问题....
代码星球 ·2020-05-24

吴裕雄--天生自然python学习笔记:pandas模块导入数据

有时候,手工生成Pandas的DataFrame数据是件非常麻烦的事情,所以我们通常会先把数据保存在Excel或数据库中,然后再把数据导入Pandas。另一种情况是抓取网页中成千上万的表格数据导入Pandas,作为DataFrame数据。Pandas常用的导入数据方法有:下面,我们示范用readhtml方法抓取网页中的...
首页上一页...678910...下一页尾页