#pandas

pandas DataFrame.shift()函数

pandasDataFrame.shift()函数可以把数据移动指定的位数period参数指定移动的步幅,可以为正为负.axis指定移动的轴,1为行,0为列.eg:有这样一个DataFrame数据:importpandasaspddata1=pd.DataFrame({'a':[0,1,2,3,4,5,6,7,8,9]...
代码星球 ·2020-05-24

pandas DataFrame applymap()函数

pandasDataFrame的 applymap() 函数可以对DataFrame里的每个值进行处理,然后返回一个新的DataFrame:importpandasaspddf=pd.DataFrame({'a':[1,2,3],'b':[10,20,30],'c':[5,10,15]})defad...

pandas的qcut()方法

pandas的qcut可以把一组数字按大小区间进行分区,比如data=pd.Series([0,8,1,5,3,7,2,6,10,4,9])比如我要把这组数据分成两部分,一半大的,一半小的,如果是小的数,值就变成'smallnumber',大的数,值就变成'largenumber':print(pd.qcut(data...
代码星球 ·2020-05-24

pandas DataFrame(3)-轴

和numpy数组(5)-二维数组的轴一样,pandasDataFrame也有轴的概念,决定了方法是对行应用还是对列应用:以下面这个数据为例说明:这个数据是5个车站10天内的客流数据:ridership_df=pd.DataFrame(data=[[0,0,2,5,0],[1478,3877,3674,2328,2539...
代码星球 ·2020-05-24

pandas DataFrame(4)-向量化运算

pandasDataFrame进行向量化运算时,是根据行和列的索引值进行计算的,而不是行和列的位置:1.行和列索引一致:importpandasaspddf1=pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]})df2=pd.DataFrame({'a':[10,20,...

pandas通过皮尔逊积矩线性相关系数(Pearson's r)计算数据相关性

皮尔逊积矩线性相关系数(Pearson'sr)用于计算两组数组之间是否有线性关联,举个例子:a=pd.Series([1,2,3,4,5,6,7,8,9,10])b=pd.Series([2,3,4,5,6,7,8,9,10,11])计算两组数据的线性相关性,就是,b是否随着a的增长而增长,或者随着a的增长而减小,或者...

pandas DataFrame(2)-行列索引及值的获取

pandasDataFrame是二维的,所以,它既有列索引,又有行索引上一篇里只介绍了列索引:importpandasaspddf=pd.DataFrame({'A':[0,1,2],'B':[3,4,5]})printdf#结果:AB003114225行索引自动生成了 0,1,2 如果要自己指定行...

pandas DataFrame(1)

之前介绍了numpy的二维数组,但是numpy二维数组有一些局限性,比如,它数组里所有的值的类型必须相同,不能某一列是数值型,某一列是字符串型,这样会导致无法使用 mean() , std() 等方法去计算某一行或某一列.但是,使用pandasDataFrame可以解决这一问题....
代码星球 ·2020-05-24

吴裕雄--天生自然python学习笔记:pandas模块导入数据

有时候,手工生成Pandas的DataFrame数据是件非常麻烦的事情,所以我们通常会先把数据保存在Excel或数据库中,然后再把数据导入Pandas。另一种情况是抓取网页中成千上万的表格数据导入Pandas,作为DataFrame数据。Pandas常用的导入数据方法有:下面,我们示范用readhtml方法抓取网页中的...

吴裕雄--天生自然python学习笔记:pandas模块删除 DataFrame 数据

Pandas通过drop函数删除DataFrarne数据,语法为:  例如,删除陈聪明(行标题)的成绩:importpandasaspddatas=[[65,92,78,83,70],[90,72,76,93,56],[81,85,91,89,77],[79,53,47,94,80]]indexs=...

吴裕雄--天生自然python学习笔记:pandas模块DataFrame 数据的修改及排序

importpandasaspddatas=[[65,92,78,83,70],[90,72,76,93,56],[81,85,91,89,77],[79,53,47,94,80]]indexs=["林大明","陈聪明","黄美丽","熊小娟"]columns=["语文","数学","英文","自然","社会"]df=...

吴裕雄--天生自然python学习笔记:pandas模块用 dataframe.loc 通过行、列标题读取数据

用df.values读取数据的前提是必须知道学生及科目的位置,非常麻烦。而df.loc可直接通过行、列标题读取数据,使用起来更为方便。使用df.loc的语法为:行标题或列标题若是包含多个项目,则用小括号将项目括起来,项目之间以逗号分隔,如“(”数学”,”自然”...

吴裕雄--天生自然python学习笔记:pandas模块读取 Data Frame 数据

读取行数据读取一个列数据的语法为:例如,读取所有学生自然科目的成绩:importpandasaspddatas=[[65,92,78,83,70],[90,72,76,93,56],[81,85,91,89,77],[79,53,47,94,80]]indexs=["林大明","陈聪明","黄美丽","熊小娟"]col...

吴裕雄--天生自然python学习笔记:pandas模块强大的数据处理套件

用Python进行数据分析处理,其中最炫酷的就属Pandas套件了。比如,如果我们通过Requests及Beautifulsoup来抓取网页中的表格数据,需要进行较复杂的搜寻才能抓取,但通过Pandas不但可以自动读取网页中的表格数据,还能对数据进行修改、排序等处理,以及给制统计图表。Pandas主要的数据类型有两种:...

pandas 存取数据小笔记

 importpandasaspd 1.  读取和保存csv文件#读df=pd.read_csv(read_file_path,header=0)#其中read_file_path为字符串,为读的文件所在路径#比如"../cj_data/query_result.csv"#header=0...
代码星球 ·2020-05-21
首页上一页...678910...下一页尾页