51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#Pandas
Pandas读取或存储数据至Mysql
两种链接方式用DBAPI构建数据库链接importpymysqlimportpandasaspdcon=pymysql.connect(host="127.0.0.1",user="root",password="password",db="world")#读取sqldata_sql=pd.read_sql("SQL查...
代码星球
·
2021-02-14
Pandas
读取
存储
数据
Mysql
用scikit-learn和pandas学习线性回归
对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。 没有数据,当然没法研究机器学习啦。:)这里我们用UCI大学公开的机器学习数据来跑线性回归。 数据的介绍在这: http://archive.ics.uci...
代码星球
·
2021-02-12
scikit-learn
pandas
学习
线性
回归
python pandas 中文件的读写——read_csv()读取文件
1.python读取文件的几种方式read_csv从文件,url,文件型对象中加载带分隔符的数据。默认分隔符为逗号read_table从文件,url,文件型对象中加载带分隔符的数据。默认分隔符为制表符(“”)read_fwf读取定宽列格式数据(也就是没有分隔符)read_cliboard读取剪切板中的数据,可以看做re...
代码星球
·
2021-02-11
文件
python
pandas
读写
read
Pandas基础命令速查清单
本文翻译整理自PandasCheatSheet-PythonforDataScience,结合K-Lab的工具属性,添加了具体的内容将速查清单里面的代码实践了一遍。速查表内容概要点击右上角的Fork按钮上手实践,即可点击标题实现内容跳转[缩写解释&库的导入][数据的导入][数据的导出][创建测试对象][数据的查...
代码星球
·
2021-02-11
Pandas
基础
命令
速查
清单
python工具——Pandas
Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能安装pipinstallPandasPandas的主要数据结构是 Series(一维数据)与 DataFrame(二维数据)Series是一种类似于一维数组...
代码星球
·
2021-02-01
python
工具
Pandas
pandas.read_csv参数整理
读取CSV(逗号分隔)文件到DataFrame,也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer:str,pathlib。str,pathlib.Path,py._path.loc...
代码星球
·
2020-12-29
pandas.read
csv
参数
整理
pandas删除缺失数据(pd.dropna()方法)
1.创建带有缺失值的数据库:importpandasaspdimportnumpyasnpdf=pd.DataFrame(np.random.randn(5,3),index=list('abcde'),columns=['one','two','three'])#随机产生5行3列的数据df.ix[1,:-1]=np....
代码星球
·
2020-12-29
pandas
删除
缺失
数据
pd.dropna
pandas时间序列分析和处理Timeseries
pandas最基本的时间序列类型就是以时间戳(TimeStamp)为index元素的Series类型。生成日期范围:pd.date_range()可用于生成指定长度的DatetimeIndex。参数可以是起始结束日期,或单给一个日期,加一个时间段参数。日期是包含的。默认情况下,date_range会按天计算时间。可以通...
代码星球
·
2020-12-29
pandas
时间序列
分析
处理
Timeseries
pandas分组和聚合
对数据集进行分组,然后对每组进行统计分析SQL能够对数据进行过滤,分组聚合pandas能利用groupby进行更加复杂的分组运算分组运算过程:split->apply->combine拆分:进行分组的根据应用:每个分组运行的计算规则合并:把每个分组的计算结果合并起来示例代码:importpandasaspd...
代码星球
·
2020-12-10
pandas
分组
聚合
Pandas统计计算和描述
示例代码:importnumpyasnpimportpandasaspddf_obj=pd.DataFrame(np.random.randn(5,4),columns=['a','b','c','d'])print(df_obj) 运行结果:abcd01.4696821.9489651.373124-0.5...
代码星球
·
2020-12-10
Pandas
统计
计算
描述
pandas层级索引1
下面创建一个Series,在输入索引Index时,输入了由两个子list组成的list,第一个子list是外层索引,第二个list是内层索引。示例代码:importpandasaspdimportnumpyasnpser_obj=pd.Series(np.random.randn(12),index=[['a','a'...
代码星球
·
2020-12-10
pandas
层级
索引
pandas函数应用
1.可直接使用NumPy的函数示例代码:#Numpyufunc函数df=pd.DataFrame(np.random.randn(5,4)-1)print(df)print(np.abs(df)) 运行结果:01230-0.0624130.844813-1.853721-1.9807171-0.539628-...
代码星球
·
2020-12-10
pandas
函数
应用
pandas数据对齐
是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN1.Series按行、索引对齐示例代码:s1=pd.Series(range(10,20),index=range(10))s2=pd.Series(range(20,25),index=range(5))print('s1:...
代码星球
·
2020-12-10
pandas
数据
对齐
pandas索引操作
1.Series和DataFrame中的索引都是Index对象示例代码:print(type(ser_obj.index))print(type(df_obj2.index))print(df_obj2.index) 运行结果:<class'pandas.indexes.range.RangeIndex...
代码星球
·
2020-12-10
pandas
索引
操作
pandas数据结构
importpandasaspd Pandas有两个最主要也是最重要的数据结构: Series 和 DataFrameSeries是一种类似于一维数组的 对象,由一组数据(各种NumPy数据类型)以及一组与之对应的索引(数据标签)组成。类似一维数组的对象由数据和索引组成...
代码星球
·
2020-12-10
pandas
数据结构
首页
上一页
1
2
3
4
5
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他