51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#Python数据分析与挖掘实战
python处理文本文件
在测试任务过程中都或多或少遇到自己处理文本文件的情况。举个栗子:客户端测试从异常日志中收集有用信息。后端测试需要创建各种规则的压力的词表。...这里给大家分享一个使用python脚本处理文本的一些小技巧,分三步学会创建文本文件。学会读取已有的文本文件。学会处理读取文件后的内容 创建文本文件脚本创建文件和人工创...
IT猿
·
2020-03-25
python
处理
文本
文件
python学习笔记(四)-数据类型
0.在Python中的数据类型详解http://www.cnblogs.com/scios/p/8026576.html1.为什么布尔类型(bool)的True和False分别用1和0来代替吗?计算机只认识二进制数,所以所有的编程语言最终都会转换成简单的二进制序列给CPU按照一定的规则解析。由于二进制只有两个数:0和1...
IT猿
·
2020-03-25
python
学习
笔记
数据
类型
Python数据类型详解
目录1、字符串2、布尔类型3、整数4、浮点数5、数字6、列表7、元组8、字典9、日期1、字符串1.1、如何在Python中使用字符串a、使用单引号(')用单引号括起来表示字符串,例如:str='thisisstring';printstr;b、使用双引号(")双引号中的字符串与单引号中的字符串用法完全相同,例如:str...
IT猿
·
2020-03-25
Python
数据
类型
详解
python中decode和encode的区别
importsys'''*字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。decode的作用是将其他编码的字符串转换成unicode编码,如st...
IT猿
·
2020-03-25
python
decode
encode
区别
Python中的yield和Generators(生成器)
本文目的 解释yield关键字到底是什么,为什么它是有用的,以及如何来使用它。 协程与子例程 我们调用一个普通的Python函数时,一般是从函数的第一行代码开始执行,结束于return语句、异常或者函数结束(可以看作隐式的返回None)。一旦函数将控制权交还给调用者,就意味着全部结束。...
IT猿
·
2020-03-25
Python
中的
yield
Generators
成器
python 截取 取出一部分的字符串
下面是split截取获得>>>str='http://manualfile.s3.amazonaws.com/pdf/gti-chis-1-user-9fb-0-7a05a56f0b91.pdf'>>>printstr.split()['http://manualfile.s3.am...
IT猿
·
2020-03-25
python
截取
取出
一部分
字符串
python 爬虫练习
bs去除特定标签。#urlimporteasyguiasgimporturllib.requestfrombs4importBeautifulSoupimportosimportsysimportreimportconfig.story2asurls#获取urldefset_url():msg="请填写一下信息(其中带...
IT猿
·
2020-03-25
python
爬虫
练习
python读文件的三个方法read()、readline()、readlines()详解
"""1、读取文件的三个方法:read()、readline()、readlines()2、三个方法均可接受一个变量用以限制每次读取的数据量,通常不使用该变量。""""""关于read()方法:1、读取整个文件,将文件内容放到一个字符串变量中2、如果文件大于可用内存,不可能使用这种处理"""file_object=op...
IT猿
·
2020-03-25
python
文件
三个
方法
read
Python 爬虫系列:糗事百科最热段子
1.获取糗事百科urlhttp://www.qiushibaike.com/hot/page/2/ 末尾2指第2页2.分析页面,找到段子部分的位置,需要一点CSS和HTML的知识3、编写代码1importurllib.request2frombs4importBeautifulSoup3fromu...
IT猿
·
2020-03-25
Python
爬虫
系列
糗事
百科
python字符串/元组/列表/字典互转
1#-*-coding:utf-8-*-23#1、字典4dict={'name':'Zara','age':7,'class':'First'}56#字典转为字符串,返回:<type'str'>{'age':7,'name':'Zara','class':'First'}7printtype(str(dic...
IT猿
·
2020-03-25
python
字符串
元组
列表
字典
python使用代理访问服务器
python使用代理访问服务器主要有一下3个步骤:1.创建一个代理处理器ProxyHandler:proxy_support=urllib.request.ProxyHandler(),ProxyHandler是一个类,其参数是一个字典:{'类型':'代理ip:端口号'}什么是Handler?Handler也叫作处理器...
IT猿
·
2020-03-25
python
使用
代理
访问
服务器
python BeautifulSoup库用法总结
简单来说,BeautifulSoup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下:BeautifulSoup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应...
IT猿
·
2020-03-25
python
BeautifulSoup
用法
总结
python线程池(threadpool)
一、安装pipinstallthreadpool 二、使用介绍(1)引入threadpool模块(2)定义线程函数 (3)创建线程池threadpool.ThreadPool() (4)创建需要线程池处理的任务即threadpool.makeReques...
IT猿
·
2020-03-25
python
线程
threadpool
python爬虫系列:做一个简单的动态代理池
自动1、设置动态的useragent1importurllib.requestasure2importurllib.parseasupa3importrandom4frombs4importBeautifulSoup56#动态设置useragent:7defset_user_agent():8agent_list=[9...
IT猿
·
2020-03-25
python
爬虫
系列
一个
简单
Python "HTTP Error 403: Forbidden"
问题:执行下面的语句时1defset_IPlsit():2url='https://www.whatismyip.com/'3response=urllib.request.urlopen(url)4html=response.read().decode('utf-8')出现以下异常: C:Users5435...
IT猿
·
2020-03-25
Python
quotHTTP
Error
Forbidden
quot
首页
上一页
...
406
407
408
409
410
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他