51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#单实例
python常用运维脚本实例
一、ps可以查看进程的内存占用大小,写一个脚本计算一下所有进程所占用内存大小的和。(提示,使用psaux列出所有进程,过滤出RSS那列,然后求和)注:ps-ef与psaux效果一样使用随意importoslist=[]sum=0str1=os.popen('psaux','r').readlines()foriinst...
代码星球
·
2020-08-10
python
常用
运维
脚本
实例
Python爬虫实例(六)多进程下载金庸网小说
目标任务:使用多进程下载金庸网各个版本(旧版、修订版、新修版)的小说代码如下: #-*-coding:utf-8-*-importrequestsfromlxmlimportetreefrommultiprocessingimportPoolimportosimportsysreload(sys)sys.se...
代码星球
·
2020-08-09
Python
爬虫
实例
进程
下载
Python爬虫框架Scrapy实例(四)下载中间件设置
还是豆瓣top250爬虫的例子,添加下载中间件,主要是设置动态Uesr-Agent和代理IPScrapy代理IP、Uesr-Agent的切换都是通过DOWNLOADER_MIDDLEWARES进行控制,我们在settings.py同级目录下创建middlewares.py文件,包装所有请求。middlewares.py...
代码星球
·
2020-08-09
Python
爬虫
框架
Scrapy
实例
Python爬虫框架Scrapy实例(三)数据存储到MongoDB
任务目标:爬取豆瓣电影top250,将数据存储到MongoDB中。items.py文件#-*-coding:utf-8-*-importscrapyclassDoubanItem(scrapy.Item):#definethefieldsforyouritemherelike:#电影名title=scrapy.Fiel...
代码星球
·
2020-08-09
Python
爬虫
框架
Scrapy
实例
Python爬虫实例(五) requests+flask构建自己的电影库
目标任务:使用requests抓取电影网站信息和下载链接保存到数据库中,然后使用flask做数据展示。爬取的网站在这里 最终效果如下:主页:可以进行搜索:输入水形物语点击标题进入详情页:爬虫程序#-*-coding:utf-8-*-importrequestsfromurllibimportparseimpo...
代码星球
·
2020-08-09
Python
爬虫
实例
requests+flask
构建
Python爬虫scrapy-redis分布式实例(一)
目标任务:将之前新浪网的Scrapy爬虫项目,修改为基于RedisSpider类的scrapy-redis分布式爬虫项目,将数据存入redis数据库。 一、item文件,和之前项目一样不需要改变#-*-coding:utf-8-*-importscrapyimportsysreload(sys)sys.set...
代码星球
·
2020-08-09
Python
爬虫
scrapy-redis
分布式
实例
Python爬虫框架Scrapy实例(二)
目标任务:使用Scrapy框架爬取新浪网导航页所有大类、小类、小类里的子链接、以及子链接页面的新闻内容,最后保存到本地。大类小类如下图所示:点击国内这个小类,进入页面后效果如下图(部分截图):查看页面元素,得到小类里的子链接如下图所示:有子链接就可以发送请求来访问对应新闻的内容了。 首先创建scrapy项目#...
代码星球
·
2020-08-09
Python
爬虫
框架
Scrapy
实例
Python爬虫框架Scrapy实例(一)
目标任务:爬取腾讯社招信息,需要爬取的内容为:职位名称,职位的详情链接,职位类别,招聘人数,工作地点,发布时间。一、创建Scrapy项目scrapystartprojectTencent命令执行后,会创建一个Tencent文件夹,结构如下二、编写item文件,根据需要爬取的内容定义爬取字段#-*-coding:utf-...
代码星球
·
2020-08-09
Python
爬虫
框架
Scrapy
实例
Python爬虫实例(四)网站模拟登陆
一、获取一个有登录信息的Cookie模拟登陆下面以人人网为例,首先使用自己的账号和密码在浏览器登录,然后通过抓包拿到cookie,再将cookie放到请求之中发送请求即可,具体代码如下:#-*-coding:utf-8-*-importurllib2#构建一个已经登录过的用户的headers信息headers={"Ho...
代码星球
·
2020-08-09
Python
爬虫
实例
网站
模拟
Python爬虫实例(三)代理的使用
一些网站会有相应的反爬虫措施,例如很多网站会检测某一段时间某个IP的访问次数,如果访问频率太快以至于看起来不像正常访客,它可能就会会禁止这个IP的访问。所以我们需要设置一些代理服务器,每隔一段时间换一个代理,就算IP被禁止,依然可以换个IP继续爬取。在Python中,可以使用urllib2中的ProxyHandler来...
代码星球
·
2020-08-09
Python
爬虫
实例
代理
使用
Python爬虫实例(二)使用selenium抓取斗鱼直播平台数据
程序说明:抓取斗鱼直播平台的直播房间号及其观众人数,最后统计出某一时刻的总直播人数和总观众人数。过程分析:一、进入斗鱼首页http://www.douyu.com/directory/all进入平台首页,来到页面底部点击下一页,发现url地址没有发生变化,这样的话再使用urllib2发送请求将获取不到完整数据,这时我们...
代码星球
·
2020-08-09
Python
爬虫
实例
使用
selenium
Python爬虫实例(一)爬取百度贴吧帖子中的图片
程序功能说明:爬取百度贴吧帖子中的图片,用户输入贴吧名称和要爬取的起始和终止页数即可进行爬取。思路分析:一、指定贴吧url的获取例如我们进入秦时明月吧,提取并分析其有效url如下http://tieba.baidu.com/f?kw=%E7%A7%A6%E6%97%B6%E6%98%8E%E6%9C%88?后面为查询字...
代码星球
·
2020-08-09
Python
爬虫
实例
爬取
百度贴吧
Autoafc 手动获取接口实例
demo:usingAutofac;usingAutofac.Integration.Mvc;usingRongzi.RZR.Huoke.Repository;usingRongzi.RZR.Huoke.Service;usingRongzi.RZR.Huoke.Service.MQ;usingSystem;using...
代码星球
·
2020-08-09
Autoafc
手动
获取
接口
实例
Java接口与实例化
看代码看到publicRunnabler=newRunnable(){@Overridepublicvoidrun(){...}}接口不能new,不过可以生成一个匿名类,省略了写一个具体类实现接口的开销。publicclassMain{publicstaticvoidmain(String[]args){Stringa...
代码星球
·
2020-08-09
Java
接口
实例
JavaScript new return 类的实例化
new初始化方法简单没有return的就不写了functionPerson(){this.name="hongda";this.age=28;return"fffffff";}varp=newPerson();console.dir(p);console.log(typeofp);varpp=Person();cons...
代码星球
·
2020-08-09
Javascript
new
return
实例
首页
上一页
...
28
29
30
31
32
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他