#单实例

python常用运维脚本实例

一、ps可以查看进程的内存占用大小,写一个脚本计算一下所有进程所占用内存大小的和。(提示,使用psaux列出所有进程,过滤出RSS那列,然后求和)注:ps-ef与psaux效果一样使用随意importoslist=[]sum=0str1=os.popen('psaux','r').readlines()foriinst...

Python爬虫实例(六)多进程下载金庸网小说

目标任务:使用多进程下载金庸网各个版本(旧版、修订版、新修版)的小说代码如下: #-*-coding:utf-8-*-importrequestsfromlxmlimportetreefrommultiprocessingimportPoolimportosimportsysreload(sys)sys.se...

Python爬虫框架Scrapy实例(四)下载中间件设置

还是豆瓣top250爬虫的例子,添加下载中间件,主要是设置动态Uesr-Agent和代理IPScrapy代理IP、Uesr-Agent的切换都是通过DOWNLOADER_MIDDLEWARES进行控制,我们在settings.py同级目录下创建middlewares.py文件,包装所有请求。middlewares.py...

Python爬虫框架Scrapy实例(三)数据存储到MongoDB

任务目标:爬取豆瓣电影top250,将数据存储到MongoDB中。items.py文件#-*-coding:utf-8-*-importscrapyclassDoubanItem(scrapy.Item):#definethefieldsforyouritemherelike:#电影名title=scrapy.Fiel...

Python爬虫实例(五) requests+flask构建自己的电影库

目标任务:使用requests抓取电影网站信息和下载链接保存到数据库中,然后使用flask做数据展示。爬取的网站在这里 最终效果如下:主页:可以进行搜索:输入水形物语点击标题进入详情页:爬虫程序#-*-coding:utf-8-*-importrequestsfromurllibimportparseimpo...

Python爬虫scrapy-redis分布式实例(一)

目标任务:将之前新浪网的Scrapy爬虫项目,修改为基于RedisSpider类的scrapy-redis分布式爬虫项目,将数据存入redis数据库。 一、item文件,和之前项目一样不需要改变#-*-coding:utf-8-*-importscrapyimportsysreload(sys)sys.set...

Python爬虫框架Scrapy实例(二)

目标任务:使用Scrapy框架爬取新浪网导航页所有大类、小类、小类里的子链接、以及子链接页面的新闻内容,最后保存到本地。大类小类如下图所示:点击国内这个小类,进入页面后效果如下图(部分截图):查看页面元素,得到小类里的子链接如下图所示:有子链接就可以发送请求来访问对应新闻的内容了。 首先创建scrapy项目#...

Python爬虫框架Scrapy实例(一)

目标任务:爬取腾讯社招信息,需要爬取的内容为:职位名称,职位的详情链接,职位类别,招聘人数,工作地点,发布时间。一、创建Scrapy项目scrapystartprojectTencent命令执行后,会创建一个Tencent文件夹,结构如下二、编写item文件,根据需要爬取的内容定义爬取字段#-*-coding:utf-...

Python爬虫实例(四)网站模拟登陆

一、获取一个有登录信息的Cookie模拟登陆下面以人人网为例,首先使用自己的账号和密码在浏览器登录,然后通过抓包拿到cookie,再将cookie放到请求之中发送请求即可,具体代码如下:#-*-coding:utf-8-*-importurllib2#构建一个已经登录过的用户的headers信息headers={"Ho...

Python爬虫实例(三)代理的使用

一些网站会有相应的反爬虫措施,例如很多网站会检测某一段时间某个IP的访问次数,如果访问频率太快以至于看起来不像正常访客,它可能就会会禁止这个IP的访问。所以我们需要设置一些代理服务器,每隔一段时间换一个代理,就算IP被禁止,依然可以换个IP继续爬取。在Python中,可以使用urllib2中的ProxyHandler来...

Python爬虫实例(二)使用selenium抓取斗鱼直播平台数据

程序说明:抓取斗鱼直播平台的直播房间号及其观众人数,最后统计出某一时刻的总直播人数和总观众人数。过程分析:一、进入斗鱼首页http://www.douyu.com/directory/all进入平台首页,来到页面底部点击下一页,发现url地址没有发生变化,这样的话再使用urllib2发送请求将获取不到完整数据,这时我们...

Python爬虫实例(一)爬取百度贴吧帖子中的图片

程序功能说明:爬取百度贴吧帖子中的图片,用户输入贴吧名称和要爬取的起始和终止页数即可进行爬取。思路分析:一、指定贴吧url的获取例如我们进入秦时明月吧,提取并分析其有效url如下http://tieba.baidu.com/f?kw=%E7%A7%A6%E6%97%B6%E6%98%8E%E6%9C%88?后面为查询字...

Autoafc 手动获取接口实例

demo:usingAutofac;usingAutofac.Integration.Mvc;usingRongzi.RZR.Huoke.Repository;usingRongzi.RZR.Huoke.Service;usingRongzi.RZR.Huoke.Service.MQ;usingSystem;using...

Java接口与实例化

看代码看到publicRunnabler=newRunnable(){@Overridepublicvoidrun(){...}}接口不能new,不过可以生成一个匿名类,省略了写一个具体类实现接口的开销。publicclassMain{publicstaticvoidmain(String[]args){Stringa...
代码星球 ·2020-08-09

JavaScript new return 类的实例化

new初始化方法简单没有return的就不写了functionPerson(){this.name="hongda";this.age=28;return"fffffff";}varp=newPerson();console.dir(p);console.log(typeofp);varpp=Person();cons...
代码星球 ·2020-08-09
首页上一页...2829303132...下一页尾页