单实例主题的文章列表，还有单实例的技术要点_第30页

python常用运维脚本实例

一、ps可以查看进程的内存占用大小，写一个脚本计算一下所有进程所占用内存大小的和。（提示，使用psaux列出所有进程，过滤出RSS那列，然后求和）注：ps-ef与psaux效果一样使用随意importoslist=[]sum=0str1=os.popen('psaux','r').readlines()foriinst...

代码星球 ·2020-08-10

Python爬虫实例（六）多进程下载金庸网小说

目标任务：使用多进程下载金庸网各个版本（旧版、修订版、新修版）的小说代码如下： #-*-coding:utf-8-*-importrequestsfromlxmlimportetreefrommultiprocessingimportPoolimportosimportsysreload(sys)sys.se...

代码星球 ·2020-08-09

Python爬虫框架Scrapy实例（四）下载中间件设置

还是豆瓣top250爬虫的例子，添加下载中间件，主要是设置动态Uesr-Agent和代理IPScrapy代理IP、Uesr-Agent的切换都是通过DOWNLOADER_MIDDLEWARES进行控制，我们在settings.py同级目录下创建middlewares.py文件，包装所有请求。middlewares.py...

代码星球 ·2020-08-09

Python爬虫框架Scrapy实例（三）数据存储到MongoDB

任务目标：爬取豆瓣电影top250，将数据存储到MongoDB中。items.py文件#-*-coding:utf-8-*-importscrapyclassDoubanItem(scrapy.Item):#definethefieldsforyouritemherelike:#电影名title=scrapy.Fiel...

代码星球 ·2020-08-09

Python爬虫实例（五） requests+flask构建自己的电影库

目标任务：使用requests抓取电影网站信息和下载链接保存到数据库中，然后使用flask做数据展示。爬取的网站在这里最终效果如下：主页：可以进行搜索：输入水形物语点击标题进入详情页：爬虫程序#-*-coding:utf-8-*-importrequestsfromurllibimportparseimpo...

代码星球 ·2020-08-09

Python爬虫scrapy-redis分布式实例（一）

目标任务：将之前新浪网的Scrapy爬虫项目，修改为基于RedisSpider类的scrapy-redis分布式爬虫项目，将数据存入redis数据库。一、item文件，和之前项目一样不需要改变#-*-coding:utf-8-*-importscrapyimportsysreload(sys)sys.set...

代码星球 ·2020-08-09

Python爬虫框架Scrapy实例（二）

目标任务：使用Scrapy框架爬取新浪网导航页所有大类、小类、小类里的子链接、以及子链接页面的新闻内容，最后保存到本地。大类小类如下图所示：点击国内这个小类，进入页面后效果如下图（部分截图）：查看页面元素，得到小类里的子链接如下图所示：有子链接就可以发送请求来访问对应新闻的内容了。首先创建scrapy项目#...

代码星球 ·2020-08-09

Python爬虫框架Scrapy实例（一）

目标任务：爬取腾讯社招信息，需要爬取的内容为：职位名称，职位的详情链接，职位类别，招聘人数，工作地点，发布时间。一、创建Scrapy项目scrapystartprojectTencent命令执行后，会创建一个Tencent文件夹，结构如下二、编写item文件，根据需要爬取的内容定义爬取字段#-*-coding:utf-...

代码星球 ·2020-08-09

Python爬虫实例（四）网站模拟登陆

一、获取一个有登录信息的Cookie模拟登陆下面以人人网为例，首先使用自己的账号和密码在浏览器登录，然后通过抓包拿到cookie，再将cookie放到请求之中发送请求即可，具体代码如下：#-*-coding:utf-8-*-importurllib2#构建一个已经登录过的用户的headers信息headers={"Ho...

代码星球 ·2020-08-09

Python爬虫实例（三）代理的使用

一些网站会有相应的反爬虫措施，例如很多网站会检测某一段时间某个IP的访问次数，如果访问频率太快以至于看起来不像正常访客，它可能就会会禁止这个IP的访问。所以我们需要设置一些代理服务器，每隔一段时间换一个代理，就算IP被禁止，依然可以换个IP继续爬取。在Python中，可以使用urllib2中的ProxyHandler来...

代码星球 ·2020-08-09

Python爬虫实例（二）使用selenium抓取斗鱼直播平台数据

程序说明：抓取斗鱼直播平台的直播房间号及其观众人数，最后统计出某一时刻的总直播人数和总观众人数。过程分析：一、进入斗鱼首页http://www.douyu.com/directory/all进入平台首页，来到页面底部点击下一页，发现url地址没有发生变化，这样的话再使用urllib2发送请求将获取不到完整数据，这时我们...

代码星球 ·2020-08-09

Python爬虫实例（一）爬取百度贴吧帖子中的图片

程序功能说明：爬取百度贴吧帖子中的图片，用户输入贴吧名称和要爬取的起始和终止页数即可进行爬取。思路分析：一、指定贴吧url的获取例如我们进入秦时明月吧，提取并分析其有效url如下http://tieba.baidu.com/f?kw=%E7%A7%A6%E6%97%B6%E6%98%8E%E6%9C%88?后面为查询字...

代码星球 ·2020-08-09

Autoafc 手动获取接口实例

demo:usingAutofac;usingAutofac.Integration.Mvc;usingRongzi.RZR.Huoke.Repository;usingRongzi.RZR.Huoke.Service;usingRongzi.RZR.Huoke.Service.MQ;usingSystem;using...

代码星球 ·2020-08-09

Java接口与实例化

看代码看到publicRunnabler=newRunnable(){@Overridepublicvoidrun(){...}}接口不能new，不过可以生成一个匿名类，省略了写一个具体类实现接口的开销。publicclassMain{publicstaticvoidmain(String[]args){Stringa...

代码星球 ·2020-08-09

JavaScript new return 类的实例化

new初始化方法简单没有return的就不写了functionPerson(){this.name="hongda";this.age=28;return"fffffff";}varp=newPerson();console.dir(p);console.log(typeofp);varpp=Person();cons...

代码星球 ·2020-08-09