#Py

Scrapy基础

Scrapy使用了Twisted异步网络库来处理网络通讯。整体架构大致如下 Scrapy主要包括了以下组件:引擎(Scrapy)用来处理整个系统的数据流处理,触发事务(框架核心)调度器(Scheduler)用来接受引擎发过来的请求,压入队列中,并在引擎再次请求的时候返回.可以想像成一个URL(抓取网页的网址或...
代码星球 ·2020-04-04

Scrapy框架的八个扩展

首先需要在环境变量中设置fromscrapy.contrib.downloadermiddleware.httpproxyimportHttpProxyMiddleware方式一:使用默认os.environ{http_proxy:http://root:woshiniba@192.168.11.11:9999/htt...
代码星球 ·2020-04-04

浅析Scrapy框架运行的基本流程

本篇博客将从Twisted的下载任务基本流程开始介绍,然后再一步步过渡到Scrapy框架的基本运行流程,其中还会需要我们自定义一个Low版的Scrapy框架。但内容不会涉及太多具体细节,而且需要注意的是示例代码的运行过程不会Scrapy一模一样,但不影响你对整体的把握。希望可以帮助那些刚入门爬虫或者刚学习Scrapy的...

Python 高级(二)

#coding=utf-8print("******多继承使用类名.__init__发生的状态******")classParent(object):def__init__(self,name):print('parent的init开始被调用')self.name=nameprint('parent的init结束被调用...
代码星球 ·2020-04-04

Python 高级

 GIL面试题如下描述PythonGIL的概念,以及它对python多线程的影响?编写一个多线程抓取网页的程序,并阐明多线程抓取程序是否可比单线程性能有提升,并解释原因。Guido的声明:http://www.artima.com/forums/flat.jsp?forum=106&thread=21...
代码星球 ·2020-04-04

MySQL与Python交互

拆表将分组结果插入另一张表里insertintogoods_cates(name)selectcate_namefromgoodsgroupbycate_name;#注意,不用加values同步数据表,把一张表字段覆盖到另一张表上updategoodsasginnerjoingoods_catesascong.cate...
代码星球 ·2020-04-04

Python3入门与进阶【笔记】

1、二、八、十六进制转十进制:int('10',base=2)、int('10',base=8)、int('10',base=16);2、八、十、十六进制转二进制:bin(0o+xxx)、bin(xxx)、bin(0x+xxx);3、二、十、十六进制转八进制:oct(0b+xxx)、oct(xxx)、oct(0x+xx...
代码星球 ·2020-04-04

「数据结构与算法之链表(Python)」(四)

顺序表的储存分为一体式结构和分离式结构,但总的来说存储数据的内存是一块连续的单元,每次申请前都要预估所需要的内存空间大小。这样就不能随意的增加我们需要的数据了。链接就是为了解决这个问题。它的数据存储方式是每插入一个数据,就在内存中申请一块存储空间来保存,那么新增加的数据如何和之前的数据保持关联呢?解决方法就是在原来的数...

「数据结构与算法(Python)」(三)

栈可以用顺序表实现,也可以用链表实现。栈的操作Stack()创建一个新的空栈push(item)添加一个新的元素item到栈顶pop()弹出栈顶元素peek()返回栈顶元素is_empty()判断栈是否为空size()返回栈的元素个数这里我们用python的list来实现栈的操作classStack(object):"...
代码星球 ·2020-04-04

「数据结构与算法(Python)」(二)

在程序中,经常需要将一组(通常是同为某个类型的)数据元素作为整体管理和使用,需要创建这种元素组,用变量记录它们,传进传出函数等。一组数据中包含的元素个数可能发生变化(可以增加或删除元素)。对于这种需求,最简单的解决方案便是将这样一组元素看成一个序列,用元素在序列里的位置和顺序,表示实际应用中的某种有意义的信息,或者表示...
代码星球 ·2020-04-04

「数据结构与算法(Python)」(一)

算法是计算机处理信息的本质,因为计算机程序本质上是一个算法来告诉计算机确切的步骤来执行一个指定的任务。一般地,当算法在处理信息时,会从输入设备或数据的存储地址读取数据,把结果写入输出设备或某个存储地址供以后再调用。算法是独立存在的一种解决问题的方法和思想。对于算法而言,实现的语言并不重要,重要的是思想。算法可以有不同的...
代码星球 ·2020-04-04

pyspider采坑(ValueError: Invalid configuration:

     因为pyspider源码版本缘故,超过3.5的版本的python解释器是各种不兼容,各种采坑~~~~~建议使用3.5.x的版本的python我用的是3.5.4(百度云盘链接:https://pan.baidu.com/s/1VlhyF6G8m6P3JA61YO...

Python学习代码——高级篇

代码可直接复制到python文件中进行运行#1.文件内创建函数#内建函数和方法#open()打开文件#read()输入#readline()输入一行#seek()文件移动#write()输出#close()关闭文件#写入文件,执行完成后生成txt文件file1=open('name.txt','w')file1.wri...
代码星球 ·2020-04-04

Python学习代码——基础篇

代码可直接复制到python文件中进行运行#1.打印print("你好世界")#2.列表(java中的数组)name=["lll","gx","zj","xx"]print(name[-2])#3.if判断xmTail=1.75xmWight=80.5BMI=xmWight/(xmTail*xmTail)print(B...
代码星球 ·2020-04-04

Python多线程

多线程技术需。要用到threading模块,应当避免使用thread模块,原因是它不支持守护线程。当主线程退出时,所有的子线程不管他们是都还在工作,都会被强制退出。有时候我们并不希望发生这种行为,这时候就需要引入守护线程的概念。threading模块支持守护线程,所以在需要使用多线程的时候,直接使用threading模...
代码星球 ·2020-04-04
首页上一页...387388389390391...下一页尾页