#Py

【Python3爬虫】常见反爬虫措施及解决办法(二)

这一篇博客,还是接着说那些常见的反爬虫措施以及我们的解决办法。同样的,如果对你有帮助的话,麻烦点一下推荐啦。 这次我遇到的防盗链,除了前面说的Referer防盗链,还有Cookie防盗链和时间戳防盗链。Cookie防盗链常见于论坛、社区。当访客请求一个资源的时候,他会检查这个访客的Cookie,如果不是他自己...

【Python3爬虫】常见反爬虫措施及解决办法(一)

这一篇博客,是关于反反爬虫的,我会分享一些我遇到的反爬虫的措施,并且会分享我自己的解决办法。如果能对你有什么帮助的话,麻烦点一下推荐啦。 UserAgent中文名为用户代理,它使得服务器能够识别客户使用的操作系统及版本、CPU类型、浏览器及版本等信息。对于一些网站来说,它会检查我们发送的请求中所携带的User...

python常用模块

什么是模块?  一个模块就是一个包含了python定义和声明的文件。模块的本质就是一段在其他文件中的代码。  正则表达式不仅在python中,在整个编程中都占有举足轻重的作用。不管你以后做不做开发,只要你是一个程序员就应该了解正则表达式的基本使用。如果未来要在爬虫领域发展,更要学好这方面的知识。  re模块本质上和正则...
代码星球 ·2020-03-30

python基础之面向对象

  面向过程的程序设计的核心是过程,即解决问题的步骤。   优点是:极大的降低了写程序的复杂度,只需要顺着要执行的步骤,堆叠代码即可。  缺点是:一套流水线或者流程就是用来解决一个问题,代码牵一发而动全身。  应用场景:一旦完成基本很少改变的场景,著名的例子有Linux內核,git,以及ApacheHTTPServer...
代码星球 ·2020-03-30

pipreqs------查找python项目依赖并生成requirements.txt

  项目开发的时候,总是要搭建和部署环境,这时,就需要一个python第三方包的list,一般叫做requirements.txt。如果项目使用virtualenv环境,直接使用pipfreeze即可,但是如果项目的依赖没有维护,就会很麻烦,这时我们就需要一个叫pipreqs的工具,可以帮助我们自动生成requirem...

python基础之函数

  函数能提高应用的模块性和代码的重复利用率,可以避免代码冗余和可读性差。  函数是以功能为导向,函数内部尽量不要有print。定义:def关键词开头,空格之后接函数名称和圆括号(),最后还有一个":"。   def是固定的,不能变,他就是定义函数的关键字。   空格为了将def关键字和函数名分开,必须空(四声),当然...
代码星球 ·2020-03-30

python基础之文件操作

文件句柄=open("文件路径","编码方式","打开方式")比如:f=open("D:常用软件爵士.txt",encoding="utf-8",mode="r")content=f.read()print(content)f.close()#f是变量,表示文件的句柄。f,f_obj,obj,file_hl,file_...
代码星球 ·2020-03-30

python基础之数据类型

  格式化(format)输出中,%s代表字符串占位符,%d代表数字占位符。(python2版本中%f代表小数占位符,%d代表整数占位符。python3版本中所有数字都用%d代表占位符。)  例如:输出用户的姓名、年龄、成绩#第一种写法name=input("请输入姓名:")age=input("请输入年龄:")sco...
代码星球 ·2020-03-30

python基础之初识python

  1989年圣诞节期间,吉多·范罗苏姆为了打发时间,开发了python这门语言。真他妈牛逼。  Python崇尚优美、清晰、简单,是一门优秀并广泛使用的语言。2007年在TIOBE榜上已经排到了第四名,被越来越多的人认可并使用。    目前Python主要应用领域:web开发、云计算、人工智能、系统运维...
代码星球 ·2020-03-30

Python 3 数值计算

Python3.4.3(v3.4.3:9b73f1c3e601,Feb242015,22:43:06)[MSCv.160032bit(Intel)]onwin32Type"copyright","credits"or"license()"formoreinformation.>>>17/3#典型的除法...
代码星球 ·2020-03-29

pycharm的安装与破解

    一、首先去Pycharm官网,或者直接输入网址:http://www.jetbrains.com/pycharm/download/#section=windows,下载PyCharm安装包,根据自己电脑的操作系统进行选择,对于windows系统选择下图的框框所包含的安装...
代码星球 ·2020-03-29

python爬虫神器PyQuery的使用方法

你是否觉得XPath的用法多少有点晦涩难记呢?你是否觉得BeautifulSoup的语法多少有些悭吝难懂呢?你是否甚至还在苦苦研究正则表达式却因为少些了一个点而抓狂呢?你是否已经有了一些前端基础了解选择器却与另外一些奇怪的选择器语法混淆了呢?嗯,那么,前端大大们的福音来了,PyQuery来了,乍听名字,你一定联想到了j...

pyspider安装

官方文档上说的比较简单:pipinstallpyspider但是实际安装时还是有些问题导致无法成功。先安装PhantomJS可以依照自己的开发平台选择不同的包进行下载http://phantomjs.org/download.htmlwindows下直接下载安装包将解压出来的phantomjs.exe放到python安...
代码星球 ·2020-03-29

笔记之Python网络数据采集

非原创即采集一念清净,烈焰成池,一念觉醒,方登彼岸网络数据采集,无非就是写一个自动化程序向网络服务器请求数据,再对数据进行解析,提取需要的信息通常,有api可用,api会比写网络爬虫程序来获取数据更加方便.Chapter1初建网络爬虫一旦你开始采集网络数据,就会感受到浏览器为我们所做的所有细节,它解释了所有的html,...

解决python3 UnicodeEncodeError: 'gbk' codec can't encode character 'xXX' in position XX

从网上抓了一些字节流,想打印出来结果发生了一下错误:UnicodeEncodeError:'gbk'codeccan'tencodecharacter'xbb'inposition8530:illegalmultibytesequence代码importurllib.requestres=urllib.request....
首页上一页...407408409410411...下一页尾页