Python

Python 爬虫-BeautifulSoup

2017-07-2610:10:11BeautifulSoup可以解析html和xml格式的文件。Beautiful Soup库是解析、遍历、维护“标签树”的功能库。使用BeautifulSoup库非常简单,只需要两行代码,就可以完成BeautifulSoup类的创建,这里命名为sou...
代码星球·2020-06-13

Python 爬虫-图片的爬取

2017-07-2522:49:21importrequestsimportosurl='https://wallpapers.wallhaven.cc/wallpapers/full/wallhaven-278989.jpg'root='E://pics//'path=root+url.split('/')[-1]d...
代码星球·2020-06-13

Python 爬虫-Robots协议

2017-07-2521:08:16一、网络爬虫的规模二、网络爬虫的限制•来源审查:判断User‐Agent进行限制  检查来访HTTP协议头的User‐Agent域,只响应浏览器或友好爬虫的访问•发布公告:Robots协议  告知所有爬虫网站的爬取策略,要求爬虫遵守三、Robots协议作用:网站告...
代码星球·2020-06-13

Python 爬虫-Requests库入门

2017-07-2510:38:30response=requests.get(url,params=None, **kwargs)url: 拟获取页面的url链接∙ params: url中的额外参数,字典或字节流格式,可选params参数是字典或字节序列,作为参数增加到url...

Python XML

2017-07-2422:58:16xml和json都是数据交互的格式。想象一下,python中的字典数据要传给java使用,但是众所周知的是java中只有hashmap数据结构,并没有字典,所以在传输时需要对python中的数据进行序列化操作,就是讲字典数据转成xml或者json格式,在java接收端,进行反序列化,...
代码星球·2020-06-13

Python BeautifulSoup的使用

2017-07-2422:39:14 Python3中的beautifulsoup引入的包是bs4importrequestsfrombs4import*r=requests.get('http://jwc.seu.edu.cn/')soup=BeautifulSoup(r.text,'html.parser...
代码星球·2020-06-13

Python 网络编程和Socket

2017-07-2420:43:49Socket又称"套接字",应用程序通常通过"套接字"向网络发出请求或者应答网络请求。Http协议主要的操作流程是request-response即请求响应。我们可以利用python中的socket库完成连接的建立,然后使用GET方法获取服务器端的数据。一、使用socket获取网页i...
代码星球·2020-06-13

Python string常用函数

2017-07-0323:26:081、.replace(self,old,new,count=-1)replace()函数将旧字符串替换为新字符串,最后一个参数count为可选项,表示替换最多count次(小于count)。注意这种替换返回替换后的字符串,源字符串是不改变的。s='ABCDEF'out=s.repla...
代码星球·2020-06-13

Python 数据结构

2017-06-2414:34:391、整数和长整数 2、浮点数 3、复数,形如1+4j等 4、字符串单引号双引号均可,也有三引号的写法,三引号的作用是为了实现多行字符串的操作常用函数:len():得到字符串的长度 5、列表list打了激素的数组,相比于c++里的数组,列表要强悍...
代码星球·2020-06-13

Python 基础语法

2017-06-2409:50:14一、变量Python中的变量名的要求和C++基本一致(1)只能以字母或者下划线作为开头,不能以数字开头(2)标识符的其他部分可以有字母下滑线和数字组成,不允许有特殊字符出现如$等(c++中可以有$,且可以放在首位)(3)不允许有空格,不允许有-分割python中只需要给变量赋值而不需...
代码星球·2020-06-13

Python 字节与字符串的转换

html=urlopen("http://www.cnblogs.com/ryanzheng/p/9665224.html")bsObj=BeautifulSoup(html,features="lxml")withopen('cnblog.html','wt')asfout:fout.write(bsObj)由于Be...

Python 操作 PostgreSQL 数据库

我使用的是Python3.7.0 PostgreSQL可以使用psycopg2模块与Python集成。sycopg2是用于Python编程语言的PostgreSQL数据库适配器。 psycopg2是非常小,快速,稳定的。您不需要单独安装此模块,因为默认情况下它会随着Python2.5.x版本一起发布...

Python 模块搜索路径

Python会在什么地方寻找文件来导入模块?使用命名为path变量的存储在标准sys模块下的一系列目录名和ZIP压缩文件。你可以读取和修改这个列表。下面是在我的Mac上Python3.3的sys.path的内容:>>>importsys>>>forplaceinsys.path:.....
代码星球·2020-06-13

Python 连接数据库失败

什么是PyMySQL?PyMySQL是在Python3.x版本中用于连接MySQL服务器的一个库,Python2中则使用mysqldb。PyMySQL遵循Python数据库APIv2.0规范,并包含了pure-PythonMySQL客户端库。在使用PyMySQL之前,我们需要确保PyMySQL已安装。PyMySQL下载...

从shell(终端)中退出python

从shell(终端)中退出python:1、输入命令行:$exit()2、快捷键:ctrl+Z...
代码星球·2020-06-13