Python

Python mysql-数据库基础知识

2017-09-0519:10:55一、数据库定义从本质上讲,数据库就是信息的集合,它可以存在很长时间,往往是很多年。一般来讲,"数据库"这个词指的是有数据库管理系统管理的数据的集合。数据库管理系统DBMS将满足:允许用户使用专门的数据定义语言来创建新的数据库并指定其模式(数据的逻辑结构)。给予用户使用适当的语言来查询...

Python 爬虫-股票数据的Scrapy爬虫

2017-08-0619:52:21目标:获取上交所和深交所所有股票的名称和交易信息输出:保存到文件中技术路线:scrapy获取股票列表:东方财富网:http://quote.eastmoney.com/stocklist.html获取个股信息:百度股票:https://gupiao.baidu.com/stock/单...

Python 爬虫-Scrapy框架基本使用

2017-08-01 22:39:50一、Scrapy爬虫的基本命令Scrapy是为持续运行设计的专业爬虫框架,提供操作的Scrapy命令行。Scrapy命令行格式Scrapy常用命令采用命令行的原因命令行(不是图形界面)更容易自动化,适合脚本控制本质上,Scrapy是给程序员用的,功能(而不是界面)更重要。...

Python 爬虫-Scrapy爬虫框架

2017-07-2917:50:29Scrapy是一个快速功能强大的网络爬虫框架。Scrapy不是一个函数功能库,而是一个爬虫框架。爬虫框架是实现爬虫功能的一个软件结构和功能组件集合。爬虫框架是一个半成品,能够帮助用户实现专业网络爬虫。 一、Scrapy框架介绍5+2结构,5个主要模块加2个中间件。(1)En...
代码星球·2020-06-13

Python 调试

 2017-08-0114:19:30程序能一次写完并正常运行的概率很小,基本不超过1%。总会有各种各样的bug需要修正。有的bug很简单,看看错误信息就知道,有的bug很复杂,我们需要知道出错时,哪些变量的值是正确的,哪些变量的值是错误的,因此,需要一整套调试程序的手段来修复bug。一、print()将所有...
代码星球·2020-06-13

Python 错误与异常

2017-08-0113:40:17在程序运行过程中,总会遇到各种各样的错误。有的错误是程序编写有问题造成的,比如本来应该输出整数结果输出了字符串,这种错误我们通常称之为bug,bug是必须修复的。有的错误是用户输入造成的,比如让用户输入email地址,结果得到一个空字符串,这种错误可以通过检查用户输入来做相应的处理。...
代码星球·2020-06-13

Python map/reduce

2017-07-3118:20:59一、map函数map():会根据提供的函数对指定序列做映射。第一个参数function以参数序列中的每一个元素调用function函数,返回包含每次function函数返回值的iterator,即迭代器,使用list函数可以将之转成列表。map(function,iterable,....
代码星球·2020-06-13

Python time库

 2017-07-3116:22:42Python提供了time库可以格式化输出时间。简单讲下其中常用的函数:time.time():用于获取当前时间戳。每个时间戳都以自从1970年1月1日午夜(历元)经过了多长时间来表示。时间间隔是以秒为单位的浮点小数。importtimeprint(time.time()...
代码星球·2020-06-13

Python 进程与线程

2017-07-3019:44:25什么叫“多任务”呢?简单地说,就是操作系统可以同时运行多个任务。打个比方,你一边在用浏览器上网,一边在听MP3,一边在用Word赶作业,这就是多任务,至少同时有3个任务正在运行。还有很多任务悄悄地在后台同时运行着,只是桌面上没有显示而已。现在,多核CPU已经非...
代码星球·2020-06-13

Python 注意事项

(12)的数据类型为int,如果要表示元组,必须加上逗号,即(12,)python函数的参数传递:不可变类型:类似c++的值传递,如整数、字符串、元组。如fun(a),传递的只是a的值,没有影响a对象本身。比如在fun(a)内部修改a的值,只是修改另一个复制的对象,不会影响a本身。可变类型:类似c++的引用传递,如列表...
代码星球·2020-06-13

Python random库

2017-07-3022:26:19随机函数random库的使用频率还是蛮高的,下面我就介绍一下python中random库的使用。相较于c++,Python的random库简直不要更好用。毫无疑问,使用前需要导入random库,即importrandom。然后就可以尽情使用了。Python会自行添加种子,不需要自己去...
代码星球·2020-06-13

Python 爬虫-获得大学排名

2017-07-2923:20:24主要技术路线:requests+bs4+格式化输出importrequestsfrombs4importBeautifulSoupurl='http://www.zuihaodaxue.com/zuihaodaxuepaiming2017.html'defgethtml(url):#...

python-迭代器和生成器

 2017-07-2922:54:28在python中迭代器是指可以通过next()函数不断获得下一个数值的对象,生成器就是迭代器,list,set等是可迭代对象,不是迭代器,可以通过iter()函数来的到其迭代器。一、迭代器我们已经知道,可以直接作用于for循环的数据类型有以下几种:一类是集合数据类型,如l...
代码星球·2020-06-13

Python 格式化输出

2017-07-29 22:03:07一、使用格式符%进行格式控制%[(name)][flags][width].[precision]typecode(name):命名flags:可以有+,-,''或0。+表示右对齐。-表示左对齐。''为一个空格,表示在正数的左侧填充一个空格,从而与负数对齐。0表示使用0填...
代码星球·2020-06-13

Python 爬虫-正则表达式

2017-07-2713:52:08 一、正则表达式的概念(1)正则表达式是用来简洁表达一组字符串的表达式,最主要应用在字符串匹配中。正则表达式是用来简洁表达一组字符串的表达式正则表达式是一种通用的字符串表达框架正则表达式是一种针对字符串表达“简洁”和“特征”思...