#python爬虫

使用python抓取并分析数据—链家网(requests+BeautifulSoup)(转)

本篇文章是使用python抓取数据的第一篇,使用requests+BeautifulSoup的方法对页面进行抓取和数据提取。通过使用requests库对链家网二手房列表页进行抓取,通过BeautifulSoup对页面进行解析,并从中获取房源价格,面积,户型和关注度的数据。准备工作首先是开始抓取前准备工作,导入需要使用的...

Python异步IO --- 轻松管理10k+并发连接

前言 异步操作在计算机软硬件体系中是一个普遍概念,根源在于参与协作的各实体处理速度上有明显差异。软件开发中遇到的多数情况是CPU与IO的速度不匹配,所以异步IO存在于各种编程框架中,客户端比如浏览器,服务端比如node.js。本文主要分析Python异步IO。 Python3.4标准库有一个新模块a...

Python使用Socket写一个简单聊天程序

b2b模式的聊天工具服务端:1#链接2whileTrue:3print('等待连接...')4sock,adr=server_socket.accept()5whileTrue:6try:7#接受数据8data=sock.recv(1024)9print(adr[0]+'发来消息:',data.decode())10#...

matplotlib使用时报错RuntimeError: Python is not installed as a framework(一)

笔者在第一次安装matplotlib后运行时出现报错。1importmatplotlibasmlb2frommatplotlibimportpylabaspl345x=[1,3,5,7,6,9,10,13,16]6y=[3,4,5,7,9,0,1,2,3]78pl.plot(x,y)9pl.show()报错内容Runt...

python装饰器

装饰器是把一个函数当作参数传递给另一个函数,然后另一个函数接受后再返回一个函数。 1、简单的例子  将func1函数传递给func2,然后func2返回函数func3,f接受1deffunc1():2print("wuyagooggoogstudy")34deffunc2(func):5deffunc3():...
IT猿 ·2020-03-26

python-词云

什么是词云  词云又叫文字云,主要是对文本数据中出现频率较高的“关键词”通过不同颜色、大小的渲染,在视觉上突出表现。形成关键词渲染,从而使用户通过关键词就能了解到文本的主题。因为他形成的图片类似云层,所以称为词云。先看看效果图:   他还可以是这样的效果: 也可以是这样的效果...
IT猿 ·2020-03-26

30个深度学习库:按Python、C++、Java、JavaScript、R等10种语言分类

30个深度学习库:按Python、C++、Java、JavaScript、R等10种语言分类包括Python、C++、Java、JavaScript、R、Haskell等在内的一系列编程语言的深度学习库。一、Python1、Theano是一种用于使用数列来定义和评估数学表达的Python库。它可以让Python中深度学...

Python3 每次处理一个字符

"""Python3.4【文本】之每次处理一个字符"""test_str="mynameisbixiaopeng"forxinrange(0,len(test_str)-1):print("##通过索引遍历字符串:"+test_str[x])forxintest_str:print("##直接遍历字符串:"+x)the...

15个最受欢迎的Python开源框架

从GitHub中整理出的15个最受欢迎的Python开源框架。这些框架包括事件I/O,OLAP,Web开发,高性能网络通信,测试,爬虫等。Django:PythonWeb应用开发框架Django应该是最出名的Python框架,GAE甚至Erlang都有框架受它影响。Django是走大而全的方向,它最出名的是其全自动化的...

Python 将中文转拼音

文字转拼音 importos.pathclassPinYin(object):def__init__(self):self.word_dict={}defload_word(self,dict_file):self.dict_file=dict_fileifnotos.path.exists(self.dic...
IT猿 ·2023-05-06

Python3.4的Pillow库实现验证码图片

转自http://blog.csdn.net/bin381/article/details/41969493 fromPILimportImage,ImageDraw,ImageFont,ImageFilterimportrandom_letter_cases='abcdefghjkmnpqrstuvwxy'...

冒泡 [Python]

冒泡PythonclassBubbleSort:def__init__(self):self.initArr()definitArr(self):self.arrInfo=[60,61,27,91,92,44,13,20,24,13]defbubbleSortFromStartToEnd(self):length=le...
IT猿 ·2023-05-06

[转]Wote用python语言写的imgHash.py

#!/usr/bin/pythonimportglobimportosimportsysfromPILimportImageEXTS='jpg','jpeg','JPG','JPEG','gif','GIF','png','PNG'defavhash(im):ifnotisinstance(im,Image.Image...

Python3之切片的道理

list的切片有三个参数:起点,终点,步长list[::-1]相当于起点为最后的一个,终点为第一个,然后一次减少一个更多的看下面的测试>>>a=[0,1,2,3,4,5,6,7,8,9]>>>a[0,1,2,3,4,5,6,7,8,9]>>>a.reverse()&...
IT猿 ·2023-05-06

[转]python模块全面

http://www.cnblogs.com/wupeiqi/articles/4963027.html模块概念:用一砣代码实现了某个功能的代码集合。类似于函数式编程和面向过程编程,函数式编程则完成一个功能,其他代码用来调用即可,提供了代码的重用性和代码间的耦合。而对于一个复杂的功能来,可能需要多个函数才能完成(函数又...
IT猿 ·2023-05-06
首页上一页...370371372373374...下一页尾页