51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#Python
python爬虫之Phantomjs安装和使用
PhantomJS是一个无界面的,可脚本编程的WebKit浏览器引擎。它原生支持多种web标准:DOM操作,CSS选择器,JSON,Canvas以及SVG。 1、无UI界面的网站测试 2、屏幕快照 3、页面操作自动化 官方文档:http://phantomjs.org/api/command-lin...
代码星球
·
2020-04-02
python
爬虫
Phantomjs
安装
使用
python爬虫之win7Mongod安装使用
1、下载地址:https://www.mongodb.com/download-center#community下载完成以后下一步下一步安装。 安装路径还需要建立一个数据库存储位置C:mongodbdatadb 2、添加环境变量,然后打开cmd执行如下命令告诉数据库数据存储位置。#mongod--d...
代码星球
·
2020-04-02
python
爬虫
win7Mongod
安装
使用
python爬虫之PyQuery的基本使用
PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的,都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择,PyQuery是Python仿照jQuery的严格实现。语法与jQuery几乎完全相同,所以不用再去费心去记一些奇怪的方法了。官网地址:http://pyquery.readth...
代码星球
·
2020-04-02
python
爬虫
PyQuery
基本
使用
python爬虫之xpath的基本使用
一、简介 XPath是一门在XML文档中查找信息的语言。XPath可用来在XML文档中对元素和属性进行遍历。XPath是W3CXSLT标准的主要元素,并且XQuery和XPointer都构建于XPath表达之上。 参照二、安装pip3installlxml 三、使用 1、导入fromlxmlimpor...
代码星球
·
2020-04-02
python
爬虫
xpath
基本
使用
python爬虫之git的使用(windows下pycharm使用)
相信很多同学学会了git或者github以后都不知道怎么跟windows上的pycharm连在一起工作,那么下面我们开始介绍简单的安装和使用方法。一、安装 1、首先你的有一个github的账户。注册什么的就不在这里说了,百度一大片。 2、配置pycharm的github信息,一定要点击t...
代码星球
·
2020-04-02
使用
python
爬虫
git
windows
python爬虫之git的团队协作
一、Git实践: commit,push,pull,status,add基本是最常用的几个命令。 1、首先我在github上创建了一个项目,然后我在本地的文件建立了一个普通的目录(git_data)。使用gitclone命令将github远程仓库在本地克隆出一个本地仓库。 2、接着,既然是项目可能不是一个人完成的...
代码星球
·
2020-04-02
python
爬虫
git
团队
协作
python爬虫之git的使用(origin说明)
1、首先我们回忆两个命令#gitremoteaddorigin 远程仓库链接#gitpush-uoriginmaster 我们一起看看这个命令,git是git的一级命令,push就是下载,-u应该使用用账户验证maser就是分支的名字(前面我们说过),那么这个origin是个什么鬼? 大家看看...
代码星球
·
2020-04-02
python
爬虫
git
使用
origin
python爬虫之git的使用(coding.net的使用)
1、注册coding.net账号,然后登陆。2、创建项目 套路和github都一样。1.1、我们在远程仓库上创建了一个仓库,这样的话,我们需要在本地随便建立一个文件普通文件夹,进去以后,执行gitclone链接这个命令,就可以把远程仓库的版本库同步下来。 &nbs...
代码星球
·
2020-04-02
使用
python
爬虫
git
coding.net
python爬虫之git的使用(github的使用)
上面博文中我们简单的了解了一下基本的git操作,但是我们都是将代码放到了本地的仓库里面,但是如果我们是一个团队开发的话,肯定不会放到每个人的本地,必须得有个统一的地方存放代码,国外的大家都在使用github,很多的开源项目都在github上面,但是这个使用起来呢一是得翻墙,二是公开的仓库是免费的,私有的...
代码星球
·
2020-04-02
使用
python
爬虫
git
github
python爬虫之git的使用
一、简单认识:1、初始化文件夹为版本控制文件夹,首先建立一个文件夹,进入这个文件夹以后输入gitinit初始化这个文件夹。2、Git几种位置概念1、本地代码:本地更改完代码以后,虽然是存放在git的文件夹里面,但是没有添加到待提交列表里面。2、待提交列表:执行完gitadd文件名,但是未执行gitcommi...
代码星球
·
2020-04-02
python
爬虫
git
使用
python爬虫之git的安装
一、初始1、发展历史*最开始没有对代码的管理,导致很多东西混乱和丢失。*后来大家想了一个办法,用最简单最笨的方法,各种复制文件夹。*然后就出现了版本控制的工具。 1、单机版:RCS(1982),SCCS(1972) 2、客户端-服务器:CVS(1986)Subversion(2000) 3、分布式(多...
代码星球
·
2020-04-02
python
爬虫
git
安装
python爬虫之初始Selenium
1、初始 Selenium[1] 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7,8,9,10,11),MozillaFirefox,Safari,GoogleChrome,Opera等。这个工具的主要功能包括:测试...
代码星球
·
2020-04-02
python
爬虫
初始
Selenium
python爬虫之MongoDB测试环境安装
一. 下载从http://www.mongodb.org/downloads地址中下载:mongodb-linux-x86_64-2.4.11.tar 二. 安装1>设置mongoDB目录[root@vm13home]#cd/home/apps &n...
代码星球
·
2020-04-02
python
爬虫
MongoDB
测试
环境
python爬虫之pandas
PythonDataAnalysisLibrary或pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为...
代码星球
·
2020-04-02
python
爬虫
pandas
python爬虫之正则表达式
正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:RegularExpression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配...
代码星球
·
2020-04-02
python
爬虫
正则
表达式
首页
上一页
...
346
347
348
349
350
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他