51
Dev开发社区
首页
文章
问答
工具
搜索
登录
注册
#N
爬虫实战【2】Python博客园-获取某个博主所有文章的URL列表
首先,我们来分析一下,在博主的首页里,每个文章的标题在网页源码中是什么样子的。【插入图片,文章标题1】【插入图片,文章标题2】通过这两个图片我们可以看出,博文标题所在的标签为,并且具有class属性为"postTitle2",其href属性就指向这篇博文的地址。如下面代码所示:<aid=&qu...
ymnets
·
2020-03-25
爬虫
实战
Python
博客园
获取
爬虫实战【1】使用python爬取博客园的某一篇文章
博客园比较适合爬虫初学者。我们第一个目标是爬取某个博主的所有博文。第一步,获取某一篇文章。第二步,获取该博主所有文章的url列表。第三步,下载所有文章。第一次实战,我们以博客园为例。Cnblog是典型的静态网页,通过查看博文的源代码,可以看出很少js代码,连css代码也比较简单,很适合爬虫初学者来练习。 博客...
ymnets
·
2020-03-25
爬虫
实战
使用
python
爬取
爬虫入门【8】Python连接MongoDB的用法简介
MongoDB是一种跨平台,面向文档的NoSQL数据库,提供高性能,高可用性并且易于扩展。包含数据库,集合,文档等几个重要概念。我们在这里不介绍MongoDB的特点和用法了,感兴趣的可以查一下官方文档。在此重点介绍如何使用python连接MongoDB,并通过PyMongo操作MongoDB数据库。这里默认MongoD...
ymnets
·
2020-03-25
爬虫
入门
Python
连接
MongoDB
爬虫入门【7】Python-文件的读写和JSON
最重要的open()方法将返回一个file对象,经常使用的两个参数为open(filename,mode)其中,filename为file保存的地址,可以是本地地址,相对地址或者绝对地址。mode对象为对file对象进行的操作'''对这个方法进行一些解释open(file,mode='r',buffering=None...
ymnets
·
2020-03-25
爬虫
入门
Python-
文件
读写
爬虫入门【6】Selenium用法简介
一句话,自动化测试工具。它支持各种浏览器,包括Chrome,Safari,Firefox等主流界面式浏览器。如果你在这些浏览器里面安装一个Selenium的插件,那么便可以方便地实现Web界面的测试。换句话说叫Selenium支持这些浏览器驱动。我们在Python里面安装Selenium的话,就可以调用浏览器来访问we...
ymnets
·
2020-03-25
爬虫
入门
Selenium
用法
简介
NumPy入门基础【2】
通用函数ufunc一元ufunc举例:1、abs、fabs:计算绝对值,fabs更快2、sqrt:计算各元素的平方根,相当于arr0.53、square:计算各元素的平方根,相当远arr24、exp:计算各元素的指数e的x次方...二元ufunc举例:1、add:将数组中对应的元素想加2、subtract:从第一个数组...
ymnets
·
2020-03-25
NumPy
入门
基础
Pandas入门
主要包含两个数据结构,Series和DataFrameSeries类似于一维数组,有数据和索引。默认创建整数型索引。可以通过values和index获取数据和索引。frompandasimportSeries,DataFrameimportpandasaspdimportnumpyasnpobj=Series([4,7...
ymnets
·
2020-03-25
Pandas
入门
Python PhatomJS 和Selenium动态加载页面 获取图片内容
如果您觉得感兴趣的话,可以添加我的微信公众号:一步一步学Python![](http://www.51dev.com//FileUpload/news/202003/20200325002543449.jpg)随笔中的代码拷贝自http://www.cnblogs.com/Albert-Lee/p/6275146.ht...
ymnets
·
2020-03-25
Python
PhatomJS
Selenium
动态
加载
C#基础——winform应用上传图片到SQLServer数据库
前言之前通过winform与SQLServer的交互一直局限于文本、数字等信息,都可以通过string的方式来传输,但是比如音乐、图片等特殊格式的文件要如何与SQLServer数据库进行交互呢?今天主要讲通过文件流的方式,将特殊文件转换成二进制,然后存储到数据库中。在实际的应用中,如果文件较大或者较多,直接存储在数据中...
ymnets
·
2020-03-25
基础
winform
应用
上传
图片
<jsp:include>和<%@ include %>的区别
使用<%@include%>指令元素只是将页面的内容静态的包含进来,如果被包含的文件中有JSP代码,则会执行该代码,而不管该文件是否为动态文件。 <jsp:include>动作元素动态地包含文件,如果被包含的文件是静态的,则直接包含内容,不会进行处理;而如果被包含的文件是动态地,则先执...
ymnets
·
2020-03-25
区别
Java 内部类和匿名类 实现JButton动作 ActionListener类
1importjavax.swing.*;2importjava.awt.*;3importjava.awt.event.*;45publicclassControlCircle2extendsJFrame{6privateJButtonjbtEnlarge=newJButton("Enlarge");7private...
ymnets
·
2020-03-25
Java
内部
类和
匿名
实现
Java 有理数类 分数类 Rational类的设计与实现
要实现Rational类的加减乘除,要实现其可比较性,要覆盖toString()方法,要实现不同数据类型的转换等。1packagechapter14;23publicclassRationalextendsNumberimplementsComparable{4privatelongnumerator=0;5priva...
ymnets
·
2020-03-25
Java
有理数
分数
Rational
设计
ubuntu安装cairo
查看网上大神们的各种安装经过,最后google之后执行下面两句就搞定了:apt-getinstallpython-cairo apt-getinstalllibcairo2...
ymnets
·
2020-03-25
ubuntu
安装
cairo
python定时脚本判断服务器内存
经常我们会发现服务器跑着跑着内存使用率达到了百分之八九十,或者有时候直接挂掉,在我们还没定位是哪块代码有问题导致内存占用很大的时候,可以先写个定时脚本,当服务器内存使用率达到一定值的时候,就重启一起服务,释放内存。下面这个定时脚本是每隔10s去判断一下机器的内存,假如内存使用率超过10%,就重启一下进程(正常情况下内存...
ymnets
·
2020-03-25
python
定时
脚本
判断
服务器
Linux常用操作命令
hostname或者uname-n 查看主机名lshw-classsystem 查看linux是物理机还是虚拟机cat/...
ymnets
·
2020-03-25
Linux
常用
操作
命令
首页
上一页
...
4403
4404
4405
4406
4407
...
下一页
尾页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他