#关于微博

【Python】微博自动抢红包

 #-*-coding:utf-8-*-importrequestsimportjs2xmlfromlxmlimportetreeheaders={#这边cookie替换成你的cookie'Cookie':'9b','User-Agent':'Mozilla/5.0(Linux;Android4.0.4;Ga...
代码星球 ·2020-04-06

模拟新浪微博登录-原理分析到实现

原文地址:http://www.csuldw.com/2016/11/10/2016-11-10-simulate-sina-login/ 上一篇文章 小试牛刀:使用Python模拟登录知乎 介绍了如何模拟知乎登录,虽然用到了验证码信息,但请求的参数都是原封不动的传递,刚开始接触的时候,觉...

获取新浪微博cookie

之前也百度了一下如何获取新浪微博cookie,附上其中出现频率最高的教程的网址https://www.douban.com/note/264976536/?start=0#32893498自己按照上面的步骤试了一下,然后发现找不到weibo.com,然后就试了一下其他用移动端微博就可以www.weibo.cn首先也是用...
代码星球 ·2020-04-06

新浪微博热门评论爬虫采集

  本科毕业设计的时候做实验数据集的需要,自己写了一个微博转发的采集器,今晚心血来潮,整理了一下原来的代码,重新写了一个热门微博评论的的采集爬虫、效果不错。  ps:有一个想法就是采集热门微博的评论,然后在自己的账号上自动用脚本发布采集下来的热门评论、这是很有趣的一件事。  20...

新浪微博热门评论抽取规则

packageweiboextractor;importjava.util.HashSet;importjava.util.Set;importorg.apache.log4j.Logger;importorg.jsoup.Jsoup;importorg.jsoup.nodes.Document;importorg.j...

微博头像拼接

http://tp4.sinaimg.cn/uid/50/1...
代码星球 ·2020-04-05

微博转发关系采集,可拓展关键字采集,评论采集(Java版)

 微博模拟登录获取cookis,配置采集深度,采集一条微博转发关系页面,同时解析页面,生成一条微博的传播图,数据集可做微博影响力分析和传播分析gitthub:https://github.com/czeze/WeiboCrwlZEZEpackagemain;importjava.io.File;importj...

微博地址url(id)与mid的相互转换 Java版

原理:新浪微博的URL都是如:http://weibo.com/2480531040/z8ElgBLeQ这样三部分.第一部分(绿色部分)为新浪微博的域名,第二部分(红色部分)为博主Uid,第三部分(蓝色)为一串貌似随机的字符串.如果通过方法能计算出蓝色字串与返回的数组里的对应关系则好解决多了.首先分组蓝色字串,从后往前...
代码星球 ·2020-04-05

Java微博搜索关键字采集

importjava.io.File;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.Obje...

Java获取新浪微博cookies

importjava.io.BufferedReader;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream...

c#获取新浪微博登录cookie

  用新浪微博api收集数据有诸多限制,每小时只能调用官方api函数150次,认证也很麻烦。因此想通过爬网页的方式来收集数据。访问新浪微博用户网页首先需要登录,登录获取cookie后可直接获取网页数据,无需再次登录。获取登录cookie的方式具体如下:1)采用get的方式访问http://login...

关于 <mvc:argument-resolvers> 的一次使用记录

   使用场景:项目里面在做一个请求时候发现,不同的请求,有些请求会跳转到springmvc的自定义方法中,有些却不进去。自定义的方法:  <mvc:annotation-driven><mvc:argument-resolvers><beanclass="c...
代码星球 ·2020-04-05

关于集合并集优化

  线上环境遇到跨库事物的问题,历史数据状态不一致问题。由于分布式事物还不成熟,决定使用手动写自动任务每天定时执行。大概思路是查询库1的数据,然后查询库2的数据,之后去差集后再更新数据2的数据。   写完后,求差集。刚开始使用了集合的removeAll,测试环境数据量几千条没什么问题,但是...
代码星球 ·2020-04-05

关于jrebel碰到的一次问题记录

    今天使用jrebel更新gitlab的代码之后,项目总是启动报错。报一个类找不到,但是这个类在整个目录下搜索不到,在target的class目录看了下也没有对应的目录。郁闷了好久,最后同事看了下,在整个target目录搜了下,结果在target/项目名称/class下找到...
首页上一页...7576777879...下一页尾页