#采集

【Hadoop离线基础总结】日志采集框架Flume

Flume介绍概述Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。它可以采集文件,socket数据包、文件、文件夹、kafka等各种形式源数据,又可以将采集到的数据sink(下沉)到HDFS、hbase、hive、kafka等众多外部存储系统中,因此,flume可以适用于大部分的日常数据采集场景...

3-1. 基于epoll架构的视频采集端设计

精通epoll架构  epoll:Linux中最优秀的多路复用机制! 与select、poll区别1.select和poll没有太大区别,除了select有文件描述符限制(1024个)。select每次调用都需要将fd集合拷贝到内核态,且监听过程遍历所有的文件位置,开销很大。2.Epoll监测无上限,在注册新...

网站运维技术与实践之数据采集、传输与过滤

一、采集点的取舍说到数据分析,首先当然是数据越全面越详细越好。因为这有助于分析得出比较正确的结果,从而做出合理的决策。1.服务器数据采集的服务器数据主要围绕着这么几个?(1)服务器负载(2)磁盘读写(3)网卡流量如何采集这些数据,可以通过zabbix监控获取。关于zabbix学习,可以参考我的这篇博客:zabbix学习...

如何用FFmpeg API采集摄像头视频和麦克风音频,并实现录制文件的功能

之前一直用Directshow技术采集摄像头数据,但是觉得涉及的细节比较多,要开发者比较了解Directshow的框架知识,学习起来有一点点难度。最近发现很多人问怎么用FFmpeg采集摄像头图像,事实上FFmpeg很早就支持通过DShow获取采集设备(摄像头、麦克风)的数据了,只是网上提供的例子比较少。如果能用FFmp...

全网微博数据每日亿级实时采集

原文链接:https://blog.csdn.net/nghuyong/article/details/85160577前言做微博数据抓取有很长一段时间了,最近把这样任务做到了极致。简单的说,就是,现在全网任何活跃用户发送的一条微博,能够实时抓取到并存入本地数据库。这项工作对微博网络舆情的监控预警,有非常重大的意义.下...

社会化海量数据采集爬虫框架搭建

随着BIGDATA大数据概念逐渐升温,如何搭建一个能够采集海量数据的架构体系摆在大家眼前。如何能够做到所见即所得的无阻拦式采集、如何快速把不规则页面结构化并存储、如何满足越来越多的数据采集还要在有限时间内采集。这篇文章结合我们自身项目经验谈一下。我们来看一下作为人是怎么获取网页数据的呢?1、打开浏览器,输入网址url访...

PHP的cURL快速入门 (小偷采集程序)

cURL是一个利用URL语法规定来传输文件和数据的工具,支持很多协议,如HTTP、FTP、TELNET等。很多小偷程序都是使用这个函数。 最爽的是,PHP也支持cURL库。本文将介绍cURL的一些高级特性,以及在PHP中如何运用它。为什么要用cURL?是的,我们可以通过其他办法获取网页内容。大多数时候,我因为...

MySQL监控主要指标及采集方法

 转载:http://www.linuxidc.com/Linux/2016-11/136788.htmMySQL监控属于DB监控的模块之一,包括采集、展示、监控告警。本文主要介绍MySQL监控的主要指标和采集方法。  MySQL监控和Redis监控的逻辑类似,可参考文章《Redis监控主要指标及采集方法&n...

采集百度搜索的方法

采集百度搜索的方法<pre><?phpfunctiondoCurl($url,$data=array(),$header=array(),$timeout=30){$ch=curl_init();curl_setopt($ch,CURLOPT_URL,$url);curl_setopt($ch,CUR...
代码星球 代码星球·2020-05-23

卡尔曼(Kalman)滤波及十种数据采集滤波的方法和编程实例

 卡尔曼(Kalman)滤波:https://blog.csdn.net/CSDN_X_W/article/details/90289021十种数据采集滤波的方法和编程实例:https://wenku.baidu.com/view/e40d402a856a561252d36feb.html...

数据采集工具:八爪鱼

  一.八爪鱼介绍二.安装八爪鱼三.采集原理四.快速入门五.登陆六.基本排错七.提取、导出数据   八爪鱼是一款通用的网页数据采集器,能够采集98%的网页。可简单快速地将网页数据转化为结构化数据,存储为EXCEL或数据库等多种形式,并且提供基于云计算的大数据云采集解决方案。八爪鱼作为一款通...
代码星球 代码星球·2020-04-29

AD模块电压采集电路

  之前一直没搞明白模拟电压转换电路,不知道应该怎么计算转换电压,最近一个项目中用到几处模拟电压的采集,硬件是由其他同事设计的,转换公式也是他给的,记录一下;   24V电压采集:  公式:Vout=Vin/(100+10)*10/(2+100)*100    12V电压采集:  公式:Vout=Vin/(1...

大数据平台的数据采集

数据采集的设计,几乎完全取决于数据源的特性,毕竟数据源是整个大数据平台蓄水的上游,数据采集不过是获取水源的管道罢了。在数据仓库的语境下,ETL基本上就是数据采集的代表,包括数据的提取(Extract)、转换(Transform)和加载(Load)。在转换的过程中,需要针对具体的业务场景对数据进行治理,例如进行非法数据监...
代码星球 代码星球·2020-04-15

火车头采集器采集文章使用教程实例

任务:采集某一个指定页面的文章包括(标题、图片、描述、内容)导入到自己网站数据库对应栏目(栏目id为57),数据库字段分别(title,thumb,descrption,content)。页面里面第一张图作为文章缩略图,这边一个获取缩略图名称并添加上对应网站路径放入数据库thumb字段,另一个是下载下本地,统一上传到指...

无驱摄像头-directshow采集方案

最近在下载到得directshow视频采集程序中,几乎所有的程序都不支持我的"无驱摄像头",nnd,我还以为是自己的摄像头有问题呢,但是在qq中可以用其进行视频聊天哦,所以就仔细看了看directshow中视频是如何采集的。看了之后才明白,原来无驱摄像头中只提供了videosource接口,因而不能直接与videore...
首页上一页12345...下一页尾页