#MA

Software Scalability with MapReduce

 SoftwareScalabilitywithMapReduceCraig HendersonFirstpublishedonlineApril2010Thearchitectureofa software systemisthestructureanddesignofthec...

centos 7 mount usb hard disk(ntfs format)

1.yuminstall-yepel-release* 2.yuminstall-yntfs-3g3. 命令:fdisk-l(查看磁盘分区信息)[root@devservergomeDownloads]#fdisk-lDisk/dev/sda:107.4GB,107374182400bytes,20...
代码星球 ·2020-04-05

Install hadoop on windows(non-virtual machine, such cygwin)

DownloadBeforestartingmakesureyouhavethistwosoftwaresHadoop2.7.1Java–Jdk1.7+ExtractdownloadedtarfileConfigurationStep1– Windowspathconfiguratio...

bitmap运算

所谓bitmap就是用一个bit位来标记某个元素对应的value,而key即是这个元素。由于采用bit为单位来存储数据,因此在可以大大的节省存储空间  32位机器上,一个整形,比如inta;在内存中占32bit,可以用对应的32个bit位来表示十进制的0-31个数,bitmap算法利用这种思想处理大...
代码星球 ·2020-04-05

intellij idea maven project 无法显示dependencies

Intellj自动载入Mave依赖是一个很人性化的功能,但不排除有时候会碰到问题,导致pom文件修改却没有触发自动重新载入的动作或者加载中途出现弱网的情况中断载入的,此时需要手动强制更新依赖。 如下:手动删除ProjectSettings里面的Libraries内容;在MavenProject的试图里clea...

Spark 学习(三) maven 编译spark 源码

spark源码编译scala版本2.11.4os:ubuntu 14.0464位memery3Gspark:1.1.0下载源码后解压1准备环境,安装jdk和scala,具体参考:http://www.cnblogs.com/chenfool/p/3858930.html2编译其实spark官网上说得挺详细的,...

学习Mahout (四)

 在Mahout学习(三)中,我贴了example的代码,里面生成向量文件的代码:InputDriver.runJob(input,directoryContainingConvertedInput,"org.apache.mahout.math.RandomAccessSparseVector");Inpu...
代码星球 ·2020-04-05

学习Mahout(三)

开发+运行第一个Mahout的程序代码:/***LicensedtotheApacheSoftwareFoundation(ASF)underoneormore*contributorlicenseagreements.SeetheNOTICEfiledistributedwith*thisworkforadditio...
代码星球 ·2020-04-05

学习Mahout(二)

继续上一篇博客。这篇博客介绍如何跑一下mahout自带的Helloworld程序我将mahout安装在/opt/hadoop/mahout-distribution-0.9cd/opt/hadoop/mahout-distribution-0.9/examples/binvicluster-syntheticcontr...
代码星球 ·2020-04-05

学习Mahout(一)

Mahout官方下载地址:http://apache.fayea.com/apache-mirror/mahout/环境ubuntu12.04,hadoop1.2.1,mahout0.9,memory2G 1首先解压tar包tar-zxvf/mnt/hgfs/mnt/mahout-distribution-0...
代码星球 ·2020-04-05

修改Cloudera Manager 管理机器的IP

原本在3台机器中部署了ClouderaCDH4.8的集群环境,运行状况良好,后来由于机房搬迁,导致那3台机器的ip地址被改变(hostname没有变化)。再次启动Cloudera-scm-server,登陆进去看时,发现manager根本不认识那3台机器了。无奈在“主机”的选项中需找修改的方法,...

SequoiaDB、SequoiaSQL、Cloudera Manager4.8.0、Cloudera CDH4.5 详细安装教程

1安装SequoaiDB集群1.1配置信任关系以root用户执行下面的操作1执行命令ssh-keygen然后一直回车确定即可2每台机器都打开id_rsa.pub文件vi~/.ssh/id_rsa.pub3每台机器上都打开authorized_keys文件vi~/.ssh/authorized_keys4将所有机器的公钥...

学习makefile与autoconfig笔记,持续更新

 main.c#include<stdio.h>#include"chen_print.h"intmain(intargc,char*argv){chen_print("haha,I'mcomingmakefile");return0;}chen_print.c#include<stdio....

java map 根据value排序取前n

packagecom.cnblogs.test;importjava.util.List;importjava.util.Map;importcom.google.common.collect.ImmutableMap;importcom.google.common.collect.Lists;importcom.go...

Kafka界面管理工具-kafkamanager

在上一篇文章《Linux安装Kafka》中,已经介绍了如何在Linux安装Kafka,以及Kafka的启动/关闭和创建发话题并产生消息和消费消息。这篇文章就介绍介绍Kafka管理界面(kafka-manager)的安装和使用kafka-manager是雅虎开源的apache-kafka管理工具,是用Scala写,所以在...
首页上一页...486487488489490...下一页尾页