Opzioni e servizi

Nuovo!
CDN dedicata
Scelta del
datacenter
Virtualizzazione Rack VirtualeStorage
NAS
Load Balancer
Cisco ACE
Firewall
Cisco ASA

per saperne di più Tutte le opzioni

LINUX HADOOP CLOUDERA CDH3


Descrizione:
Le distribuzioni Cloudera sono distribuzioni Linux pronte all'uso per costituire un cluster Hadoop.

Che cos'è Hadoop?

Hadoop è un framework libero scritto in Java che facilita la scrittura di applicazioni da distribuire.

Alcuni componenti di Hadoop sono al momento estremamente popolari:

  • MapReduce, un algoritmo che permette di gestire in parallelo operazioni o calcoli su una gran quantità di dati;
  • HBase, un database distribuito per elevati volumi di dati;
  • HDFS, il sistema di file distribuito.

Una delle peculiarità di Hadoop è la sua capacità di funzionare anche se diversi nodi del cluster sono guasti.
http://hadoop.apache.org/

Perché la distribuzione Cloudera?

La società Cloudera è al momento una referenza del mondo Hadoop ed un contributi importante. OVH propone la versione CDH3 su Ubuntu 10.04 (64bit) che incorpora: HDFS, MapReduce, HBase, Hive, Zookeeper, Hue.
http://www.cloudera.com/

Quali sono le particolarità delle 3 versioni proposte da OVH?

  • Modo 'pseudo-distribuito': è una versione destinata ai test e allo sviluppo. L'insieme dei blocchi Hadoop è raccolto su un'unica macchina.
  • Modo 'Master': in un cluster Hadoop, dovrai avere un server 'Master' che avrà il compito di gestire il tuo cluster. Il 'Master' dispone di regole 'jobtracker' per MapReduce e 'namenode' per HDFS.
  • Modo 'Slave': destinato a tutti i nodi del tuo cluster per effettuare calcoli ('tasktracker') e archiviare dati ('datanode').




Per saperne di più:


Specifiche

Installazione di base