Dokumentasi Pengembangan Big Data

Dalam pengembangan Fasilitas Riset dalam Teknologi Big Data diperlukan adanya acuan dalam penerapan setiap perangkat yang ada. Atau minimal dapat sebagai bahan awal pengguna dalam penerapan.

Atas keperluan itulah dibuatlah project sebagai jalur distribusi dokumentasi yang bisa diakses oleh semua orang di github dengan nama big-data-hadoop. Dalam hal pemilihan nama mengacu kepada basis teknologi yang digunakan, yaitu Apache Hadoop.

Baru beberapa 2 (dua) perangkat yang telah selesai dibuat paparan singkatnya, yaitu Hive dan Pig.

Instalasi Hadoop dengan Ambari di Docker [1]

Selain penggunaan CDH dari Cloudera saat ini dilakukan riset penggunaan infrastuktur di atas Docker. Menurut referensi beberapa kolega digunakanlah distribusi Hortonworks yang script-nya telah disiapkan oleh SequenceIQ, yang telah diakuisisi oleh Hortonworks.

Persiapan

Silakan clone proyek dengan git :

$ git clone https://github.com/kalamangga-net/docker-ambari

Continue reading Instalasi Hadoop dengan Ambari di Docker [1]