Data Engineer dan Data Scientist

Saya pernah membaca, "Ilmuwan dapat membuat paper dengan penelitian selama 10 (sepuluh) tahun, teknisi yang akan membangun dan mengelola penerapannya."

Dalam perkembangan role dalam pengelolaan data saat ini, data engineer dan data scientist menjadi tambahan yang cukup menyita perhatian. Tak sedikit orang mencari tahu dan menambahkan ketiganya dalam skill-set yang mereka miliki.

Data engineer merupakan pengelola data yang mengembangkan dan membangun proses data sesuai alur kerja dan perangkat yang telah ditentukan oleh arsitek atau yang disebut dengan data pipeline. Mengatur ingestion data dari sumber data masuk ke arsitektur data, memastikan kualitas data,  melakukan transformasi data sesuai dengan kebutuhan dan menyediakan data mart yang akan dikonsumsi oleh perangkat analisis sebagai bahan pengambilan keputusan.

Data scientist mengambil bagian dalam pengelolaan metode analisis yang digunakan sebagai bahan pengambilan keputusan. Metode-metode analisis yang digunakan mengkonsumsi data yang dihasilkan oleh data engineer dimana masing-masing metode harus dapat dipertanggungjawabkan sumber datanya, lulus uji kualitas dan menggunakan data ditransformasikan sesuai dengan syarat penerapan metode. Pengetahuan mengenai arsitektur, uji kualitas dan metode transformasi merupakan nilai lebih seorang data scientist untuk dapat memberikan umpan balik sebagai evaluasi tata kelola data secara keseluruhan.

Keduanya memiliki porsi masing-masing dan memegang peranan dalam menunjang tata kelola bisnis tetap berjalan. Sebagian pekerjaan sudah dimiliki oleh karyawan meskipun belum ditetapkan role yang jelas, sebagian lagi merupakan pengembangan dari metode pendekatan.

Dunia terus berkembang dan keduanya adalah contoh nyata perkembangan role dalam dunia bisnis. Dunia yang semakin haus akan data.

ePaper #01: Arsitektur Data Modern

Memulai membangun selalu diawali dengan pembangunan pondasi yang kuat. Dalam sebuah bangunan diperlukan desain arsitektur yang mampu membuatnya tetap kokoh berdiri dalam berbagai terpaan musim.

Pun demikian dengan mengembangkan sistem yang melakukan pengelolaan data. Ibarat bangunan, sistem memerlukan arsitektur yang handal sehingga mampu menyimpan dan mengelola data yang dibutuhkan dengan baik.

Pada kesempatan ini kami mencoba memaparkan desain arsitektur yang berkembang. Beberapa permasalahan juga kami munculkan, namun belum dibahas mendalam. Akan ada revisi atas dokumen ini dikemudian hari.

Silakan menuju tautan: Modern Data Architecture v0.1 untuk mengunduh dari Gdrive kami atau di sini atau melalui github. Atau silakan melalui Channel Telegram kami.

Tata Kelola Data dalam Struktur Organisasi

Conway: "Does our organizational structure lend itself to building the best product for our customer?"

Dalam pengelolaan dan analisis data, pertanyaan ini juga berlaku. Apakah struktur organisasi yang ada sudah mendukung terkelolanya data dengan baik? Apakah budaya organisasi yang ada juga mendukung?

Struktur dan budaya organisasi seringkali menjadi sebuah penghalang yang tak tampak. Bukan tak mungkin persaingan tak sehat akan muncul bila struktur organisasi tidak dinamis dan budaya organisasi yang kurang mendukung budaya kerja yang baik.

Sebagai contoh, misal ada pertanyaan. Apakah masih ada bagian dalam organisasi Anda yang mengelola data yang sama? Apakah dalam mengelola data sudah ada satu sumber terpercaya (single source of truth)? Apakah ada analis yang memiliki tugas yang sama namun beda divisi? Silakan diteliti lagi.

Tata kelola data bukan lagi persoalan teknis, namun juga sikap manajemen. Bagaimana manajemen melihat data. Bagaimana manajemen memposisikan diri sebagai pemilik data.

Inspirasi : How Your Startup's Org Chart Changes Your Product, Tomasz Tunguz