Teori Kompleksitas dan Strategi Data Analitik

TUGAS 3 BIG DATA

Nama: Bella Salsabilla

NIM   : 1401164210

Kelas: MB-40-05

A. Kompleksitas sistem dalam Kehidupan sehari-hari

Salah satu contoh dari kompleksitas sistem dalam kehidupan sehari-hari yaitu kegiatan melakukan sebuah riset. Kegiatan melakukan sebuah riset ini dikategorikan kedalam kompleksitas sistem yang kompleks karena hubungan sebab akibat yang ada tidak terlihat jelas. Maka dari itu diperlukan waktu yang cukup untuk melakukan riset tersebut. Ketika melakukan suatu riset maka akan banyak bermunculan kemungkinan yang dapat terjadi selama proses riset berlangsung, kemudian ketika keputusan telah akan dibuat maka terbukalah kemungkinan baru yang harus menjadi pertimbangan. Banyaknya kemungkinan yang ada selama proses riset menyebabkan ketidakpastian dan keberagaman dalam menentukan hasil riset, hal inilah yang menyebabkan kegiatan melakukan riset tergolong kedalam sistem yang kompleks.

 

B. Cynefin Framework

Cynefin Framework pada dasarnya digunakan untuk mengidentifikasi masalah berdasarkan hubungan antara penyebab dan akibatnya. Berikut adalah 4 jenis problem berdasarkan Cynefin Framework.

  1. Simple (Sederhana)

Masalah yang hubungan antara penyebab dan akibatnya sangat jelas dan erat. Untuk mengatasinya tidak memerlukan analisa dan pemikiran yang rumit. Pendekatan yang dilakukan adalah Sense->Categorize->Respond. Artinya kita tinggal melihat situasinya bagaimana, kemudian mengidentifikasi akar masalahnya termasuk kategori apa, kemudian langsung merespon/mencabut akar masalahnya. Dengan adanya kategori atau kelompok penyebab/akar masalah yang sudah jelas tersebut, maka untuk jenis problem yang simple sudah ada sekumpulan BEST PRACTICES. Apa yang berlaku efektif di tempat lain, bisa dipakai juga di sini. Estimasi waktu yang dibutuhkan mudah dikalkulasi. Contoh: Handphone mati setelah 2 hari dipakai terus menerus. Tidak bisa melakukan panggilan telepon, tidak ada dial tone.

  1. Complicated (Rumit)

Masalah yang hubungan antara penyebab dan akibatnya belum jelas. Sehingga untuk mengetahui penyebabnya, butuh analisa lebih lanjut. Penyebab/akar masalahnya bisa lebih dari satu kemungkinan dan bisa saling berkaitan. Sumber pengetahuan tersedia dan dapat diajarkan. Karena membutuhkan pemeriksaan dan analisa, maka pendekatan yang dilakukan adalah Sense->Analyze->Respond. Kita lihat dulu situasinya untuk mendefinisikan masalahnya, kemudian kita analisa apa saja kemungkinan yang menjadi penyebabnya, kemudian merespon atau mengambil tindakan yang diperlukan. Untuk problem jenis ini, kita memiliki sekumpulan GOOD PRACTICES. Kita bisa mengikuti tutorial/knowledge base dan kemungkinan besar penyebabnya dapat diketahui. Estimasi waktu untuk problem jenis ini agak sukar dikalkulasi. Hanya bisa melakukan estimasi berdasarkan waktu maksimum yang pernah dilakukan sebelumnya. Mungkin antara 1 hari atau 2 hari. Mungkin juga 1 minggu sampai 2 minggu. Contoh: Koneksi internet yang lambat ke situs-situs tertentu saja. Aplikasi mengalami connection timeout.

  1. Complex Problem

Masalah yang hubungan antara penyebab dan akibatnya tidak jelas. Sehingga untuk mengatasinya membutuhkan perenungan, kontemplasi, atau mencari petunjuk. Sumber pengetahuan mungkin tersedia tapi sangat terbatas. Karena membutuhkan kontemplasi, pendekatan yang dilakukan adalah Probe->Sense->Respond. Jadi kita harus coba-coba dulu. Siapa tahu berhasil. Jika ternyata berhasil, baru kita bisa lihat mengapa berhasil kemudian merespon/menunjukkan penemuan tersebut. Solusi yang bisa digunakan orang lain belum tentu bisa digunakan untuk kasus kita. Estimasi waktu untuk problem jenis ini sangat sulit dikalkulasi. Kita tidak bisa mengira-ngira kapan problem tersebut akan berhasil diatasi. Contoh: Membuat software baru. Mendesain pesawat. Menjalankan bisnis.

  1. Chaos (Kacau)

Masalah yang tidak memiliki hubungan antara penyebab dan akibat. Sehingga untuk mengatasinya bukan dengan berpikir atau kontemplasi. Tapi langsung bertindak tanpa banyak berpikir. Pendekatan yang dilakukan adalah Act->Sense->Respond, yaitu kita bertindak dulu kemudian melihat situasinya baru bisa mengambil keputusan. Estimasi waktunya tidak akan bisa diukur. Contoh: Server crash, database corrupt, disk failed, kebakaran, kerusuhan, mendirikan bisnis baru, penyerbuan, peperangan.

 

 C. Studi Kasus Strategi Perusahaan dalam Memanage Big Data Analytic

Dengan bantuan perangkat lunak big data dan analitik, data diubah menjadi sebuah hal yang menguntungkan. Bisnis travel seperti Traveloka, termasuk salah satu bisnis yang memanfaatkan data untuk improvisasi dan meningkatkan kepuasan penggunanya. Mereka memanfaatkan data untuk menghadirkan beberapa penawaran menarik dan untuk mengerti kebutuhan para penggunanya. Dalam bisnis travel, dibutuhkan data mengenai kebiasaan dan kebutuhan pengguna. Dengan demikian penyedia jasa travel dapat menawarkan sesuatu yang berkaitan, dekat, dan sesuai dengan apa yang dibutuhkan oleh pengguna. Hal tersebut membawa untung dalam segi bisnis di dalamnya (hotel, tiket, dan wisata). Karena mereka dapat menyasar langsung pelanggan dengan kriteria yang sama. Tidak hanya bisnis, namun pengguna juga menjadi untung dalam segi efisiensi waktu maupun efisiensi biaya.

Dengan menganalisis big data, perusahaan dapat mengetahui pola, trend, preferensi dan kebiasaan pelanggan, serta dengan analisis tersebut perusahaan dapat memberikan produk dan layanan terbaik yang sesuai dengan kebutuhan para pelanggan mereka. Selain itu data tersebut juga mempermudah manajemen dalam menyusun strategi pemasaran dan membuat program promosi dengan partner. Perusahaan mengembangkan sebuah sistem terintegrasi yang dapat meng-handle data-data yang ada untuk selanjutnya diolah untuk mendapatkan wawasan yang bisa digunakan sebagai pertimbangan sebelum mengambil keputusan.

Berikut ini akan dijelaskan teknologi yang digunakan Traveloka untuk menyimpan, mengolah, dan menganalisa data.

  1. R

Dplyr dan data.table merupakan library R yang digunakan untuk data wrangling, mirip seperti query SQL. Untuk readiblity, dplyr lebih baik dibandingkan data.table. Sedangkan, data.table lebih cepat untuk proses data yang lebih besar. Dengan adanya sparklyr pun, query data dari Data Lake dengan gaya dplyr bisa lebih digunakan secara langsung ketimbang dengan bahasa SQL. Selain itu, library R lain yang digunakan di Traveloka ada ggplot2 untuk visualisasi data statis, Shiny untuk visualisasi data interaktif, dan caret maupun e1071 untuk machine learning.

  1. Python

Sebagai multipurpose language, Python bisa digunakan untuk banyak hal. Di Traveloka, Python digunakan untuk proses ETL, lempar data antar database, transformasi data/pembersihan maupun machine learning. Dibandingkan R, Python memiliki ekosistem machine learning yang lebih padu dengan adanya scikit-learn. Untuk data wrangling, ada pandas dengan filosofi seperti halnya kelas data frame yang ada di R. Terlebih lagi, Python juga digunakan untuk keperluan deep learning via TensorFlow yang memang a big no kalau dilakukan di R. Saya pun penasaran seperti apakah use case deep learning yang ada di Traveloka.

  1. Dataiku

Dataiku berperan sebagai platform agar sesama data scientist saling berkolaborasi meskipun bahasa pemrograman yang digunakan berbeda-beda. Bukan hanya itu, Dataiku juga bisa menjadi jembatan untuk data engineer, data scientist maupun business analyst untuk saling berkolaborasi.

  1. Database dan Penyimpanan

Data disimpan di Cloud via AWS maupun Google Cloud. Ada berbagai macam database yang digunakan di Traveloka baik RDBMS maupun NoSQL dengan tujuan yang juga berbeda-beda. Untuk RDBMS, ada MemSQL, Redshift dan PostgreSQL. Sedangkan untuk NoSQL, ada DynamoDB dan MongoDB. Untuk query engine dari data lake AWS S3 bisa menggunakan Qubole, Presto, Hive atau mungkin menggunakan SparkSQL.

  1. Teknologi Lainnya

Traveloka juga menggunakan bahasa pemgrograman seperti Julia yang bisa dibilang masih baru. Java yang merupakan core dari Big Data juga digunakan untuk membuat aplikasi untuk presentation layer yang kemungkinan besar digunakan business users

Sumber:

Sasmita, I. R. (2014). 4 Jenis Problem – The Cynefin Framework. Retrieved from https://ilhamrizqi.com/2014/09/4-jenis-problem-cynefin-framework/. Accessed Sept, 2018.

Ridha, R. (2017). Mengintip Ekosistem Data di Traveloka. Retrieved from https://www.datascience.or.id/detail_artikel/58/mengintip-ekosistem-data-di-traveloka. Accessed Sept, 2018.

1 comment

Leave a Reply

Your email address will not be published. Required fields are marked *