Apa saja tools yang digunakan dalam sains data?

0 bilangan lihat

Antara alat penting dalam sains data termasuklah:

  • Python: Bahasa pengaturcaraan serba guna.
  • R: Untuk analisis statistik dan visualisasi data.
  • SQL: Bahasa pertanyaan untuk pengurusan pangkalan data.
  • Jupyter Notebook: Persekitaran interaktif untuk kod.
  • Tableau: Perisian visualisasi data.
  • Hadoop: Rangka kerja pemprosesan data besar.
  • TensorFlow: Perpustakaan untuk pembelajaran mesin.
  • Spark: Enjin pemprosesan data berkelajuan tinggi.
Maklum Balas 0 bilangan suka

Fuh, bila sebut pasal tools sains data ni, rasa macam banyaknya nak kena belajar! Macam mana nak hafal semua ni? Nasib baiklah ada internet, bolehlah Google bila lupa. 😅

Okay, kalau nak cerita pasal tools yang selalu orang guna dalam sains data ni… hmm, macam-macam ada. Antaranya yang paling popular, rasanya lah… Python. Betul tak? Macam pisau Swiss Army, boleh buat macam-macam. Saya pun dulu mula belajar Python jugak. Ingat lagi masa tu susah gila nak faham coding, rasa macam nak give up je. Tapi bila dah dapat, rasa puas hati lain macam! Sekarang ni, Python ni dah macam kawan baik dah. Hehe.

Lepas tu, ada R pula. Kalau bab statistik dan visualisasi data, memang R lah pakarnya. Graf-graf cantik semua boleh buat. Pernah tengok graf COVID-19 yang warna-warni tu? Haa, mungkin guna R lah tu. Saya sendiri kurang sikit guna R ni, lebih prefer Python. Tapi kalau kawan-kawan yang suka statistik, memang diorang recommend R habis-habisan.

SQL pula… ni memang wajib tahu lah kalau nak kerja dengan database. Macam mana nak extract data kalau tak tahu SQL kan? Saya dulu masa internship, kena belajar SQL ni cepat-cepat. Kelam-kabut jugak lah mulanya, tapi lama-lama okay lah. Asyik terlupa syntax je lah dulu.

Jupyter Notebook pun best! Macam playground untuk coding. Boleh run code sikit-sikit, tengok output terus. Senang nak experiment. Saya selalu guna Jupyter Notebook ni untuk buat analysis cepat-cepat.

Pastu, ada Tableau. Ni kalau nak buat visualisasi data yang gempak, interaktif, memang guna Tableau lah. Drag and drop je, senang gila. Tapi, saya rasa macam mahal sikit software ni. Ada alternatif lain macam Power BI, tapi saya tak pernah cuba lagi.

Hadoop… ni untuk Big Data. Dulu masa belajar Big Data, pening jugak kepala nak faham Hadoop ni. Konsep-konsep dia macam complicated sikit. Tapi power lah kalau nak process data yang banyak gila.

TensorFlow dan Spark pula… ni lebih kepada machine learning. Saya baru nak belajar TensorFlow ni. Nampak macam menarik. Spark pula, dengar cerita laju gila. Boleh process data dengan cepat.

Banyak kan tools dia? Jangan risau, tak perlu tahu semua pun. Focus pada yang penting dulu, ikut bidang yang kita minat. Macam saya, lebih focus pada Python dan SQL buat masa ni. Yang lain-lain tu, belajar sikit-sikit bila perlu. Janji kita faham konsep asas sains data, tools tu cuma alat je. Betul tak? 😉