Apakah kalian pernah mengumpulkan data? Bagaimana cara kalian mengumpulkan dan menampilkan data tersebut agar mudah dipahami semua orang? Data yang telah terkumpul di analisis untuk tujuan tertentu kemudian ditampilkan secara visual agar semua orang dapat memahami data tersebut.
Bagaimana cara mengumpulkan banyak data sekaligus dan langsung menampilkan visual datanya? Untuk menjawab pertanyaan tersebut, mari pelajari dalam bab ini.
Tujuan Pembelajaran
Setelah mempelajari materi pada bab ini, kalian diharapkan mampu :
- menggunakan alat bantu untuk menulis, menjalankan, dan mengembangkan program analisis data;
- memahami berbagai cara pengkoleksian data, khususnya secara otomatis melalui perangkat;
- memahami transformasi data;
- melakukan interpretasi data dan memahami aspek privasi dan keamanan data.
Link Materi :
Soal dikerjakan pada kolom komentar :
Selesaikan soal berikut dengan singkat dan benar !
- Apa yang dimaksud dengan scraping dalam analisis data? Jelaskan!
- Sebutkan dan jelaskan cara melakukan visualisasi data menggunakan Google Colab dengan bahasa pemrograman Python!
- Sebutkan perintah pustaka (library) yang digunakan pada pemrograman Python beserta fungsinya! (minimal 5)
- Mengapa untuk menampilkan suatu data diperlukan diagram/grafik? Jelaskan beserta alasannya!
Nama : Nayzilla Aurelia Putri
BalasHapusKelas : X KA 2
Absen : 26
Jawaban :
1.) Scraping merupakan suatu bentuk penyajian data dari berbagai informasi untuk diolah sehingga diperoleh rangkuman dari informasi. Untuk dapat membuat suatu scraper maka perlu suatu bahasa pemrograman yaitu menggunakan bahasa pemrograman Python karena memiliki banyak fungsi untuk melakukan analisis data. Dalam menjalankan program Python diperlukan alat bantu yaitu Google Colab yang dapat mengambil data secara online.
2.) Visualisasi data selalu berkaitan dengan diagram yang bertujuan untuk mempermudah memahami suatu data. Pada bahasa pemrograman Python, visualisasi data dapat dilakukan dengan data yang berasal dari web scraping atau data mentah yang dimasukkan secara manual.
Matplotlib.pyplot adalah kumpulan fungsi untuk membuat gambar, area plot dalam gambar atau menambah label pada plot. Library tersebut ditambahkan pada awal kode program dengan penulisan seperti berikut.
import matplotlib.pyplot as plt
Visualisasi data pada Python menggunakan Matplotlib untuk membuat diagram garis, diagram batang, diagram lingkaran dan diagram titik (scatter).
3.) Perintah pustaka (Library) yang digunakan pada pemrograman Python beserta fungsinya:
1. Scipy
Kegunaanya adalah untuk menangani operasi aljabar dan matriks serta operasi matematika lainya. Disini kamu dapat menangani sejumlah operasi matematika yang lebih kompleks daripada menggunakan library math bawaan Python.
2. Numpy
Numpy memiliki kegunaan untuk operasi vektor dan matriks. Fiturnya hampir sama dengan MATLAB dalam mengelola array dan array multidimensi. Numpy merupakan salah satu library yang digunakan oleh library lain seperti Scikit-Learn untuk keperluan analisis data.
3. Pandas
Dengan menggunakan sistem dataframe, kamu dapat memuat sebuah file ke dalam tabel virtual ala spreadsheet dengan menggunakan Pandas. Dengan menggunakan Pandas, kamu dapat mengolah suatu data dan mengolahnya seperti join, distinct, group by, agregasi, dan teknik seperti pada SQL. Hanya saja dilakukan pada tabel yang dimuat dari file ke RAM.
Pandas juga dapat membaca file dari berbagai format seperti .txt, .csv, .tsv, dan lainnya. Anggap saja Pandas adalah spreadsheet namun tidak memiliki GUI dan punya fitur seperti SQL.
4. Matplotlib
Data yang kita olah tentu tidak elok apabila ditampilkan begitu saja dengan tabel hitam saja kepada investor atau manajemen. Bila ditampilkan dengan sejumlah grafik berwarna pasti mereka akan lebih tertarik melihatnya. Matplotlib membantu kamu untuk memvisualisasikan data dengan lebih indah dan rapi.
Ada plot untuk menampilkan data secara 2D atau 3D. Sehingga kamu dapat menampilkan data yang telah kamu olah sesuai kebutuhan. Matplotlib pun terintegrasi dengan iPython Notebook atau Jupyter dimana kamu dapat membuat sebuah buku interaktif yang dapat diberi penjelasan dan kode yang disisipkan begitupun hasil plottingnya.
Matplotlib adalah library paling banyak digunakan oleh data science untuk menyajikan datanya ke dalam visual yang lebih baik.
5. Scikit-Learn
Machine learning ada yang berbasis statistika ada juga yang tidak. Salah satunya adalah support vector machine dan regresi linier. Mungkin bagi sebagian orang sudah biasa menulis sendiri library untuk implementasi kedua algoritma tadi. Tapi untuk membuatnya dalam waktu singkat tentu butuh waktu yang tidak sedikit pula.
Scikit-Learn memberikan sejumlah fitur untuk keperluan data science seperti:
• Algoritma Regresi
• Algoritma Naive Bayes
• Algoritma Clustering
• Algoritma Decision Tree
• Parameter Tuning
• Data Preprocessing Tool
• Export / Import Model
• Machine learning pipeline
dan lainnya
Scikit-Learn sudah teruji dan memiliki dokumentasi yang super lengkap. Bahkan kontributornya pun banyak. Scikit-Learn pun menyediakan ekstensi untuk fuzzy logic dan computer vision.
4.) Visualisasi data selalu berkaitan dengan diagram yang bertujuan untuk mempermudah memahami/menganalisa suatu data dan menyajikan presentasi. Visualilasi data dapat dilakukan menggunakan Python dengan library Matplotlib.
Nama: Nabila arien Pramitha
BalasHapusKelas: X-KA 2
No absen: 22
Jawaban:
1).Scraping adalah suatu bentuk penyajian data dari berbagai informasi yang diolah untuk memperoleh rangkuman informasi tersebut
2).Visualisasi data selalu berkaitan dengan diagram yang bertujuan untuk mempermudah memahami suatu data. Pada bahasa pemrogramanya python, Visualisasi data dapat di lakukan dengan data yang berasal dari New Scraping atau data mentah yang di masukan secara manual.
Matplotlib.pyplog adalah kumpulan fungsi untuk membuat gambar, area plot dalam gambar atau menambah label pada plot. Library tersebut ditambahkan pada awal kode program dengan penulisan seperti berikut import matplotlib. Pyplot as plt.
Visualisasi data pada python menggunakan diagram garis, diagram batang, diagram lingkaran, dan diagram titik(scatter)
3).Perintah pustaka (Library) yang digunakan pada pemrograman Python beserta fungsinya:
1. Scipy
Kegunaanya adalah untuk menangani operasi aljabar dan matriks serta operasi matematika lainya. Disini kamu dapat menangani sejumlah operasi matematika yang lebih kompleks daripada menggunakan library math bawaan Python.
2. Numpy
Numpy memiliki kegunaan untuk operasi vektor dan matriks. Fiturnya hampir sama dengan MATLAB dalam mengelola array dan array multidimensi. Numpy merupakan salah satu library yang digunakan oleh library lain seperti Scikit-Learn untuk keperluan analisis data.
3. Pandas
Dengan menggunakan sistem dataframe, kamu dapat memuat sebuah file ke dalam tabel virtual ala spreadsheet dengan menggunakan Pandas. Dengan menggunakan Pandas, kamu dapat mengolah suatu data dan mengolahnya seperti join, distinct, group by, agregasi, dan teknik seperti pada SQL. Hanya saja dilakukan pada tabel yang dimuat dari file ke RAM.
Pandas juga dapat membaca file dari berbagai format seperti .txt, .csv, .tsv, dan lainnya. Anggap saja Pandas adalah spreadsheet namun tidak memiliki GUI dan punya fitur seperti SQL.
4. Matplotlib
Data yang kita olah tentu tidak elok apabila ditampilkan begitu saja dengan tabel hitam saja kepada investor atau manajemen. Bila ditampilkan dengan sejumlah grafik berwarna pasti mereka akan lebih tertarik melihatnya. Matplotlib membantu kamu untuk memvisualisasikan data dengan lebih indah dan rapi.
Ada plot untuk menampilkan data secara 2D atau 3D. Sehingga kamu dapat menampilkan data yang telah kamu olah sesuai kebutuhan. Matplotlib pun terintegrasi dengan iPython Notebook atau Jupyter dimana kamu dapat membuat sebuah buku interaktif yang dapat diberi penjelasan dan kode yang disisipkan begitupun hasil plottingnya.
Matplotlib adalah library paling banyak digunakan oleh data science untuk menyajikan datanya ke dalam visual yang lebih baik.
5. Scikit-Learn
Machine learning ada yang berbasis statistika ada juga yang tidak. Salah satunya adalah support vector machine dan regresi linier. Mungkin bagi sebagian orang sudah biasa menulis sendiri library untuk implementasi kedua algoritma tadi. Tapi untuk membuatnya dalam waktu singkat tentu butuh waktu yang tidak sedikit pula.
Scikit-Learn memberikan sejumlah fitur untuk keperluan data science seperti:
• Algoritma Regresi
• Algoritma Naive Bayes
• Algoritma Clustering
• Algoritma Decision Tree
• Parameter Tuning
• Data Preprocessing Tool
• Export / Import Model
• Machine learning pipeline
dan lainnya
Scikit-Learn sudah teruji dan memiliki dokumentasi yang super lengkap. Bahkan kontributornya pun banyak. Scikit-Learn pun menyediakan ekstensi untuk fuzzy logic dan computer vision.
4).Visualisasi data selalu berkaitan dengan diagram yang bertujuan untuk mempermudah memahami suatu data. Visualilasi data dapat dilakukan menggunakan Python dengan library Matplotlib.
Nama : Achsya Salwa Salsabiella W.
BalasHapusKelas : X KA-1
No.Absen : 03
Jawaban
1.Scraping adalah sebuah teknik atau metode otomatisasi yang artinya membuat pekerjaan Anda yang berulang seperti copy paste data dari sebuah website menjadi otomatis dimana terdapat algoritma yang berjalan untuk mengekstrak data dan menyimpannya ke dalam sebuah file ataupun database.
2.cara melakukan visualisasi data menggunakan Google Colab
1)Buka Google Colab melalui tautan berikut https://colab.research. google.com/. Jika kalian diminta untuk Sign-In, silakan masuk dengan menggunakan akun Google/GMail. Jika kalian belum memiliki Google/Gmail, maka diharuskan untuk membuat akun terlebih dahulu.
2)Langkah berikutnya yaitu membuat catatan baru melalui pilihan New notebook. Notebook merupakan suatu penamaan untuk file kerja dalam Google Colab, tempat membuat dokumen (teks dokumen/catatan) dan teks kode untuk program Python.Untuk lebih jelasnya
3)Setelah mengklik New notebook, maka tampilan layar monitor
4)Buatlah kode program Python dengan menuliskan teks
5)Untuk melakukan dari kode program yang sudah diketik, klik Run cell yang memiliki simbol Apabila program maka layar output akan menghasilkan teks sesuai dengan yang ditulis sebelumnya,
3.(1) Pedas
Fungsinya: Adalah untuk menangani operasi aljabar dan matriks serta operasi matematika lainnya.
(2) Numpy
Fungsinya:untuk operasi vektor dan matriks. Fiturnya hampir sama dengan MATLAB dalam mengelola array dan array multidimensi.
Numpy merupakan salah satu library yang digunakan oleh library lain seperti Scikit-Learn untuk keperluan analisis data.
(3) Panda
Fungsinya: dapat mengolah suatu data dan mengolahnya seperti join , differensial , group by , agregasi, dan teknik seperti pada SQL. Hanya dilakukan pada tabel yang dimuat dari file ke RAM.
(4) Matplotlib
Fungsinya:untuk memvisualisasikan data dengan lebih indah dan rapi.Ada plot untuk menampilkan data secara 2D atau 3D. Sehingga kamu dapat menampilkan data yang telah kamu olah sesuai kebutuhan.
(5) Scikit-Pelajari
Fungsinya: memberikan sejumlah fitur untuk keperluan data science seperti:
Regresi Algoritma
Algoritma Naif Bayes
Pengelompokan Algoritma
Pohon Keputusan Algoritma
Penyesuaian Parameter
Alat Pemrosesan Data
Model Ekspor / Impor
Saluran pembelajaran mesin
dan lainnya
4.tabel dan grafik dalam sebuah laporan penelitian berguna agar informasi yang hendak disampaikan oleh penulis/peneliti dapat diterima atau dipahami dengan baik oleh pembaca, serta menghindari hal-hal yang tidak diinginkan seperti ambiguitas atau disinformasi
Nama : Anindita Fahrezi
BalasHapusKelas : X KA-1
No.Absen : 16
Jawaban
1.Scraping adalah sebuah teknik atau metode otomatisasi yang artinya membuat pekerjaan Anda yang berulang seperti copy paste data dari sebuah website menjadi otomatis dimana terdapat algoritma yang berjalan untuk mengekstrak data dan menyimpannya ke dalam sebuah file ataupun database.
2.cara melakukan visualisasi data menggunakan Google Colab
1)Buka Google Colab melalui tautan berikut https://colab.research. google.com/. Jika kalian diminta untuk Sign-In, silakan masuk dengan menggunakan akun Google/GMail. Jika kalian belum memiliki Google/Gmail, maka diharuskan untuk membuat akun terlebih dahulu.
2)Langkah berikutnya yaitu membuat catatan baru melalui pilihan New notebook. Notebook merupakan suatu penamaan untuk file kerja dalam Google Colab, tempat membuat dokumen (teks dokumen/catatan) dan teks kode untuk program Python.Untuk lebih jelasnya
3)Setelah mengklik New notebook, maka tampilan layar monitor
4)Buatlah kode program Python dengan menuliskan teks
5)Untuk melakukan dari kode program yang sudah diketik, klik Run cell yang memiliki simbol Apabila program maka layar output akan menghasilkan teks sesuai dengan yang ditulis sebelumnya,
3.(1) Pedas
Fungsinya: Adalah untuk menangani operasi aljabar dan matriks serta operasi matematika lainnya.
(2) Numpy
Fungsinya:untuk operasi vektor dan matriks. Fiturnya hampir sama dengan MATLAB dalam mengelola array dan array multidimensi.
Numpy merupakan salah satu library yang digunakan oleh library lain seperti Scikit-Learn untuk keperluan analisis data.
(3) Panda
Fungsinya: dapat mengolah suatu data dan mengolahnya seperti join , differensial , group by , agregasi, dan teknik seperti pada SQL. Hanya dilakukan pada tabel yang dimuat dari file ke RAM.
(4) Matplotlib
Fungsinya:untuk memvisualisasikan data dengan lebih indah dan rapi.Ada plot untuk menampilkan data secara 2D atau 3D. Sehingga kamu dapat menampilkan data yang telah kamu olah sesuai kebutuhan.
(5) Scikit-Pelajari
Fungsinya: memberikan sejumlah fitur untuk keperluan data science seperti:
Regresi Algoritma
Algoritma Naif Bayes
Pengelompokan Algoritma
Pohon Keputusan Algoritma
Penyesuaian Parameter
Alat Pemrosesan Data
Model Ekspor / Impor
Saluran pembelajaran mesin
dan lainnya
4.tabel dan grafik dalam sebuah laporan penelitian berguna agar informasi yang hendak disampaikan oleh penulis/peneliti dapat diterima atau dipahami dengan baik oleh pembaca, serta menghindari hal-hal yang tidak diinginkan seperti ambiguitas atau disinformasi
Nama : Salman al farisi
BalasHapusKelas : X - KA 2
Absen : 28
Nilai : 100
Nama : Fikri Ardiyansah Hidayat
BalasHapusKelas : X KA 2
Absen : 05
Nilai : 100
Nama : Vellix Ardiansyach
BalasHapusKelas : X KA 2
No absen : 33
Nilai : 100
Nama : M Raffi Bagas Agaastha
BalasHapusKelas : X KA2
Absen : 16
Nilai : 100
Nama : Satria Pratama
BalasHapusKelas : X-KA2
Absen : 29
Nilai : 100
Nama : Zaky Ahmad Yassar
BalasHapusKelas : X-ka2
No. Absen : 35
Nilai : 100
Nama : Yoga pratama mardiyanto
BalasHapusKelas : X - KA 2
No absen : 34
Nilai : 100
Nama: Ibrahim Ramzi Zaaidan
BalasHapusKelas: X-KA 2
Absen: 09
Nilak: 100
NAMA : HENDRO NUGROHO
BalasHapusKELAS : 10 KA 2
ABSEN : 8
NILAI : 100
Nama:Riva Achmad Dani Zakariya
BalasHapusKelas: X-KA-2
Absen:27
Nilai:100
Nama : Elga Anastasya Putri Faizah
BalasHapusKelas : X-KA 2
Absen : 03
Nilai : 100
Nama : Leandhira Khalila
BalasHapusKelas : X KA 2
No.Absen : 14
Nilai : 100
Nama : Sherin dwi cahyani
BalasHapusKelas : X - KA 2
Absen : 31
Nilai : 100
Nama : Shafa Nayla S
BalasHapusKelas : X - KA 2
Absen : 30
Nilai : 100
Nama : Ghaniyandra Mirza Izzati
BalasHapusKelas : X-KA 2
Absen : 06
Nilai : 100
Nama : Intan Zakiyah Nandriyanti
BalasHapusKelas : X-KA 2
Absen : 11
Nilai : 100
Nama : Marcela Gunawan
BalasHapusKelas : X - KA 2
Absen : 18
Nilai : 100
Nama : Nayzilla Aurelia Putri
BalasHapusKelas : X KA 2
Absen : 26
Nilai : 100
Nama : Nabila arien Pramitha
BalasHapusKelas : X-KA 2
No absen : 22
Nilai : 100
Nama : Natasya Kinamai
BalasHapusKelas : X - KA 2
No. absen : 24
Nilai : 90
Nama : Indah Dwi Rosdiana
BalasHapusKelas : X-KA2
Absen : 10
Nilai :100
Nama : Mevia Dwi Agustina
BalasHapusKelas : X-KA 2
Absen : 20
Nilai : 100
Nama : Hana Crysanta
BalasHapusKelas : X-KA 2
Absen : 07
Nilai : 100
Nama: Mivthakhul RahmaDhani
BalasHapusKelas: X-KA 2
Absen: 21
Nilai: 100
Nama : Amalia Rizka Shabirah
BalasHapusKelas : X-KA 2
No absen : 01
Nilai : 100
Nama: Najwa Azilla Hariyanto
BalasHapusKelas: X - KA 2
Absen: 23
Nilai: 100
Nama : Nayla Aulia Ramadani
BalasHapusKelas : X-KA 2
Absen : 25
Nilai : 100
Nama: Elyssa Winnie Santoso
BalasHapusKelas: X-KA 2
No. absen: 04
Nilai: 100
Nama : Durotun Nafisah
BalasHapusKelas : X KA 2
Absen : 02
Nilai : 100
Nama : Sisca Anggreani
BalasHapusKelas : X - KA 2
Absen : 32
Nilai : 100
Nama: Lailatul fadhila
BalasHapusKelas: X-KA2
Absen: 13
Nilai: 100
nama : kayla aurellia natasya
BalasHapuskelas : X-KA2
absen : 12
nilai : 90
Nama : Aisyah Putri Agung
BalasHapusKelas : X KA 1
Absen : 07
Nilai : 100
Nama: Adrian Syawal Dwi Saputra
BalasHapusKelas: X KA 1
Absen: 05
Nilai: 100
Nama : Anindita Fahrezi
BalasHapusKelas : X KA 1
Absen : 16
Nilai : 100
Nama : Achmad Nurul Mubin Habibi
BalasHapusKelas : X-KA 1
No. Absen : 02
Nilai : 100
Nama : Nazwa Keyla T.
BalasHapusKelas : X KA 1
Absen : 36
Nilai : 100
Nama : Chelsea Monique E
BalasHapusKelas : X - 10
No : 24
Nilai : 100
Nama: Diandra Ilham Wiyoko
BalasHapusKelas: X-KA 1
No absen: 31
Nilai: 100
Nama: Clarissa Nadine Afelia
BalasHapusKelas: X KA 1
Absen: 26
Nilai: 100
Nama: indah nurlaili agustin
BalasHapuskelas: X KA1
No. Absen: 34
nilai: 100
Nama: Ammar Hanifan
BalasHapusKelas: X-KA 1
Absen: 14
Nilai: 100
Nama : Arvaega Early J.P
BalasHapusKelas : X
No. Absen : 19
Nilai : 100
Nama : Achsya Salwa Salsabiella W
BalasHapusKelas : X KA-1
No.Absen : 03
Nilai : 100
NAMA : ANNISA CAMALIA AGUSTINA
BalasHapusKELAS : X KA 1
ABSEN : 17
NILAI : 100
Nama : Alif Bachtiar Pramusinto
BalasHapusKelas : X-KA 1
No Absen : 10
Nilai Quiziz : 100
Nama : Ahmad Aditya Hanung Permana
BalasHapusKelas : X KA-1
No Absen : 06
Nilai : 100
nama : charissa vania m
BalasHapuskelas / absen : x ka 1 / 23
nilai : 100
NAMA : AJENG DARA AULIA
BalasHapusKELAS : X KA 1
ABSEN : 09
NILAI : 100
Nama: Aditya Rizky Alamsyah
BalasHapusKelas: X KA 1
Absen: 4
Nilai: 100
Nama : Cevin Ararya A.P
BalasHapusKelas : X KA-1
Absen : 22
Nilai : 100
NAMA : ALIFIA WIDYA PRATIWI
BalasHapusKELAS : X KA 1
ABSEN : 11
NILAI : 100
Nama : Antonius Jolanda Saputra
BalasHapusKelas : X KA 1
No Absen : 18
Nilai : 100
Nama : Abidah Putri Ardelia
BalasHapusKelas : X KA 1
Absen : 01
Nilai : 100
Nama : Ibrahim Fairuz Islam
BalasHapusKelas : X KA-1
No Absen : 33
Nilai : 100
NAMA : INTAN SAFIRA
BalasHapusKELAS : X KA 1
ABSEN : 35
NILAI : 100
Nama : Dhini Afrillia
BalasHapusKelas : X KA 1
Absen : 29
Nilai : 100
Nama: Citra Divani Putri
BalasHapusKelas: X KA 1
No absen: 25
Nilai: 100
NAMA : ANAS TASYA PUTRI
BalasHapusKELAS : X KA 1
ABSEN : 15
NILAI : 100
Nama : Dayu Ismi Pramesti
BalasHapusKelas : X-KA 1
Absen : 27
Nilai : 100
NAMA : FARIHA ROSADAH
BalasHapusKELAS : X KA 1
ABSEN: 32
NILAI : 100
Nama: Aivy Chandra Zakiffa
BalasHapusKelas: X KA 1
Absen: 08
Nilai: 100
Nama: Amelia dwi aprilianti
BalasHapusKelas: X-KA 1
Absen: 13
Nilai: 100
Nama : Aliya Zulistin Yumna
BalasHapusKelas : X - KA 1
Absen : 12
Nilai : 100
Nama : Diajeng Puspita R
BalasHapusKelas : X - KA 1
Absen : 30
Nilai : 100
nama : maidasysya Islamsyah
BalasHapuskelas : X KA 2
absen : 17
nilai: 100
Nama : love joy irine
BalasHapusAbsen : 15
Kelas : X-KA 2
Nilai : 100