Apa Itu Outliers Data

 

MANAJEMEN.CO.ID - Outliers adalah data yang memiliki nilai yang signifikan atau ekstrim yang berbeda dengan sebagian besar data dalam sebuah kumpulan data. Penjelasan mengenai outliers dapat bervariasi tergantung pada bidang studi dan konteks penggunaannya. Outliers data (data pencilan) adalah data yang terletak jauh di luar nilai-nilai yang diharapkan atau dianggap normal dalam suatu kumpulan data. Istilah outliers data digunakan untuk menggambarkan nilai yang ekstrem dan berbeda secara signifikan dari nilai-nilai lain dalam kumpulan data. Berikut adalah definisi outliers menurut beberapa ahli:

Peter Bruce dan Andrew Bruce, Outliers adalah data yang berbeda dengan nilai-nilai lain dalam kumpulan data dan dapat mempengaruhi analisis dan model yang dibangun dari data tersebut. Outliers data adalah nilai yang ekstrim dalam distribusi data yang mungkin menunjukkan kesalahan atau kelalaian dalam pengumpulan atau pengolahan data (Practical Statistics for Data Scientists)

David J. Hand, Outliers adalah pengamatan yang tidak sesuai dengan model atau pola yang ditemukan dalam data (Principles of Data Mining)

Ronald K. Pearson, Outliers adalah data yang terlalu jauh dari kisaran nilai-nilai yang diharapkan berdasarkan distribusi data (The Handbook of Biological Statistics)

John Tukey, Outliers data adalah nilai yang berada lebih dari 1,5 kali jarak antara kuartil 1 dan kuartil 3 di bawah kuartil 1 atau di atas kuartil 3. Outliers data dapat dianggap sebagai nilai yang tidak lazim atau tidak biasa dalam kumpulan data.

David Hawkins, Outliers data adalah data yang menunjukkan perbedaan atau ketidaknormalan dalam distribusi data yang mungkin merupakan indikasi adanya kejadian yang tidak biasa atau signifikan dalam sistem yang diukur.

Secara umum, outliers dapat ditemukan dengan melihat nilai-nilai ekstrim pada data atau menggunakan teknik statistik tertentu untuk mendeteksi data yang tidak biasa atau anomali. Penting untuk mempertimbangkan outliers saat melakukan analisis data dan memutuskan apakah data tersebut harus dihilangkan atau dimasukkan ke dalam model.

kedairisetsolution