Formula Outlier

Rumus outlier menyediakan alat grafik untuk mengira data yang berada di luar set taburan yang diberikan yang mungkin sisi dalam atau luar bergantung pada pemboleh ubah.

Apakah Rumus Outlier?

Outlier adalah titik data dari sampel yang diberikan atau pemerhatian yang diberikan atau dalam sebaran yang berada di luar keseluruhan corak. Peraturan yang biasa digunakan yang mengatakan bahawa titik data akan dianggap sebagai outlier jika memiliki lebih dari 1.5 IQR di bawah kuartil pertama atau di atas kuartil ketiga.

Dengan kata lain, outliers rendah terletak di bawah Q1-1.5 IQR dan outliers tinggi terletak Q3 + 1.5IQR

Seseorang perlu mengira median, kuartil termasuk IQR, Q1, dan Q3.

Rumus outlier ditunjukkan seperti berikut,

Rumus untuk Q1 = ¼ (n + 1) istilah ke -Formula untuk Q3 = ¾ (n + 1) istilah ke -Formula untuk Q2 = Q3 - Q1

Langkah demi langkah Pengiraan Outlier

Langkah di bawah perlu diikuti untuk mengira Outlier.

  • Langkah 1: Kira kuartil pertama iaitu Q1, Q2 dan interquartile
  • Langkah 2: Sekarang hitung nilai Q2 * 1.5
  • Langkah 3: Sekarang Kurangkan nilai Q1 dari nilai yang dikira dalam Langkah2
  • Langkah 4: Di sini Tambahkan Q3 dengan nilai yang dikira dalam langkah2
  • Langkah 5: Buat julat nilai yang dikira dalam Langkah3 dan Langkah4
  • Langkah 6: Susun data mengikut urutan menaik
  • Langkah 7: Periksa sama ada terdapat nilai yang berada di bawah atau lebih tinggi daripada julat yang dibuat di Langkah5

Contohnya

Pertimbangkan satu set data dengan nombor berikut: 10, 2, 4, 7, 8, 5, 11, 3, 12. Anda dikehendaki mengira semua Outliers.

Penyelesaian:

Pertama, kita perlu mengatur data dalam urutan menaik untuk mencari median yang akan menjadi Q2 bagi kita.

2, 3, 4, 5, 7, 8, 10, 11, 12

Sekarang kerana jumlah pemerhatian adalah ganjil iaitu 9, median akan berada pada kedudukan ke-5 yang 7 dan sama akan menjadi Q2 untuk contoh ini.

Oleh itu, pengiraan Q1 adalah seperti berikut -

S1 = ¼ (9 + 1)

= ¼ (10)

Q1 akan menjadi - 

Q1 = 2.5 penggal

Ini bermaksud bahawa Q1 adalah purata bagi pemerhatian kedudukan ke-2 dan ke-3 iaitu 3 & 4 di sini dan rata-rata yang sama adalah (3 + 4) / 2 = 3.5

Oleh itu, pengiraan Q3 adalah seperti berikut -

S3 = ¾ (9 + 1)

= ¾ (10)

S3 akan - 

Q3 = 7.5 jangka

Ini bermaksud bahawa Q3 adalah purata bagi pemerhatian ke-7 dan ke-8 iaitu 10 & 11 di sini dan rata-rata yang sama adalah (10 + 11) / 2 = 10.5

Sekarang, outliers rendah terletak di bawah Q1-1.5IQR dan outlier tinggi terletak Q3 + 1.5IQR

Jadi, nilai adalah 3.5 - (1.5 * 7) = -7 dan julat yang lebih tinggi ialah 10.5 + (1.5 * 7) = 110.25.

Oleh kerana tidak ada pemerhatian yang terletak di atas atau lebih rendah daripada 110.25 dan -7, kami tidak mempunyai garis besar dalam sampel ini.

Contoh Formula Outlier dalam Excel (dengan Templat Excel)

Anda boleh memuat turun Templat Formula Excel Outlier ini di sini - Templat Excel Outlier Formula

Kelas bimbingan kreatif mempertimbangkan untuk memberi ganjaran kepada pelajar yang berada di 25% teratas. Walau bagaimanapun mereka ingin mengelakkan sebarang kelebihan. Data untuk 25 pelajar. Gunakan persamaan Outlier untuk menentukan sama ada ada outlier?

Penyelesaian:

Di bawah ini diberikan data untuk mengira outlier

Jumlah pemerhatian di sini adalah 25 dan langkah pertama kami adalah menukar data mentah di atas mengikut urutan menaik.

Median akan -

Nilai median = ½ (n + 1)

= ½ = ½ (26)

= Penggal ke-13

Q2 atau median ialah 68.00

Yang merupakan 50% daripada populasi.

Q1 akan menjadi -

S1 = ¼ (n + 1) penggal ke-1

= ¼ (25 + 1)

= ¼ (26)

= Istilah ke-6 yang bersamaan dengan penggal ke-7

Q1 adalah 56.00 yang berada di bawah 25%

S3 akan -

Akhirnya, Q3 = ¾ (n + 1) penggal ke-3

= ¾ (26)

= 19.50 penggal

Di sini rata-rata perlu diambil iaitu istilah ke-19 dan ke-20 yang 77 dan 77 dan rata-rata yang sama adalah (77 + 77) / 2 = 77.00

 Q3 adalah 77 yang 25% teratas

Julat Rendah

Sekarang, outliers rendah terletak di bawah Q1-1.5IQR dan outlier tinggi terletak Q3 + 1.5IQR

Julat Tinggi -

Jadi, nilai adalah 56 - (1.5 * 68) = -46 dan julat yang lebih tinggi ialah 77 + (1.5 * 68) = 179.

Tidak ada penyekat.

Perkaitan dan Kegunaan

Rumus outliers sangat penting untuk diketahui kerana mungkin ada data yang akan cenderung dengan nilai tersebut. Ambil contoh pemerhatian 2, 4, 6, 101 dan sekarang jika seseorang mengambil nilai rata-rata nilai ini akan menjadi 28,25 tetapi 75% pemerhatian berada di bawah 7 dan oleh itu satu keputusan yang salah mengenai pemerhatian sampel ini.

Di sini dapat diperhatikan bahawa 101 jelas menunjukkan garis besar dan jika ini dihapus maka rata-rata akan menjadi 4 yang mengatakan tentang nilai atau pemerhatian yang terdapat dalam julat 4. Oleh itu, sangat penting untuk melakukan pengiraan ini untuk mengelakkan sebarang penyalahgunaan maklumat utama data. Ini banyak digunakan oleh ahli statistik di seluruh dunia setiap kali mereka melakukan penyelidikan.