Syntax Literate: Jurnal Ilmiah Indonesia� p�ISSN: 2541-0849 e-ISSN: 2548-1398

Vol. 7, No. 10, Oktober 2022

 

PENGKLASTERAN KABUPATEN/KOTA DI INDONESIA BERDASARKAN MASALAH GIZI BALITA DENGAN MENGGUNAKAN METODE TWO STEP CLUSTER DAN ENSEMBLE K-MODES

 

Cichi Chelchillya Candra, Ferra Yanuar, Dodi Devianto
Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Andalas, Padang, Indonesia

E-mail: [email protected], [email protected], [email protected]

 

Abstrak

Pemerintah selalu berupaya untuk mengurangi prevalensi masalah gizi yang terjadi pada anak melalui berbagai program kesehatan. Namun karena berbagai masalah gizi tersebut memiliki penanganan yang berbeda, maka pemerintah suatu daerah perlu mengetahui masalah gizi anak apa yang dominan ditemui di daerahnya sehingga program yang akan dijalankan tepat. Tujuan dari penelitian ini adalah mengklasterkan kabupaten/kota di Indonesia berdasarkan masalah gizi balita dengan menggunakan metode Two Step Cluster dan Ensemble K-Modes serta mendeskripsikan karakteristik masalah gizi pada masing-masing klaster akhir yang terbentuk. Objek yang diamati pada penelitian ini terdiri dari 492 kabupaten/kota di Indonesia. Data yang digunakan yaitu data masalah gizi balita di semua kabupaten/kota di Indonesia. Hasil penelitian ini yaitu pengklasteran kabupaten/kota di Indonesia berdasarkan masalah gizi balita menggunakan metode two step cluster dan ensemble k-modes menghasilkan klaster yang berbeda. Metode ensemble k-modes lebih baik dalam mengklasterkan data gizi balita daripada metode two step cluster. Hal ini dapat dilihat dari nilai keragaman pengklasteran yang lebih kecil, yaitu 0,569015. Karakteristik klaster 1 menunjukkan bahwa sebagian besar kabupaten/kota dalam klaster ini terletak di wilayah Indonesia bagian barat, dengan total 229 kabupaten/kota.

 

Kata Kunci: Masalah gizi balita, Klaster kabupaten/kota, Metode Two Step Cluster, Ensemble K-Modes.

 

 

Abstract

The government always strives to reduce the prevalence of nutritional problems in children through various health programs. However, due to the different handling of these nutritional problems, regional governments need to know the dominant nutritional problem found in their area in order to implement appropriate programs. The objective of this study is to cluster the districts/cities in Indonesia based on the nutritional problems of toddlers using the Two Step Cluster and Ensemble K-Modes methods, and to describe the characteristics of the nutritional problems in each final cluster formed. The objects observed in this study consist of 492 districts/cities in Indonesia. The data used is the nutritional problem data of toddlers in all districts/cities in Indonesia. The results of this study show that clustering the districts/cities in Indonesia based on the nutritional problems of toddlers using the Two Step Cluster and Ensemble K-Modes methods resulted in different clusters. The Ensemble K-Modes method is better at clustering nutritional data of toddlers compared to the Two Step Cluster method. This can be seen from the smaller diversity value of clustering, which is 0.569015. The characteristics of Cluster 1 indicate that the majority of districts/cities in this cluster are located in the western part of Indonesia, with a total of 229 districts/cities.

 

Keywords: Nutritional problems in toddlers, District/city clusters, Two Step Cluster, Ensemble K-Modes methods.

 

Pendahuluan

Usia di bawah lima tahun adalah usia emas dalam perkembangan seorang individu. Pada usia ini anak mengalami tumbuh kembang yang luar biasa baik dari segi fisik maupun kecerdasan. Untuk mengoptimalkan proses tumbuh kembang tersebut tentu dibutuhkan gizi yang berkualitas dalam jumlah yang cukup. Pentingnya pemenuhan gizi ini juga disebabkan karena masa balita merupakan masa yang rentan terhadap masalah gizi. Kasus kematian yang terjadi pada balita merupakan salah satu akibat dari gizi buruk. Gizi buruk dimulai dari penurunan berat badan ideal seorang anak sampai akhirnya berada jauh di bawah rata-rata.

Balita merupakan kelompok umur yang paling rentan mengalami malnutrisi. Jika terjadi kekurangan nutrisi pada tahap awal kehidupan dapat meningkatkan risiko infeksi, mortalitas, dan morbiditas bersamaan dengan penurunan perkembangan mental dan kognitif. Kekurangan nutrisi pada anak bisa bertahan lama dan melampaui masa kanak-kanak. Kekurangan nutrisi pada usia dini menurunkan prestasi pendidikan dan produktivitas tenaga kerja dan meningkatkan risiko penyakit kronis di usia lanjut. �

Seribu hari pertama kehidupan merupakan masa kritis bagi perkembangan saraf anak. Kekurangan nutrisi merupakan kontributor utama gangguan perkembangan saraf anak, terutama di rangkaian sumber daya yang rendah. Anak-anak dengan nutrisi yang seimbang memiliki peluang yang lebih baik untuk berkembang. Sebaliknya, anak-anak yang dibesarkan dalam kondisi buruk, kekurangan gizi dan kelebihan gizi berisiko terhadap kesehatan dan hasil sosial yang negatif sepanjang perjalanan hidup mereka.

Penentuan status gizi merupakan suatu upaya yang dilakukan dalam rangka meningkatkan derajat kesehatan balita. Indeks yang biasa dipakai untuk menilai status gizi anak pada usia ini adalah berat badan terhadap umur (BB/U), tinggi badan terhadap umur (TB/U), dan berat badan terhadap tinggi badan (BB/TB). Ketiga indeks ini dapat menunjukkan masalah status gizi apa yang diderita oleh seorang balita. Salah satu contoh masalahnya adalah gizi kurang (underweight), pendek (stunting), kurus (wasting) dan gemuk (overweight).

Pemerintah selalu berupaya untuk mengurangi prevalensi masalah gizi yang terjadi pada anak melalui berbagai program kesehatan. Namun karena berbagai masalah gizi tersebut memiliki penanganan yang berbeda, maka pemerintah suatu daerah perlu mengetahui masalah gizi anak apa yang dominan ditemui di daerahnya sehingga program yang akan dijalankan tepat. Untuk memudahkan pemerintah dalam menyusun program untuk mengatasi masalah gizi balita di Indonesia, maka salah satu cara yang dilakukan adalah dengan mengelompokkan kabupaten/kota berdasarkan kemiripan masalah gizi yang ada di masing-masing kabupaten/kota. Dengan pengklasteran ini, maka kabupaten/kota yang mengalami masalah yang sama akan diberikan program yang sama juga. Sehingga dapat disusun program pemerintah yang lebih efektif, efesien dan lebih tepat sasaran.

Pengklasteran merupakan suatu proses untuk mengelompokkan objek-objek sehingga objek yang berada dalam suatu klaster memiliki karakteristik yang mirip. Teknik statistika yang digunakan untuk mengelompokkan objek-objek ke dalam klaster adalah analisis klaster. Terdapat banyak metode pengklasteran. Untuk mengelompokkan objek dalam jumlah besar, seperti untuk mengelompokkan banyaknya kabupaten/kota di Indonesia. Pada penelitian ini akan dibahas bagaimana pengklasteran kabupaten/kota di Indonesia berdasarkan masalah gizi balita dengan menggunakan metode� Two Step Cluster dan Ensemble K-Modes.

Mongi dalam penelitiannya mengungkapkan bahwa analisis Two Step Cluster adalah metode pengklasteran yang dapat memberikan solusi untuk mengelompokkan suatu objek ke dalam kelompok-kelompok yang memiliki kemiripan (homogen) dengan permasalahan pada skala pengukuran, objek yang diteliti berukuran cukup besar dengan peubah yang bebeda yaitu kategorik dan numerik sehingga hasil akhir untuk penyelesaian dari metode tersebut dapat diketahui cluster optimal yang terbentuk. Andrew melakukan perbandingan antara algoritma Two Step Cluster dengan algoritma K-Prototype, diperoleh kesimpulan bahwa algoritma Two Step Cluster lebih baik karena nilai rasio keragaman algoritma Two Step Cluster lebih kecil dibandingkan dengan algoritma K-Prototypes. Saputra pernah menggunakan Ensemble Cluster dengan metode K-Modes untuk mengelompokan aksesi jeruk dan membandingkan hasil pengklasterannya dengan metode numerik murni (Fuzzy C-Means) serta kategorik murni (K-Modes) sehingga diketahui bahwa metode Ensemble K-Modes mampu menerangkan dan menggabungkan kedua tipe karakter menjadi satu karakter data yaitu kategorik dengan hasil yang lebih baik. Larasati melakukan perbandingan antara algoritma Ensemble K-Modes dengan algoritma Similarity Weight and Filter Method (SWFM), diperoleh kesimpulan bahwa algoritma Ensemble K-Modes lebih baik karena karena nilai akurasi pengklasteran �yang lebih besar dibandingkan dengan algoritma SWFM.

Berdasarkan latar belakang yang telah dipaparkan sebelumnya, masalah yang akan dibahas dalam penelitian ini adalah bagaimana mendapatkan solusi optimal pada pengklasteran kabupaten/kota di Indonesia berdasarkan masalah gizi balita dengan menggunakan metode Two Step Cluster dan Ensemble K-Modes serta bagaimana karakteristik masalah gizi yang dihadapi kabupaten/kota pada masing-masing klaster tersebut.

Pada penelitian ini data yang diambil merupakan data sekunder yaitu data masalah gizi pada kabupaten/kota di Indonesia tahun 2022 yang bersumber dari data Study Status Gizi Indonesia (SSGI) Tahun 2022 yang dilakukan oleh Kementerian Kesehatan. Metode klasterisasi yang dipilih Two Step Cluster dan Ensemble K-Modes.

Adapun tujuan dari penelitian ini adalah mengklasterkan kabupaten/kota di Indonesia berdasarkan masalah gizi balita dengan menggunakan metode Two Step Cluster dan Ensemble K-Modes serta mendeskripsikan karakteristik masalah gizi pada masing-masing klaster akhir yang terbentuk.

 

Metode Penelitian

Objek yang diamati pada penelitian ini terdiri dari 492 kabupaten/kota di Indonesia. Data yang digunakan yaitu data masalah gizi balita di semua kabupaten/kota di Indonesia. Data yang digunakan bersumber dari situs resmi Study �Status Gizi Indonesia (SSGI) (www.kesmas.kemkes.go.id). Data yang diamati terdiri dari data numerik dan kategorik.

Peubah penelitian yang digunakan adalah sebagai berikut.

A.    Peubah Numerik.

1.    Persentase balita yang memiliki berat badan kurang/underweight .

Persentase balita underweight dapat ditentukan dengan rumus

2.    Persentase balita yang memiliki tinggi badan jauh lebih �pendek/stunting .

Persentase balita stunting dapat ditentukan dengan rumus

3.    Persentase balita yang memiliki badan kurus/wasting .

Persentase balita wasting dapat ditentukan dengan rumus

4.    Persentase balita yang memiliki berat badan berlebih/gemuk .

Persentase balita gemuk dapat ditentukan dengan rumus

B.     Peubah Kategorik

1.    Pembagian wilayah di Indonesia .

Pembagian wilayah di Indonesia terdiri dari 3 kategori dengan kode sebagai berikut,

�

2.    Status wilayah di setiap provinsi

Status wilayah di setiap provinsi terdiri dari 2 kategori dengan kode sebagai berikut,

�

 

Tahapan analisis yang dilakukan pada penelitian ini adalah sebagai berikut.

1.    Mendeskripsikan masalah gizi balita yang dialami setiap kabupaten/kota di Indonesia. Pendeskripsian data dilakukan dengan menggunakan statistika deskriptif untuk data numerik dan diagram lingkaran untuk data kategorik.

2.    Mengklasterkan kabupaten/kota di Indonesia berdasarkan masalah gizi balita.

3.    Mendeskripsikan karakteristik dari masing-masing klaster yang dihasilkan.

 

Hasil dan Pembahasan

A.  Pengklasteran Kabupaten/kota di Indonesia Berdasarkan Masalah Gizi Balita menggunakan Ensemble K-Modes.

1.    Pengklasteran dengan Fuzzy C-Means

Pengklasteran data numerik pada penelitian ini dilakukan menggunakan metode Fuzzy C-Means (FCM) dan data kategorik menggunakan metode K-Modes. Hasil dari kedua pengklasteran akan menghasilkan data bertipe kategorik. Selanjutnya akan dilakukan proses ensemble yaitu dengan menggabungkan hasil pengklasteran kedua metode menggunakan algoritma K-Modes.

Dalam algoritma Fuzzy C-Means yang pertama kali dilakukan adalah menentukan jumlah klaster awal ( ) yang diinginkan yaitu , pangkat pembobot yang digunakan adalah 2 ( ), error terkecil yang diharapkan ( ) adalah . Selanjutnya untuk nilai �akan dibangkitkan bilangan random sebagai elemen-elemen matriks partisi awal U. Matriks partisi awal U ( ) yang terbentuk adalah :

 

Tabel 1

Derajat Keanggotaan Awal

No

Kabupaten/Kota

1

Kab. Gayo Lues

0.788079736

0.211920264

2

Kab. Aceh Tengah

0.727725522

0.272274478

3

Kota Banda Aceh

0.854593787

0.145406213

4

Kota Sabang

0.718183358

0.281816642

5

Kab. Aceh Barat

0.954993607

0.045006393

488

Kab. Asmat

0.658693500

0.341306500

489

Kab. Supiori

0.782094300

0.217905700

490

Kab. Waropen

0.664335659

0.335664341

491

Kab. Dogiyai

0.854899116

0.145100884

492

Kota Batu

0.368486230

0.631513770

 

Data yang digunakan adalah data masalah gizi balita tahun 2022 yang terdiri dari 492 data.

 

Tabel 2

Data yang digunakan ( )

No

Kabupaten/kota

1

Kab. Gayo Lues

17,1

34,6

5,4

2,2

2

Kab. Aceh Tengah

15,9

32

3,6

2,1

3

Kota Banda Aceh

21,4

25,1

12,4

3,3

4

Kota Sabang

20,4

23,4

11

3,3

5

Kab. Aceh Barat

22,5

30,4

10,5

1,4

488

Kab. Asmat

36,3

54,4

14,1

4,8

489

Kab. Supiori

26

40,2

7,9

2

490

Kab. Waropen

22,6

22,2

13,8

2,1

491

Kab. Dogiyai

24,1

35,1

12,8

2,7

492

Kota Batu

12,6

25,2

3,4

5

 

Dengan cara yang sama, akan diperoleh derajat keanggotaan baru setiap objek yang hasilnya akan disajikan pada Tabel 3 berikut:

 

Tabel 3

Derajat Keanggotaan Awal Akhir Iterasi 1

No

Kabupaten/Kota

1

Kab. Gayo Lues

0.64727058
0.35272942

2

Kab. Aceh Tengah

0.62902683
0.37097317

3

Kota Banda Aceh

0.75101496
0.24898504

4

Kota Sabang

0.41287766
0.58712234

5

Kab. Aceh Barat

0.74219859
0.25780141

488

Kab. Asmat

0.43382344
0.56617656

489

Kab. Supiori

0.62448225
0.37551775

490

Kab. Waropen

0.38563794
0.61436206

491

Kab. Dogiyai

0.66234558
0.33765442

492

Kota Batu

0.58004614
0.41995386

 

Akan diperiksa kondisi berhenti Karena �maka diulangi lagi dari langkah keempat sampai pada iterasi terakhir dimana nilai . Untuk kasus pada penelitian ini, proses iterasi baru akan berhenti pada iterasi ke-41 dengan nilai:

dengan nilai pusat klaster pada iterasi ke-41 adalah sebagai berikut:

 

Tabel 4

Hasil Pusat Klaster Pada Iterasi 41

Cluster

1

23.04757
30.26641
9.919163
2.939091

2

14.13559
17.93949
6.880213
3.710104

 

serta nilai U partisi pada iterasi ke-41 dengan derajat keanggotaan baru adalah sebagai berikut:

 

Tabel 5

Derajat Keanggotaan Akhir Iterasi 41

No

Kabupaten/Kota

1

Kab. Gayo Lues

0.794721090

0.205278910

2

Kab. Aceh Tengah

0.693326714

0.306673286

3

Kota Banda Aceh

0.790510914

0.209489086

4

Kota Sabang

0.608520408

0.391479592

5

Kab. Aceh Barat

0.987742332

0.012257668

488

Kab. Asmat

0.706363967

0.293636033

489

Kab. Supiori

0.850717001

0.149282999

490

Kab. Waropen

0.633846008

0.366153992

491

Kab. Dogiyai

0.929046576

0.070953424

492

Kota Batu

0.274937675

0.725062325

 

Selanjutnya dengan cara yang sama, pengklasteran �menggunakan fuzzy c-means akan dilakukan untuk jumlah klaster 3, 4, 5, 6, 7, 8 dan 9. Pada jumlah klaster 3, proses iterasi akan berhenti pada iterasi ke-91 dengan nilai fungsi objektif minimum yang didapatkan adalah 32564,965434 dengan derajat keanggotaan yang dapat dilihat pada lampiran 2. Pada saat jumlah klsater 4, proses iterasi akan berhenti pada iterasi ke-101 dengan nilai fungsi objektif 28765,456876 dan derajat keanggotaan dapat dilihat pada lampiran 3. Selanjutnya pada jumlah klaster 5, proses iterasi berhenti pada iterasi ke-216 dengan fungsi objektif 21456,974563 dan derajat keanggotaan yang dapat dilihat pada lampiran 4. Pada jumlah klaster 6, proses iterasi berhenti pada iterasi ke-1000 dengan fungsi objektif 16845,467587 dan nilai derajat keanggotaan dapat dilihat pada lampiran 5. Pada jumlah klaster 7, proses iterasi akan berhenti pada iterasi ke-538 dengan fungsi objektif 13871,574324 dengan derajat keanggotaan yang dapat dilihat pada lampiran 6. Pada jumlah klaster 8, proses iterasi akan berhenti pada iterasi ke-855 dengan nilai fungsi objektif 11654,764432 dan derajat keanggotaan dapat dilihat di lampiran 7. Serta pada jumlah klaster 9, proses iterasi akan berhenti pada iterasi ke-1000 dengan nilai fungsi objektif 9654.326747 dan derajat keanggotaan dapat dilihat di lampiran 8.

Jumlah klaster optimum ditentukan dengan melihat indeks validitas. Indeks validitas yang digunakan adalah Partition Entropy. Jumlah klaster optimum apabila memiliki nilai indeks Partition Entropy yang terkecil.

Indeks validitas PE pada jumlah klaster 3, 4, 5, 6, 7, 8 dan 9 dihitung dengan cara yang sama dan akan disajikan pada Tabel 5 berikut:

 

Tabel 5

Penentuan Klater Optimum

Klaster

Iterasi

Fungsi Objektif

PE

2

41

1.3872724

3

91

32564,965434

1.06606669

4

101

28765,456876

0.8585695

5

216

21456,974563

1.018743

6

1000

16845,467587

0.6606669

7

538

13871,574324

1.271923

8

855

11654,764432

1.384695

9

1000

9654.326747

1.406311

 

Berdasarkan Tabel 5, dapat dilihat bahwa jumlah klaster yang optimum diberikan ketika jumlah klaster = 6 dengan nilai Partition Entropy lebih kecil dibanding klaster lain. Banyak Iterasi yang diperoleh adalah 1000 dengan nilai fungsi objektifnya 16845,467587. Anggota klaster Optimum ditentukan dari derajat keanggotaan klaster pada iterasi terakhir. Berikut diberikan derajat keanggotaan dari dua klaster provinsi-provinsi di Indonesia:

 

Tabel 6

Derajat Keangotaan Klaster Optimum (1)

No

Kabupaten/kota

Klaster 1

Klaster 2

Klaster 3

1

Kab. Gayo Lues

0.19801758

0.1793566

0.07890313

2

Kab. Aceh Tengah

0.31695342

0.2010471

0.10858627

3

Kota Banda Aceh

0.08481329

0.7372701

0.04827765

4

Kota Sabang

0.12260231

0.7162455

0.07246862

5

Kab. Aceh Barat

0.08044206

0.2691019

0.03656757

488

Kab. Asmat

0.11894761

0.14876940

0.09081180

489

Kab. Supiori

0.04090668

0.05846294

0.02415608

490

Kab. Waropen

0.14232067

0.48773458

0.12861442

491

Kab. Dogiyai

0.14232067

0.07382402

0.02109069

492

Kota Batu

0.52378068

0.11517213

0.18852867

 

Derajat keanggotaan terbesar menunjukkan bahwa kecenderungan tertinggi untuk masuk menjadi anggota klaster tersebut.

2.    Pengklasteran dengan K-Modes

Metode K-Modes akan digunakan untuk mengelompokkan variabel dengan skala data kategorik. Metode ini menempatkan sebuah objek pengamatan tepat menjadi anggota suatu klaster. Ukuran kemiripan pada metode ini diukur menggunakan nilai modus. Dalam penelitian ini jumlah klaster yang akan dibentuk yaitu 2, 3, 4, 5 dan 6 cluster. Penentukan centroid awal pada penelitian ini yaitu dengan mengambil data yang tersedia secara random atau acak seperti yang dapat dilihat pada Tabel 7 berikut ini:

 

Tabel 7

Tabel Penentuan Centroid Awal

No

KABUPATEN/KOTA

Daerah

Waktu

1

Kab. Gayo Lues

1

1

2

Kab. Aceh Tengah

1

1

3

Kota Banda Aceh

2

1

4

Kota Sabang

2

1

5

Kab. Aceh Barat

1

1

488

Kab. Asmat

1

3

489

Kab. Supiori

1

3

490

Kab. Waropen

1

3

491

Kab. Dogiyai

1

3

492

Kota Batu

2

1

 

Hasil dari perhitungan jarak antara data dengan centroid dapat dilihat seperti pada tabel 8 berikut ini:

 

Tabel 8

Tabel Jarak Data dengan Centroid

No

Kabupaten/Kota

Jarak Antar Cluster

Cluster 1

Cluster 2

1

Kab. Gayo Lues

1

0

2

Kab. Aceh Tengah

1

0

3

Kota Banda Aceh

0

1

4

Kota Sabang

0

1

5

Kab. Aceh Barat

1

0

488

Kab. Asmat

2

1

489

Kab. Supiori

2

1

490

Kab. Waropen

2

1

491

Kab. Dogiyai

2

1

492

Kota Batu

0

1

 

Pengelompokkan data cluster didapatkan dengan melihat jarak terpendek. Setelah itu klasterkan data berdasarkan clusternya, dapat dilihat pada tabel 9 berikut ini:

 

Tabel 9

Memilih Jarak Terpendek

No

Kabupaten/Kota

Jarak Antar Cluster

Cluster

C1

C2

1

Kab. Gayo Lues

1

0

2

2

Kab. Aceh Tengah

1

0

2

3

Kota Banda Aceh

0

1

1

4

Kota Sabang

0

1

1

5

Kab. Aceh Barat

1

0

1

488

Kab. Asmat

2

1

2

489

Kab. Supiori

2

1

2

490

Kab. Waropen

2

1

2

491

Kab. Dogiyai

2

1

2

492

Kota Batu

0

1

1

 

Mencari Modus (nilai yang sering muncul) untuk menentukan pusat centroid baru. Centroid baru didapatkan dengan melihat data yang sering muncul (modus), dimana pada anggota klaster tiap cluster dibandingkan nilai apa saja yang sering muncul per atribut. Jika terdapat nilai yang sama maka diambil mana yang paling pertama ditemui. Jadi nilai centroid baru yang didapatkan pada iterasi 1 adalah seperti tabel 10 berikut ini:

 

Tabel 10

Data Centroid Baru

Cluster

Daerah

Waktu

1

2

1

2

1

3

 

Setelah Centroid baru didapatkan proses kembali ke langkah nomor 3 yaitu menghitung ketidak miripan setiap centroid dengan mengunakan centroid baru untuk lanjut ke iterasi selanjutnya. Proses akan berhenti jika anggota pada iterasi sebelumnya bernilai sama (tidak ada perubahan nilai sama sekali). Tabel semua pola syang didapatkan dari proses Data Mining dengan menggunakan algoritma K-Modes beserta nama untuk masing-masing cluster dapat dilihat pada tabel 11 dibawah ini:

 

Tabel 11

Memilih Jarak Terpendek

No

Kabupaten/Kota

Jarak Antar Cluster

Cluster

C1

C2

1

Kab. Gayo Lues

1

0

2

2

Kab. Aceh Tengah

0

1

1

3

Kota Banda Aceh

0

1

1

4

Kota Sabang

1

2

1

5

Kab. Aceh Barat

0

1

1

488

Kab. Asmat

2

1

2

489

Kab. Supiori

1

1

1

490

Kab. Waropen

0

1

1

491

Kab. Dogiyai

2

2

1

492

Kota Batu

0

1

1

 

Selanjutnya dengan cara yang sama, pengklasteran �menggunakan K-Modes akan dilakukan untuk jumlah klaster 3, 4, 5 dan 6.

 

Tabel 12

Perbandingan Nilai Akurasi Pengklasteran .

Banyak Cluster

Nilai Akurasi

2

0,84045

3

0,85163

4

0,97561

5

0,98374

6

1

 

Hasil perbandingan nilai akurasi pada Tabel 12 diperoleh �hasil bahwa pengklasteran �K-Modes dengan jumlah klaster sebanyak 6 memiliki nilai akurasi yang lebih besar dibandingkan dengan jumlah klaster lainnya. Pengklasteran �tersebut membagi kabupaten/kota di Indonesia menjadi 6 klaster dengan masing-masing anggota sebanyak 222 daerah, 129 daerah, 50 daerah, 39 daerah, 16 daerah� dan 36 daerah.Distribusi anggota kabupaten/kota pada masing-masing klaster yang terbentuk dapat dilihat pada Tabel 13.

 

Tabel 13

Distribusi Kabupaten/Kota dalam Klaster

Klaster

N

1

229

2

129

3

50

4

39

5

45

Total

492

 

Setelah terbentuk klaster, selanjutnya akan diambil rata-rata dari masing-masing peubah.

 

Tabel 14

Nilai Rata-Rata Peubah berdasarkan Klaster Optimal yang Terbentuk.

Peubah

Klaster

Rata-Rata Keseluruhan

1

2

3

4

5

Underweight

21,428

21,84109

14,5131

26,55128

15,73778

25,01781

Stunting

25,908

26,75969

19,0804

27,79778

34,31538

33,4653

Wasting

7,16507

12,41282

5,41778

9,50388

9,46

10,98989

Overweigt

4,09913

2,74574

2,53333

2,928

3,04

3,836549

 

Dari Tabel 14 dapat dilihat bahwa untuk persentase balita underweight, klaster 4 memiliki nilai rata-rata tertinggi dari klaster lainnya dan nilainya berada di atas rata-rata keseluruhan klaster. Untuk persentase balita stunting, klaster 5 memiliki� nilai rata-rata tertinggi dari klaster lainnya dan nilainya berada di atas rata-rata keseluruhan klaster. �Untuk persentase balita wasting, klaster 2 memiliki nilai rata-rata tertinggi dari klaster lainnya dan nilainya berada di atas rata-rata keseluruhan klaster. Kemudian, untuk persentase balita overweight, klaster 1 memiliki nilai rata-rata tertinggi dari klaster lainnya dan nilainya berada di atas rata-rata keseluruhan klaster. Sedangkan klaster 3 merupakan klaster dengan nilai rata-rata terendah dari klaster lainnya dan nilainya berada di bawah rata-rata keseluruhan klaster. Sebaran kabupaten/kota pada masing-masing klaster untuk wilayah Indonesia bagian barat, tengah dan timur, serta status wilayah di setiap provinsi dapat dilihat pada Tabel berikut.

 

Tabel 15

Sebaran Klaster pada Pembagian Wilayah di Indonesia dan Status

Wilayah di setiap Provinsi

Klaster

Pembagian Wilayah di Indonesia

Status Wilayah di setiap Provinsi

bagian Barat

bagian Tengah

bagian Timur

Kabupaten

Kota

1

180

31

18

157

72

2

11

97

21

109

20

3

50

0

0

50

0

4

20

0

19

39

0

5

40

0

5

42

3

Total

301

128

63

397

95

 

Dari Tabel 15 dapat dilihat bahwa pada kaster 1 sebagian besar daerah berada di wilayah Indonesia bagian barat dengan 157 wilayah berstatus kabupaten dan 72 wilayah berstatus kota. Pada kaster 2 sebagian besar daerah berada di wilayah Indonesia bagian tengah dengan 109 wilayah berstatus kabupaten dan 20 wilayah berstatus kota. Pada kaster 3 semua daerah berada di wilayah Indonesia bagian barat dengan 50 wilayah berstatus kabupaten. Pada kaster 4 semua daerah berada di wilayah Indonesia bagian barat dan timur dengan 39 wilayah berstatus kabupaten. Kemudian pada kaster 5 sebagian besar daerah berada di wilayah Indonesia bagian barat dengan 42 wilayah berstatus kabupaten dan 3 wilayah berstatus kota.

3.    Perbandingan antara Two Step Cluster (TSC) dan Ensemble K-Modes

Hasil pengklasteran �terbaik diperoleh dengan membandingkan nilai rasio keragaman dalam klaster ( ) dan keragaman antar klaster ( ) menggunakan metode Two Step Cluster dan metode Ensemble K-Modes. Berikut merupakan nilai perbandingan untuk kedua metode pengklasteran �data campuran.

 

Tabel 16

Perbandingan Nilai Akurasi Kedua Metode

 

Two Step Cluster

Ensemble K-Modes

Kontinu

Kategorik

Kontinu

Kategorik

53413,51

117,3314

37716,09

239,8779

129142,8

146,3764

143681,1

273,9799

Rasio

0,4136

0,801574

0,262499

0,875531

Keragaman

0,607587

0,569015

 

Berdasarkan Tabel 16 metode pengklasteran �data campuran Ensemble K-Modes dengan jumlah klaster optimum sebanyak 5 memiliki nilai keragaman terkecil yaitu sebesar 0,569015. Sehingga dapat diketahui bahwa metode pengklasteran �data campuran terbaik untuk mengklasterkan kabupaten/kota di Indonesia berdasarkan masalah gizi balita adalah dengan menggunakan metode Ensemble K-Modes.

 

Kesimpulan

Kesimpulan yang diperoleh dalam penelitian ini adalah : (1) Pengklasteran kabupaten/kota di Indonesia berdasarkan masalah gizi balita dengan menggunakan metode two step cluster terdiri dari 2 klaster dengan nilai keragaman 0,607587, sedangkan pengklasteran dengan ensemble k-modes menghasilkan 5 klaster optimum dengan nilai keragaman 0,569015. (2) Metode pengklasteran data campuran terbaik menunjukkan bahwa ensemble k-modes menghasilkan pengklasteran yang lebih baik dibandingkan dengan metode two step cluster karena nilai keragaman pengklasteran yang dimiliki ensemble k-modes lebih kecil yaitu 0,569015. Dengan demikian pengklasteran kabupaten/kota di Indonesia berdasarkan masalah gizi balita menghasilkan 5 klaster. (3) Berdasarkan karakteristik masing-masing klaster, diketahui bahwa klaster 1 yang terdiri dari 229 kabupaten/kota dengan sebagian besar daerah berada di wilayah Indonesia bagian barat. Klaster 1 merupakan klaster dengan masalah gizi overweight tertinggi dari klaster lainnya. Klaster 2 terdiri dari 129 kabupaten/kota dengan sebagian besar daerah berada di wilayah Indonesia bagian tengah. Klaster 2 merupakan klaster dengan masalah gizi wasting tertinggi dari klaster lainnya. Klaster 3 terdiri dari 50 kabupaten dengan semua daerah berada di wilayah Indonesia bagian barat. Klaster 3 merupakan klaster dengan semua masalah gizi terendah dari klaster lainnya. Klaster 4 terdiri dari 39 kabupaten dengan semua daerah berada di wilayah Indonesia bagian barat dan timur. Klaster 4 merupakan klaster dengan masalah gizi underweight tertinggi dari klaster lainnya. Klaster 5 terdiri dari 45 kabupaten/kota dengan sebagian besar daerah berada di wilayah Indonesia bagian barat. Klaster 5 merupakan klaster dengan masalah gizi stunting tertinggi dari klaster lainnya.

 

 

 

 

 

 

 

 

 

 

 

 

BIBLIOGRAFI

 

Anonimous. 2001. The SPSS TwoStep Cluster Component. Technical Report SPSS Inc. Chicago.

 

Bacher, J., K. Wenzig and M. Vogler. 2004. SPSS TwoStep Cluster : A First Evaluation. FAU, Jerman.

 

Bunkers, M., Miller, J., & DeGaetano, A. (1996). Definition of climate regions in the northen plains using an objective cluster modification technique. Journal of Climate, 130-146.

 

Chan, Y. H. 2005. Biostatistik 304 � ClusterAnalysis. Medical Journal. 46 : 153.

 

Chiu, T., D. Fang, J. Chen, Y. Wang, and C. Jeris. 2001. A Robust and Scalable Clustering Algorithm for Mixed Type Attributes in Large Database Environment. In Proceedings of the 7th ACM SIGKDD International Confererence on Knowledge Discovery and Data Mining 2001. Pp.263-268.

 

Endris N, Asefa H, Dube L. 2017. Prevalence of Malnutrition and Associated Factors among Children in Rural Ethiopia. 2017:6587853.

 

Hair, J., Black, W., Babin, J., & Anderson, R. (2010). Multivariate Data Analysis "7th ed". Pearson Prentice Hall, New Jersey(US).

 

Huang, Z. (1997). Clustering large data sets with mixed numeric and categorical values. In Proceedings of the 1st pacific-asia conference on knowledge discovery and data mining,(PAKDD) (pp. 21-34).

 

John CC, Black MM, Nelson 3rd CA. 2017. Neurodevelopment: The Impact of Nutrition and Inflammation During Early to Middle Childhood in Low Resource Settings. Pediatrics 2017;139 (suppl1):S59� S71.

 

Johnson RA, Wichern DW. 2007. Applied Multivariate Statistical Analysis. Prentice Hall, New Jersey.

 

Kader, G., & Perry, M. (2007). Variability for categorical variables. Journal of Statistics, 15(2): 1-16.

 

Kementrian Kesehatan RI. 2020. Standar Antropometri Anak. Badan Litbangkes Depkes RI, Jakarta.

 

Kementrian Kesehatan RI. 2018. Profil Kesehatan Indonesia 2018. Kemenkes RI, Jakarta.

 

Kementrian Kesehatan RI. 2022. Buku Saku Hasil Studi Status Gizi Indonesia (SSGI) Tahun 2022. Badan Litbangkes Kemenkes RI, Jakarta.

 

Pratiwi, R.H. 2015. Faktor-faktor yang berhubungan dengan Berat Kurang (Underweight) pada Balita di Perkotaan dan Perdesaan Indonesia berdasarkan Data Riskesdas tahun 2013. Jurnal Kesehatan Masyarakat. 3(4): 127-137.

 

Okada, T. (1999). Sum of Squares Decompositionfor Categorical Data. Kwansei Gakuin Studies in Computer Science, 14:1-6.

 

Putri, W. 2007. Analisis Gerombol Menggunakan Metode Two Step Cluster. Jurnal Statistika dan Komputasi. 12 : 18-23.

 

TNP2K. 2017. 100 Kabupaten/Kota Prioritas untuk Intervensi Anak Kerdil (Stunting). Sekretariat Wakil Presiden RI, Jakarta Pusat.

 

UNICEF. 2019. Stunting Pada Balita. Pusat Promosi Kesehatan, Kementerian Kesehatan RI, Jakarta.

 

WHO. 2017. Reducing Stunting In Children: Equity Considerations for Achieving the Global Nutrition Targets 2025. Geneva: WHO.

 

Zhang, T, R. Ramakrishnon and M. Livny. 1996. BIRCH: An Efficient Data Clustering Method for Very Large Databases. Proceeding of the ACM SIGMOD Conference on Management of Data. Pp.103-114.

 

Sumanto. (2014). Statistika Deskriptif (Pertama ed.). Yogyakarta : Center of Academic Publishing Service .

 

Hoppner, F., Klawonn, F., Kruse, R., & Runkler, T. (1999). Fuzzy Cluster Analysis. Wiley.����������

 

Kusumadewi, S., & Hartati, S. (2006). Neuro Fuzzy: Integrasi Sistem Fuzzy & Jaringan syaraf . Yogyakarta: Graha ilmu.

 

He, Z., Xu, X., & Deng, S. (2005). Clustering Mixed Numeric and Categorical Data: A Cluster Ensemble Approach. Harbin Institute of Technology, Department of Computer Science and Engineering.

 

Yoon, H., Ahn, S., Lee, S., Cho, S., & Kim, J. (2006). Heterogeneous Clustering Ensemble Method for Combining Different Cluster Results. BioDM 2006. Lecture Notes in Computer Science, 3916.

 

Mongi, C. E. 2015. Penggunaan Analisis Two Step Clustering Untuk Data Campuran. Jurnal de Cartesian (JdC). 4(1):9-19.

 

Andrew, D. M. (2018). Penggerombolan Desa/Kelurahan Berdasarkan Indikator Kemiskinan dengan menerapkan Algpritma Two Step Cluster dan K-Prototypes. Indonesian Journal of Statistics and Its Applications. 2(2): 63-76.

 

Saputra, C. W. (2016). Pengklasteran Aksesi Jeruk Persilangan Berdasarkan Karakter Kuantitatif dan Kualitatif Menggunakan Fuzzy C-Menas dan K-Modes. Skripsi, Institut Teknologi Sepuluh Nopember, Statistika.

 

Larasati, D.P (2018). Penerapan Metode Data Campuran Ensemble K-Modes dan Similarity Weight and Filter Method (SWFM) pada Pengklasteran� Kabupaten/Kota di Jawa Timur berdasarkan Indikator Daerah Tertinggal. Skripsi, Institut Teknologi Sepuluh Nopember, Statistika.

 

Madhulatha, T.S., 2012. An Overview On Clustering Methods. IOSR Journal of Engineering, II (4), pp.719-725

 

Kodinariya, Trupti M. & Makwana, Prashant R., (2013). Review on determining number of cluster in K-Means Clustering. International Journal of Advance Research in Computer Science and Management Studies, I (6), pp. 90-95

 

Bholowalia, Purnima & Kumar, Arvind, 2014. EBK-Means: A Clustering Techiniques based on Elbow Method and K-Means in WSN. International Journal of Computer Application (0975-8887), IX (105), pp. 17-24

 

Irwanto, et. al (2012). Optimasi Kinerja Algoritma Klasterisasi K-Means untuk kuantisasi Warna Citra. Jurnal Teknik ITS, I (1), pp.197-202.

 

Kusumadewi dan Purnomo .2004. Aplikasi Logika Fuzzy untuk Pendukung Keputusan. Yogyakarta : Graha Ilmu.

 

Klawonn� dand� H�ppner,� (2001),� �What� is� Fuzzy� about� Fuzzy �Clustering?� Understanding� and� Improving�� the�� Concept�� of�� the�� Fuzzier�.�� Science�� Journal, pp.254-264

 

Huang, Z., & Ng, M. K. (1999). A Fuzzy K-Modes Algorithm for Clustering Categorical Data. IEEE Transactions On Fuzzy Systems, 7(4).

 

Copyright holder:

Cichi Chelchillya Candra (2022)

 

First publication right:

Syntax Literate: Jurnal Ilmiah Indonesia

 

This article is licensed under: