< prev

Page 1Page 2Page 3Page 4Page 5Page 6

Page 2 of 6
next >

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

56

Vol. 4, No. 1, Maret 2015, ISSN : 2089-9033

2.

DATA DAN METODE

2.1 Data

Data diperoleh dari hasil crawling pada social

media twitter karena karakteristik data tweeter yang

lebih up-to-date dan dikenal masyarakat luas.

Untuk keperluan penelitian ini, crawling data

dilakukan selama 2 hari dan memperoleh 463 data

tweet.

Karakteristik data tweet berbahasa Indonesia

adalah banyaknya kata – kata “gaul”, singkatan

yang tidak umum, dan makna konotasi dari tiap

kata, khususnya pada kasus seputar “sampah”. Hal

ini akan dicoba diatasi dengan pengayaan kamus.

2.2 Metode yang Diajukan

Gambar 1 menunjukkan Blok Proses yang akan

diterapkan pada penelitian ini.

Gambar 1. Blok Proses Penelitian

2.2.1

Crawling Data

Proses ini merupakan proses untuk mengambil

data – data posting dengan menggunakan bantuan

API search pada twitter. Beberapa quey yang

dicoba antara lain :

Pengelolaan sampah

Bank sampah

Sampah organik

Sampah anorganik

Sampah plastik

Solusi sampah

Pengelolaan sampah rumah

Daur ulang plastik bekas

Opini–opini

yang

diperoleh

kemudian

dilabelkan

secara

manual

untuk

keperluan

pengukuran akurasi dari proses sentimen analysis.

2.2.2

Pre-processing

Masalah utama dari pre-processing pada

sentimen analisis yang berasal dari twitter adalah

bahasanya yang kebanyakan bahasa “gaul” dan

penuh singkatan. Oleh karena itu diperlukan proses

untuk menormalkan kata – kata tersebut. Pada tugas

ini, singkatan – singkatan dan bahasa gaul yang

terdeteksi masih sangat terbatas dan akan

diperlukan

banyak

tambahan

lagi

untuk

mengantisipasi data – data baru yang kemungkinan

akan muncul.

Pre-processing

dilanjutkan

dengan

proses

pemisahan kata per kata dari kalimat opini.

2.2.3

Keyword Extraction

Proses ini dilakukan dengan mendata token/kata

yang sesuai dengan kamus. Kamus yang digunakan

adalah kamus yang berisi daftar kata – kata positif

dan negatif.

Permasalahan utama adalah penentuan kamus

data, dimana cukup banyak kata – kata yang

berhubungan dengan “sampah” yang secara umum

memiliki kata yang merupakan ciri kalimat negatif,

namun dalam kasus ini tidak bisa dianggap sebagai

kata negatif. Contoh : “sampah”, cukup banyak

opini – opini yang menggunakan kata “sampah”

sebagai kata yang bermakna negatif, namun dalam

kasus ini, tentunya kata sampah akan sering

dijumpai. Emoticon yang pada umumnya dapat

digunakan sebagai pendeteksi sentimen positif dan

negatif dalam hal ini juga memiliki makna yang

berbeda,misalnya : emoticon :D yang pada

umumnya menggambarkan sentimen positif, tapi

dalam kasus ini, biasanya emoticon ini banyak

dijumpai pada opini yang mengandung candaan

yang pada akhirnya opini tersebut dilabelkan

negatif karena tidak mengandung solusi, contoh :

@dentaaftriyana Iye gue mungutin saMpah

plastik,lo mungutin besi karat yehdent buat

diloakin:D (canda yeh jgn marah)

2.2.4

Sentiment Determination

Proses ini merupakan proses penentuan opini

tersebut tergolong dalam kelompok positf atau

negatif. Kelompok positif merupakan kandidat-

kandidat yang berisi solusi yang dapat ditemukan.

Daftar solusi yang terbentuk dapat dijadikan

acuan bagi masyarakat untuk dapat menerapkan

solusi pengelolaan sampah yang dirasakan paling

tepat, bahkan bisa juga menjadi peluang usaha.

Idealnya solusi yang muncul dalam social media

merupakan solusi yang sudah cukup dikenal di

masyarakat, sehingga kemungkinan besar bisa

diterapkan oleh masyarakat pada umumnya.