Melihat Antusiasme Warganet Mengenai Tol Japek Elevated
Beberapa waktu yang lalu, Pak Presiden Jokowi meresmikan tol layang Jakarta Cikampek elevated. Pembangunan jalan layang yang berhasil membuat kemacetan parah selama ini akhirnya selesai juga.
Menarik bagi saya untuk melihat antusiasme warganet terhadap jalan layang ini.
Kali ini, saya tidak akan mengambil data dari twitter atau sosial media lainnya. Saya akan mencari keywords apa yang ditelusuri warganet di Google terkait dengan topik ini.
Untuk itu, saya akan menggunakan library(gtrendsR)
di R. Topik
yang akan saya cari adalah semua topik yang berkaitan dengan dua
keywords utama, yakni:
tol jakarta cikampek
japek
Tak butuh waktu satu detik, saya sudah mendapatkan hasilnya pencarian saya. Ada empat dataset yang saya terima, yakni:
interest_over_time
interest_by_region
interest_by_city
related_queries
Seperti biasa, mari kita bedah satu-persatu:
interest_over_time
Apa saja sih isi dari dataset ini?
## 'data.frame': 520 obs. of 7 variables:
## $ date : POSIXct, format: "2014-12-28" "2015-01-04" ...
## $ hits : int 4 2 3 3 3 4 4 1 2 3 ...
## $ geo : chr "ID" "ID" "ID" "ID" ...
## $ time : chr "today+5-y" "today+5-y" "today+5-y" "today+5-y" ...
## $ keyword : chr "tol jakarta cikampek" "tol jakarta cikampek" "tol jakarta cikampek" "tol jakarta cikampek" ...
## $ gprop : chr "web" "web" "web" "web" ...
## $ category: int 0 0 0 0 0 0 0 0 0 0 ...
Inti dari dataset ini adalah trend pencarian dua keywords ini perwaktu. Dengan mudahnya saya bisa membuat lineplot dari dataset ini sbb:
Sepertinya penggunaan singkatan japek baru nge- hype akhir-akhir ini yah.
Coba kalau saya rapikan kembali datanya. Saya akan gabungkan pencarian kedua keywords ini lalu akan saya jadikan dalam level bulanan. Saya penasaran, apakah ada pola seasonal dari pencarian ini.
Siapa tahu pencarian mengenai jalan tol ini meningkat hanya di saat-saat tertentu saja. Misalkan: pada saat liburan lebaran atau natal.
Gimana? Sudah terlihat ada pola seasonal-nya? Oke, kalau saya ubah ke bentuk grafik berikut ini gimana:
Dugaan saya, ada peningkatan pencarian di dekat-dekat musim liburan lebaran.
Dengan menggunakan prinsip dekomposisi data time series, saya akan coba melihat pattern underlying the data.
Dilihat dari trend pencarian, ternyata meningkat over time. Bagaimana dengan pola seasonal-nya? Mari kita highlight bagian seasonal dari grafik di atas menjadi sebagai berikut:
Ternyata ada pola kenaikan pencarian pada masa-masa liburan lebaran dan akhir tahun.
interest_by_region
Berikutnya kita akan membahas dataset interest_by_region
. Apa saja
variabel yang ada di dataset tersebut?
str(data$interest_by_region)
## 'data.frame': 68 obs. of 5 variables:
## $ location: chr "West Java" "Banten" "Special Capital Region of Jakarta" "Central Java" ...
## $ hits : int 100 52 44 12 11 9 4 4 4 2 ...
## $ keyword : chr "tol jakarta cikampek" "tol jakarta cikampek" "tol jakarta cikampek" "tol jakarta cikampek" ...
## $ geo : chr "ID" "ID" "ID" "ID" ...
## $ gprop : chr "web" "web" "web" "web" ...
Ternyata dataset ini berisi nama region dan seberapa besar mereka mencari kedua keywords japek ini.
Ternyata tidak warganet yang mencari keywords ini tidak hanya berasal dari region Jawa Barat dan DKI Jakarta saja. Tapi cukup menyebar di Indonesia.
interest_by_city
Berikutnya kita akan membahas dataset interest_by_city
. Apa saja
variabel yang ada di dataset tersebut?
str(data$interest_by_city)
## 'data.frame': 14 obs. of 5 variables:
## $ location: chr "Cikampek" "East Telukjambe" "Karawang" "Bekasi" ...
## $ hits : chr "100" "56" "51" "37" ...
## $ keyword : chr "tol jakarta cikampek" "tol jakarta cikampek" "tol jakarta cikampek" "tol jakarta cikampek" ...
## $ geo : chr "ID" "ID" "ID" "ID" ...
## $ gprop : chr "web" "web" "web" "web" ...
Ternyata dataset ini berisi nama city dan seberapa besar mereka mencari kedua keywords japek ini.
Mirip dengan dataset sebelumnya yah.
Ternyata warganet yang paling banyak mencari berasal dari Bekasi.
related_queries
Nah, pada dataset terakhir, kita lihat ada variabel apa saja yah:
str(data$related_queries)
## 'data.frame': 77 obs. of 6 variables:
## $ subject : chr "100" "97" "96" "84" ...
## $ related_queries: chr "top" "top" "top" "top" ...
## $ value : chr "jalan tol cikampek jakarta" "jalan tol" "jalan tol cikampek" "info tol jakarta cikampek" ...
## $ geo : chr "ID" "ID" "ID" "ID" ...
## $ keyword : chr "tol jakarta cikampek" "tol jakarta cikampek" "tol jakarta cikampek" "tol jakarta cikampek" ...
## $ category : int 0 0 0 0 0 0 0 0 0 0 ...
## - attr(*, "reshapeLong")=List of 4
## ..$ varying:List of 1
## .. ..$ value: chr "top"
## .. ..- attr(*, "v.names")= chr "value"
## .. ..- attr(*, "times")= chr "top"
## ..$ v.names: chr "value"
## ..$ idvar : chr "id"
## ..$ timevar: chr "related_queries"
Kita akan lakukan simple text analysis dari data related_query ini yah.
Wordcloud
Ada yang bisa disimpulkan dari data related queries ini?