Mencari Super Spreader di Suatu Kelompok Konsumen

22 minute read

Pada 2020 lalu, saya pernah menuliskan bagaimana aplikasi penggunaan social network analysis dalam konteks human resources di perusahaan tempat saya bekerja. Kali ini saya akan coba menuliskan aplikasi penggunaan social network analysis pada suatu komunitas konsumen.

Tahun 2003, Malcolm Gladwell mempopulerkan konsep ‘The Tipping Point’, yakni suatu gagasan dimana epidemi, tren sosial, dan produk viral tidak menyebar secara merata. Melainkan, penyebarannya sangat bergantung pada segelintir orang yang ia sebut Connectors, Mavens, dan Salesmen.

Dua dekade kemudian, saya masih sering mendengar versi modernnya saat meeting bersama tim marketing:

Kita perlu mencari influencer yang tepat!

Maka masalahnya sekarang adalah bagaimana caranya mengidentifikasi influencer organik di dalam komunitas konsumen kita sendiri. Bukan seorang artis berbayar tapi orang-orang nyata yang paling banyak mempengaruhi keputusan pembelian bagi orang lain.

Untuk menjawabnya, kita perlu melakukan social network analysis yang memandang komunitas konsumen bukan sebagai kumpulan individu, melainkan sebagai jaringan hubungan.

Social Network Analysis (SNA) adalah metode untuk mempelajari struktur sosial melalui teori graf. Dalam konteks market research, kita memodelkan:

Node (simpul) = konsumen atau individu.
Edge (sisi/panah) = hubungan antar konsumen, misalnya ‘A merekomendasikan produk kepada B’.
Weight (bobot) = kekuatan hubungan, misalnya frekuensi rekomendasi.

Jaringan ini bisa directed (berarah, maksudnya A → B tidak sama dengan B → A) atau undirected (tidak berarah). Untuk analisa word-of-mouth, kita biasanya menggunakan directed graph karena rekomendasi memiliki arah.

Metrik Centrality: Mengukur “Kepentingan” Sebuah Node

Inti dari identifikasi super spreader adalah mencari dan menghitung semua metrik centrality. Ada empat metrik utama yang akan kita gunakan:

Metrik	Definisi	Analogi
Degree centrality	Jumlah koneksi langsung yang dimiliki node	Orang yang paling banyak temannya
Betweenness centrality	Seberapa sering node menjadi jembatan jalur terpendek antar node lain	Broker atau perantara informasi
Closeness centrality	Seberapa dekat (rata-rata) node ke semua node lain	Orang yang paling cepat menerima informasi baru
Page rank	Pengaruh berbasis kualitas koneksi, bukan hanya kuantitas	Populer di kalangan orang-orang yang juga populer

Mengapa diperlukan empat metrik yang berbeda?

Setiap metrik menangkap dimensi pengaruh yang berbeda. Seseorang bisa punya degree tinggi (banyak teman) tapi betweenness rendah (temannya saling kenal satu sama lain, jadi dia bukan jembatan kritis). Super spreader sejati biasanya tinggi di beberapa metrik sekaligus.

Oke, saya akan coba membuat data sintetis untuk sebagai contoh studi kasus.

Data Survey Minuman Kesehatan

Saya akan mensimulasikan sebuah brand minuman kesehatan yang baru diluncurkan. Tim marketing melakukan survei kepada 50 konsumen awal dengan pertanyaan:

“Apakah Anda pernah merekomendasikan produk ini kepada seseorang? Jika ya, siapa saja (nama atau inisial)?” dan “Dari siapa Anda pertama kali mendengar tentang produk ini?”

Dari survei ini, misalkan kita punya 50 orang konsumen. Kemudian kita mendapatkan edge list, yakni daftar pasangan konsumen (A merekomendasikan kepada B).

from	to	weight
Andi	Budi	1
Andi	Citra	1
Andi	Dewi	1
Andi	Eko	1
Andi	Fani	1
Andi	Gilang	1
Andi	Hana	1
Andi	Irwan	1
Budi	Qori	1
Budi	Rafi	1
Citra	Joko	1
Citra	Kartika	1
Citra	Luki	1
Citra	Mira	1
Citra	Nanda	1
Citra	Oki	1
Citra	Prita	1
Dewi	Kevin	1
Dewi	Sinta	1
Evan	Cici	1
Evan	Dian	1
Fani	Juli	1
Galih	Zara	1
Gilang	Laras	1
Gilang	Mario	1
Hana	Nina	1
Irwan	Oscar	1
Irwan	Putri	1
Joko	Sinta	1
Joko	Tono	1
Joko	Umar	1
Joko	Vina	1
Joko	Wawan	1
Joko	Xena	1
Kartika	Evan	1
Kartika	Fitri	1
Kartika	Galih	1
Kartika	Hesti	1
Kartika	Imam	1
Laras	Agus	1
Luki	Reza	1
Mira	Sarah	1
Mira	Tegar	1
Nanda	Ulfa	1
Oki	Vino	1
Oki	Wulan	1
Prita	Xander	1
Rafi	Andi	1
Rafi	Yanti	1
Sinta	Agus	1
Sinta	Bagas	1
Sinta	Cici	1
Sinta	Dian	1
Sinta	Yudi	1
Sinta	Zara	1
Tono	Citra	1
Umar	Joko	1
Vina	Kartika	1
Vina	Sinta	1
Wawan	Bagas	1

Untuk bisa melakukan social network analysis di R, kita perlu mengubah bentuk data di atas menjadi object graph.

# Buat directed graph dari edge list
g <- graph_from_data_frame(
  d        = df_edges,
  directed = TRUE,
  vertices = konsumen
)

Summary dari graph-nya adalah:

Jumlah node (konsumen): 50 

Jumlah edge (rekomendasi): 60 

Apakah graf connected? TRUE 

Diameter jaringan: 5 

Rata-rata path length: 2.738462 

Densitas jaringan: 0.0245

Sekarang akan saya hitung semua metrik centrality. Tidak lupa saya menambahkan satu skor lagi bernama skor komposit yang merupakan rata-rata dari rank empat metrik yang ada. Artinya orang dengan ranking 1 memiliki centrality tertinggi. Maka skor komposit terendah menandakan konsumen tersebut merupakan super spreader.

# Hitung semua metrik centrality sekaligus
df_centrality <- data.frame(
  nama = V(g)$name,

  # Degree: jumlah koneksi langsung
  # out-degree = berapa orang yang dia rekomendasikan
  # in-degree  = berapa orang yang merekomendasikan dia
  degree_out = degree(g, mode = 'out'),
  degree_in  = degree(g, mode = 'in'),
  degree_all = degree(g, mode = 'all'),

  # Betweenness: seberapa sering jadi 'jembatan'
  betweenness = betweenness(g, normalized = TRUE),

  # Closeness: seberapa dekat ke semua node lain
  closeness = closeness(g, mode = 'all', normalized = TRUE),

  # PageRank: popularitas berbasis kualitas koneksi
  pagerank = page_rank(g)$vector
) %>%
  # Buat skor komposit: rata-rata rank dari semua metrik
  mutate(
    rank_degree      = rank(-degree_all),
    rank_betweenness = rank(-betweenness),
    rank_closeness   = rank(-closeness),
    rank_pagerank    = rank(-pagerank),
    skor_komposit = (rank_degree + rank_betweenness +
                     rank_closeness + rank_pagerank) / 4
  ) %>%
  arrange(skor_komposit)

Berikut ini adalah 10 orang konsumen yang termasuk ke dalam super spreader:

=== TOP 10 SUPER SPREADER ===

      nama degree_out degree_in degree_all betweenness closeness pagerank
  Citra          7         2          9      0.0536    0.4712   0.0290
   Joko          6         2          8      0.0276    0.3889   0.0304
  Sinta          6         3          9      0.0202    0.3712   0.0302
   Andi          8         1          9      0.0391    0.4414   0.0205
Kartika          5         2          7      0.0183    0.3769   0.0232
   Rafi          2         1          3      0.0204    0.3161   0.0188
   Vina          2         1          3      0.0051    0.3224   0.0168
   Tono          1         1          2      0.0111    0.3500   0.0168
   Mira          2         1          3      0.0060    0.3311   0.0160
   Oki          2         1          3      0.0060    0.3311   0.0160
   rank_degree rank_betweenness rank_closeness rank_pagerank skor_komposit
          2              1.0            1.0           6.0         2.500
          4              3.0            3.0           4.0         3.500
          2              5.0            5.0           5.0         4.250
          2              2.0            2.0          15.5         5.375
          5              6.0            4.0          14.0         7.250
         10              4.0           16.0          24.0        13.500
         10             11.0           13.0          30.0        16.000
         22              7.0            7.0          30.0        16.500
         10              9.5            8.5          41.0        17.250
        10              9.5            8.5          41.0        17.250

Perhatikan bahwa ada lima orang super spreader yang memiliki skor komposit terendah.

Citra - Skor komposit: 2.5
Joko - Skor komposit: 3.5
Sinta - Skor komposit: 4.25
Andi - Skor komposit: 5.375
Kartika - Skor komposit: 7.25

Berikut adalah karakteristik masing-masing super spreader:

Citra (Super Spreader #1)

Degree centrality tertinggi: degree_all = 9 (maksimum)
Betweenness centrality tertinggi: 0.0536 (ranking 1)
Closeness centrality tertinggi: 0.4712 (ranking 1)
PageRank: 0.029 (ranking 6)
Karakteristik: Citra adalah hub utama dalam jaringan, memiliki koneksi keluar (degree_out = 7) yang sangat tinggi, berperan sebagai broker informasi (betweenness tinggi), dan dapat menjangkau semua node dengan cepat (closeness tinggi).

Joko (Super Spreader #2)

Degree_all: 8 (sangat tinggi)
Betweenness: 0.0276 (ranking 3)
Closeness: 0.3889 (ranking 3)
PageRank: 0.0304 (ranking 4) - tertinggi di antara semua
Karakteristik: Joko memiliki pengaruh yang kuat (PageRank tertinggi) meskipun degree centrality sedikit lebih rendah dari Citra.

Sinta (Super Spreader #3)

Degree_all: 9 (maksimum, sama dengan Citra)
Betweenness: 0.0202 (ranking 5)
Closeness: 0.3712 (ranking 5)
PageRank: 0.0302 (ranking 5)
Karakteristik: Sinta memiliki koneksi inbound yang lebih baik (degree_in = 3, tertinggi di antara super spreader), menunjukkan popularitas yang tinggi.

Andi (Super Spreader #4)

Degree_out: 8 (tertinggi)
Betweenness: 0.0391 (ranking 2)
Closeness: 0.4414 (ranking 2)
PageRank: 0.0205 (ranking 15.5) - relatif rendah
Karakteristik: Andi adalah eksporter informasi aktif (degree_out tertinggi) dan broker yang kuat, tetapi kurang berpengaruh dalam PageRank.

Kartika (Super Spreader #5)

Degree_all: 7 (tinggi)
Betweenness: 0.0183 (ranking 6)
Closeness: 0.3769 (ranking 4)
PageRank: 0.0232 (ranking 14)
Karakteristik: Kartika memiliki profil yang seimbang dengan semua metrik di atas rata-rata.

Saya bisa rangkum menjadi beberapa poin penting berikut ini:

1. Tipe Super Spreader:

Citra: Complete Hub - Unggul di semua aspek.
Joko: Influencer - PageRank tertinggi, pengaruh kuat.
Sinta: Popular Connector - Koneksi inbound terbaik.
Andi: Active Exporter - Outbound connections terkuat.
Kartika: Balanced Connector - Profil seimbang.

2. Pola Koneksi:

Citra & Sinta: Degree_all = 9 (full connectivity).
Joko & Andi: Degree_out sangat tinggi (6 dan 8).
Sinta: Degree_in tertinggi (3) - paling populer.

3. Peran dalam Jaringan:

Broker (Betweenness tinggi): Citra, Andi, Joko.
Influencer (PageRank tinggi): Joko, Sinta.
Accessible (Closeness tinggi): Citra, Andi.

Untuk Marketing Campaign:

Fokus pada Citra sebagai primary influencer - dampak terbesar.
Gunakan Joko untuk viral campaigns karena PageRank tertinggi.
Libatkan Sinta untuk endorsement karena popularitas inbound tinggi.
Manfaatkan Andi untuk outreach aktif karena outbound connections kuat.

Segmentasi Super Spreader:

Elite Influencers (Citra, Joko): Untuk brand awareness maksimal.
Active Promoters (Andi): Untuk product launches.
Community Connectors (Sinta, Kartika): Untuk engagement programs.

Deteksi Cluster dalam Komunitas

Selain menemukan super spreader, kita juga bisa mencari tahu apakah ada kelompok-kelompok (clusters) konsumen yang lebih sering berinteraksi satu sama lain. Hal ini penting untuk strategi segmentasi pesan marketing.

Untuk community detection, saya menggunakan undirect graph dengan metode Louvain.

Metode Louvain adalah algoritma populer untuk menemukan kelompok (komunitas) dalam jaringan besar dengan cara memaksimalkan nilai modularity, yaitu ukuran yang menilai seberapa kuat hubungan antar node di dalam kelompok dibandingkan hubungan acak. Prosesnya terdiri dari dua fase yang berulang: pertama, algoritma memindahkan setiap node ke komunitas tetangganya secara rakus (greedy) untuk melihat apakah kepadatan koneksi meningkat; kedua, node-node yang sudah berkelompok tersebut disatukan menjadi satu “node raksasa” untuk membentuk jaringan baru yang lebih ringkas. Langkah-langkah ini terus diulangi hingga tidak ada lagi perpindahan yang bisa meningkatkan kualitas pengelompokan, sehingga menghasilkan struktur komunitas yang hierarkis dan efisien secara komputasi.

Berikut adalah kelompok-kelompok konsumen yang dihasilkan:

Modularity Louvain: 0.5956

kelompok	n_anggota	anggota
1	15	Andi, Budi, Dewi, Eko, Fani, Hana, Irwan, Qori, Rafi, Juli, Kevin, Nina, Oscar, Putri, Yanti
5	12	Kartika, Sinta, Vina, Yudi, Zara, Cici, Dian, Evan, Fitri, Galih, Hesti, Imam
2	11	Citra, Luki, Mira, Nanda, Prita, Tono, Reza, Sarah, Tegar, Ulfa, Xander
4	5	Joko, Umar, Wawan, Xena, Bagas
3	4	Gilang, Agus, Laras, Mario
6	3	Oki, Vino, Wulan

Terlihat ada 6 kelompok dengan banyaknya anggota bervariasi. Kelompok pertama merupakan kelompok terbesar berisikan 15 orang konsumen. Selanjutnya adalah kelompok 5 dan 2 yang berisi 12 orang dan 11 orang konsumen.

Visualisasi Graph

Berikut adalah beberapa visualisasi dari graph yang dibentuk:

Dari uraian yang saya paparkan di atas, salah satu kegunaan dari SNA adalah kita bisa melakukan simulasi bagaimana penyebaran informasi terjadi. Perbedaan orang yang memulai kabar akan membedakan seberapa cepat kabar tersebut beredar. Sebagai contoh, saya akan coba buat simulasi penyebaran kabar dengan menggunakan prinsip model SIR (saya pernah menggunakan model ini untuk memodelkan penyebaran hoax).

Saya akan mencoba dua skenario, yakni:

Saat kabar dimulai dari super spreader, misalkan: Citra.
Saat kabar dimulai dari orang biasa, misalkan: Oki.

Hanya butuh 3 langkah waktu bagi Citra agar 10 orang dalam circle-nya menjadi aware dengan kabar berita. Sedangkan kabar yang disebar dari Oki hanya diketahui oleh dua orang saja.

if you find this article helpful, support this blog by clicking the ads.

Share on

X Facebook LinkedIn Bluesky

Bunch of Ideas, a little bit of Maths.

Mencari Super Spreader di Suatu Kelompok Konsumen

Metrik Centrality: Mengukur “Kepentingan” Sebuah Node

Data Survey Minuman Kesehatan

Deteksi Cluster dalam Komunitas

Visualisasi Graph

Share on

You May Also Enjoy

Optimization Story: Berapa Budget Iklan yang Optimal Berdasarkan Simulasi Monte Carlo?

Membangun Bayesian Mixed Marketing Model dengan R

Membuat Data Survey Sintetis dengan synthpop di R

Update Februari 2026: Menginstall R Studio Server ke Google Colab

Bunch of Ideas, a little bit of Maths.

Apa itu Social Network Analysis?

Metrik Centrality: Mengukur “Kepentingan” Sebuah Node

Data Survey Minuman Kesehatan

Deteksi Cluster dalam Komunitas

Visualisasi Graph

Implikasi dari Social Network Analysis yang Dihasilkan

Share on

You May Also Enjoy

Optimization Story: Berapa Budget Iklan yang Optimal Berdasarkan Simulasi Monte Carlo?

Membangun Bayesian Mixed Marketing Model dengan R

Membuat Data Survey Sintetis dengan synthpop di R

Update Februari 2026: Menginstall R Studio Server ke Google Colab