Anonimisasi & Proteksi Data Sensitif
Prompt untuk strategi de-identifikasi dan proteksi data penelitian yang sensitif
Prompt
Bantu saya menyusun strategi anonimisasi dan proteksi data sensitif:
- Jenis data sensitif: [data kesehatan/identitas responden/data keuangan/lokasi/lainnya]
- Jumlah responden/partisipan: [jumlah]
- Variabel yang mengandung PII: [sebutkan contoh: nama, NIK, alamat, dll.]
- Tujuan: [sharing publik/sharing restricted/internal only]
- Regulasi yang berlaku: [UU PDP Indonesia/GDPR/HIPAA/lainnya]
Buatkan strategi anonimisasi yang mencakup:
1. Identifikasi Data Sensitif:
- Klasifikasi variabel: direct identifiers, quasi-identifiers, sensitive attributes
- Risk assessment: seberapa mudah data bisa di-reidentifikasi?
2. Teknik Anonimisasi:
- Suppression (penghapusan kolom/baris)
- Generalization (umurnya tepat → rentang usia)
- Pseudonymization (ganti ID asli dengan kode)
- Perturbation (noise addition untuk data numerik)
- K-anonymity / L-diversity jika relevan
3. Prosedur Implementasi:
- Step-by-step cara melakukan anonimisasi
- Tools yang direkomendasikan (ARX, sdcMicro, Amnesia)
- Cara menyimpan kunci de-identifikasi secara aman
4. Validasi:
- Cara menguji apakah anonimisasi sudah memadai
- Checklist sebelum data bisa dibagikan
5. Dokumentasi:
- Catatan proses anonimisasi yang dilakukan
- Justifikasi teknik yang dipilih
Sesuaikan dengan regulasi yang saya sebutkan.
Kapan Digunakan
- Saat mempersiapkan data untuk deposit di repositori publik
- Saat diminta ethical clearance committee untuk menjelaskan proteksi data
- Saat menerima data dari pihak ketiga yang mengandung informasi sensitif
Cara Menggunakan
- Inventarisasi semua variabel yang mengandung data sensitif
- AI akan menyusun strategi anonimisasi sesuai regulasi
- Implementasikan dengan tools yang direkomendasikan
- Validasi hasil dan dokumentasikan proses yang dilakukan