English

نشر بانک‌های اطلاعاتی سازمان‌ها جهت تحلیل پژوهشکده‌ها با حفظ محرمانگی داده‌های حساس

نشر بانک‌های اطلاعاتی سازمان‌ها جهت تحلیل پژوهشکده‌ها با حفظ محرمانگی داده‌های حساس تا آستانه‌های مطلوب متخصصین بدون تحریف یا تعمیم داده‌های اصلی
چگونه سازمان‌های دولتی و غیر دولتی می‌توانند، بدون تحریف یا تعمیم داده‌های اصلی بانک‌های اطلاعاتی خود، علاوه‌بر حفظ محرمانگی داده‌های حساس تا آستانه‌های مطلوب متخصصین، سودمندی داده‌ها را نیز جهت تحلیلگران حفظ کنند و تمام داده‌های اصلی را با یک درصد اطمینان مشخص منتشر سازند؟

با توجه به این که امروزه، مقادیر زیادی از اطلاعات حساس افراد همانند اطلاعات سلامت‌شان در بانک‌های اطلاعاتی معتبر سازمان‌های دولتی و غیردولتی مجاز موجود است، خطر ورود به آن، غیرقابل جبران است و ریسک بالایی را ایجاد می‌سازد. از طرفی برخی پژوهشکده‌های مجاز دولتی و غیردولتی که مسؤل کنکاش و آسیب‌شناسی مشکلات جامعه‌اند، نیازمند چنین اطلاعات واقعی و حساس افراد در راستای کمینه نمودن مشکلات جامعه‌ هستند. متدهای گمنام‌سازی موجود یا با تحریف، تغییر و تعمیم داده‌ها و یا با قطع صد در صد رابطه‌ی داده‌ها اقدام به حفظ محرمانگی داده‌ها می‌نمایند که متأسفانه باعث کاهش سودمندی داده‌ها جهت تحلیلگران می‌شوند.
در عصر تحلیل داده‌ها، مهمترین نیاز تحلیلگران و پژوهشکده‌ها، دسترسی به داده‌های اصلی و خام موجود در بانک‌های اطلاعاتی سازمان‌های دولتی و غیر دولتی است و مهمترین نیاز دارندگان بانک‌های اطلاعاتی، حفظ حریم خصوصی مالکین داده‌ها هنگام نشر داده‌های خام است. برای مثال، وقتی بیمارستانی، داده‌ها یا اطلاعات بیماران را جمع‌آوری می‌کند و یک پژوهشکده آن داده‌ها را جهت تحلیل یا داده‌کاوی از بیمارستان دریافت می‌نماید، بیماران به‌عنوان مالکین داده‌ها، بیمارستان به‌عنوان دارنده‌ یا ناشر داده‌ها و پژوهشکده به‌عنوان گیرنده‌ی داده‌ها تلقی می‌گردد. نام یا کد بیماری نیز به عنوان داده‌ی حساس یا به عبارتی حریم خصوصی بیماران محسوب می‌شود.
اگر هنگام نشر داده‌های اصلی و خام همیشه فرض بر این باشد که گیرنده‌ی داده‌ها ممکن است یک متخاصم باشد، مسأله‌ حایز اهمیت هنگام نشر داده‌ها در یک محیط خصمانه، حفظ حریم خصوصی توأم با حفظ سودمندی داده‌هاست. برقراری توازن بین محرمانگی داده‌ها و سودمندی داده‌ها همواره یک چالش است. زمانی هم که حریم خصوصی چند بعدی باشد، چنین چالشی پیچیده‌تر می‌شود. مساله اصلی در متدهای حفظ حریم خصوصی داده‌ها هنگام نشر داده‌ها این است که چگونه میتوان حتی‌الامکان اصل داده‌ها منتشر ‌گردد، نه داده‌های تصادفی یا مصنوعی که فایده‌ای برای پژوهشگران ندارند. متاسفانه در تمامی متدهای موجود هر چه درجه محرمانگی داده‌ها افزایش یابد درجه سودمندی داده‌ها کاهش می‌یابد.
در این طرح تحقیقاتی، سعی بر این است که متد کاربردی جدیدی پیشنهاد گردد که برخلاف متدهای رایج، دارنده داده‌ها مانند یک بیمارستان بتواند داده‌های اصلی و خام خود را با حفظ حریم خصوصی چند بعدی تا آستانه‌های موردنظر متخصصین، توأم با سودمندی داده‌ها تا حد مطلوب تحلیلگران برای پژوهشکده‌ها منتشر سازد.

اعضای پروژه:

Dr. Mohammad. Naderii
دکتر محمد نادری دهکردی عباس کریمی ریزی