شماره ركورد :
1009040
عنوان مقاله :
شناسه‌ زدايي پرونده الكترونيك سلامت با استفاده از الگوريتم‌هاي يادگيري ماشين: يك مرور نظام‌مند
عنوان به زبان ديگر :
De-identification of Electronic Health Records Using Machine Learning Algorithms
پديد آورندگان :
لنگري زاده، مصطفي دانشگاه علوم پزشكي ايران - دانشكده مديريت و اطلاع‌ رساني پزشكي - گروه مديريت اطلاعات سلامت , اروجي، اعظم دانشگاه علوم پزشكي ايران - دانشكده مديريت و اطلاع‌ رساني پزشكي - گروه مديريت اطلاعات سلامت
تعداد صفحه :
14
از صفحه :
154
تا صفحه :
167
كليدواژه :
محرمانگي حريم خصوصي , شناسه‌زدايي و يادگيري ماشين , پرونده الكترونيك سلامت
چكيده فارسي :
پرونده الكترونيك سلامت حاوي اطلاعات باليني زيادي است كه براي فعاليت هايي چون پايش بهداشت عمومي، بهبود كيفيت و تحقيقات مورد استفاده قرار مي گيرد. همچنين پرونده الكترونيك سلامت شامل اطلاعات سلامت قابل شناسايي است و همين موضوع اشتراك و استفاده ثانويه از پرونده ها را محدود مي كند. شناسه زدايي يكي از رايج ترين روش هاي حفظ محرمانگي اطلاعات بيماران است. اين مقاله مروري نظام مند بر تحقيقات اخير مي باشد، كه به حذف تمامي شناسه ها از پرونده الكترونيك سلامت با استفاده از انواع روش هاي شناسه زدايي مبتني بر يادگيري ماشين پرداخته اند.روش: اين مقاله به صورت مروري نظام مند در بازه زماني 2016-2006 در پايگاه هاي pubmed و science direct انجام شد. مقالات با استفاده از چك ليست casp و سپس توسط دو ارزياب به طور مستقل بررسي و ارزشيابي شدند. در نهايت 12 مقاله با معيارهاي ورود مطالعه همخواني داشتند.نتايج: مقالات منتخب بر اساس روش و منابع دانش مورد استفاده، انواع شناسه ها، نوع اسناد باليني، چالش ها و نتايج حاصل بررسي شده اند. نتايج نشان داد كه در زمان انتشار داده هاي باليني براي اهداف ثانويه شناسه زدايي مبتني بر يادگيري ماشين راهكاري مناسب براي حفظ حريم خصوصي بيماران است. همچنين تركيب الگوريتم هاي يادگيري ماشين و روش هايي چون تطابق الگو و عبارات منظم مي تواند نياز به داده آموزش را كاهش دهد.نتيجه گيري: در پرونده هاي پزشكي اطلاعات شناسايي زيادي وجود دارد. اين مطالعه نشان داد كه روش هاي شناسه زدايي مبتني بر يادگيري ماشين مي توانند به طرز چشمگيري خطر افشاي اين اطلاعات را كاهش دهند.
چكيده لاتين :
Introduction: Electronic Health Record (EHR) contains valuable clinical information that can be useful for activities such as public health surveillance, quality improvement, and research. However, EHRs often contain identifiable health information that their presence limits the use of the records for sharing and secondary usages. De-identification is one of the common methods for protecting the confidentiality of patient information. This systematic review has focused on recently published studies on the usage of de-identification methods based on Machine Learning (ML) approaches for removing all identifiable information from electronic health records. Methods: A systematic review was performed in electronic databases like PubMed and ScienceDirect between 2006 and 2016. Studies were assessed for adherence to the CASP checklists and reviewed independently by two investigators. Finally, 12 articles were matched with inclusion criteria. Results: The selected studies have been discussed in terms of used methods and knowledge resources, types of identifiers detected, types of clinical documents, challenges and achieved results. The results showed that ML-based de-identification is a widely invoked approach to protect patient privacy when disclosing clinical data for secondary purposes, such as research. Also, the combination of the ML algorithms and some techniques such as pattern matching and regular expression matching could decrease need to train data. Conclusion: There is a lot of identifiable information in medical records. This study showed MLbased de-identification methods can intensively reduce the disclosure risk of information.
سال انتشار :
1396
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي
فايل PDF :
7448448
عنوان نشريه :
مجله انفورماتيك سلامت و زيست پزشكي
لينک به اين مدرک :
بازگشت