چکیده:
امروزه اندازهگیری کیفیت داده یکی از مهمترین راهبردها در بهبود فرایندهای کسب و کارهای دادهمحور به حساب میآید. هرگونه تصمیم درست برای بهبود سیستمها در این دسته از سازمانها به یک تحلیل مناسب از کیفیت دادهها وابسته است. دادههای پژوهشی و به ویژه پایاننامه/رسالهها (پارساها)ی دانشآموختگان کل کشور برپایه همین اصل از جنبههای گوناگون کیفیت داده نیازمند بررسی و ارزیابی است. در فرایند ثبت پارساها کنترل کیفیت فرادادهها یکی از مهمترین بخشهاست که به بررسی قلمهای اطلاعاتی مدارک (مانند نام پژوهشگر، استادان راهنما و مشاور، چکیده، فهرست و ...) میپردازد. در وضعیت موجود، مدارک ناهمخوان در حین فرایند کنترل کیفیت شناسایی شده و پس از درج در سامانه (بصورت متن) مدرک مربوطه به صورت سیستمی به پژوهشگر برگردانده میشود. استاندارد نبودن ناهمخوانهای شناسایی شده و نبود دستهبندی مناسب برای مدارک ناهمخوان، به اطلاعرسانی سلیقهای به پژوهشگران منجر شده، تحلیلهای آماری از مشکلات کیفی فرادادهها را بادشواری روبرو ساخته و همچنین تحلیل ریشهای خطاهای مشاهده شده را ناممکن میسازد. از اینرو، در این پژوهش ساختار ناهمخوانهای مشاهده شده پس از استاندارد شدن به صورت آزمایشی در دورهای دوماهه استفاده شده و نتایج آن ارائه شده است. ناهمخوانی در تاریخ دفاع، صفحه عنوان (فارسی و انگلیسی) و وجود صفحههای سفید در فایل پارسا از جمله مهمترین دلایل بازگرداندن مدارک به کاربران بوده است. همچنین تحلیل همه دادهها نشان داد 59 درصد از ناهمخوانیها به فایلهای ضمیمه شده و 41 درصد به اطلاعات ثبت شده در سامانه مربوط میشود. در نهایت برپایه تحلیلهای انجام شده رهنمودهایی برای کاربران سامانه بمنظور بهبود کیفیت دادهها، به تفکیک حوزههای تخصصی، ارائه شده است.
Today, measuring data quality is one of the most important strategies in improving data-driven business processes. Any correct decision to improve systems in this category of organizations depends on an appropriate analysis of data quality. Research data and especially theses / dissertations of graduates of the whole country based on this principle from various aspects of data quality need to be reviewed and evaluated. In the process of registering, the quality control of metadata is one of the most important parts that examines the information items of documents (such as the name of the researcher, supervisors and advisors, abstract, index, etc.).In the current situation, incompatible documents are identified during the quality control process and after entering in the system (as text), the relevant document is systematically returned to the researcher. Non-standard incompatible identified and the lack of proper classification for incompatible documents leading to informing tastes to researchers, making statistical analysis of metadata quality problems difficult, and also make it impossible to analyze the root of observed errors. Therefore, in this study, the incompatible structure observed after standardization has been used experimentally in two-month periods and the results have been presented. Incompatible in thesis defense date, the title page (Persian and English) and the existence of white pages in the file have been among the most important reasons for returning documents to users. Also, the analysis of all data showed that 59% of the incompatibles were related to the attached files and 41% to the information recorded in the system. Finally, based on the performed analyzes, guidelines have been provided for the users of the system in order to improve the quality of data, according to specialized areas