چکیده:
امروزه بیشتر پژوهشگران تحقیقات کاربردی صرفاً با نگاه به مقدار−احتمال، فرضیه پژوهش را رد یا قبول میکنند؛ همچنین با توجه به رابطهای که بین مقدار−احتمال و اندازه نمونه وجود دارد، معمولاً در نمونههای بزرگ، با وجود کوچک بودن اندازه اثر با یک اطمینان بسیار بالا فرضیه ادعا پذیرفته میشود و محقق با تکیه صرف به مقدار−احتمال بهسمت حمایت از نتایج بیاهمیت عملی سوق داده میشود؛ بدین ترتیب بسیاری از مطالعات پژوهش میتوانند در زمره تحقیقاتی قرار گیرند که دارای تعدادی آزمون فرض معنادار شده، اما فاقد وجاهت کاربردی و اهمیت علمی است.
نخست این مقاله با توجه به موضوع کلانداده، مسئله حجم داده و تنوع دادهها در کلانداده از نظر آمار پرداخته، سپس مقدار−احتمال، اندازه اثر و فاصله اطمینان بهعنوان سه معیار تصمیم در آزمونهای فرض روی نمونههای مختلف در بازه (19361−173) بررسی و بهطور خاص به تأثیر کلانداده روی این سه شاخص توجه کرده است.
نتایج نشان داد کلانداده بهعنوان یک نمونه بزرگ، نهتنها مزیتی برای افزایش اطمینان در آزمونهای فرض ندارند، بلکه میتوانند موجب معنادار شدن ادعاهایی شوند که از نظر عملی اهمیت چندانی ندارند و در نمونههای نهچندان بزرگ در زمره اثرهای تصادفی و خطای نمونهگیری قرار میگیرند؛ همچنین اندازه اثر تحتتأثیر اندازه نمونه قرار نگرفته، با افزایش اندازه نمونه بهسمت یک مقدار ثابت همگرایی دارد. درنهایت دادهها نشان دادند که فاصله اطمینان از نظر بصری بهتر از شاخصهای دیگر عمل میکند
Many applied types of research have been carried out using statistical hypothesis tests and many researchers reject or accept the research hypothesis only by looking at the p-value. On the other hand, due to the relationship between the p-value and the sample size, in large samples, despite the small size of the work, the hypothesis is accepted with very high confidence, and the researcher relies solely on the p-value to support practical insignificance results. Thus, many research studies can be classified as research that has many tests of meaningful assumption but lacks practicality and scientific significance. In this paper, first, considering the issue of big data, the issue of data volume and data diversity in big data from a statistical perspective, then the p-value, effect size, and confidence interval as three decision criteria in hypothetical tests on different samples in the range (173-19361) The impact of big data on these three indicators has been examined and in particular. The results showed: A large sample is not an advantage to increasing reliability in hypothetical tests. It can make meaningful claims that are not of practical importance and in small samples fall into the category of random effects and sampling error. Also, the effect size is not affected by the sample size and converges with increasing constant sample size. Finally, the data showed that the confidence interval is visually better than other indicators.
خلاصه ماشینی:
ir ) چکیده اطلاعات مقاله امروزه بیشتر پژوهشگران تحقیقات کاربردی صرفاً با نگاه به مقدار−احتمال، فرضیه پژوهش را رد یا قبول میکنند؛ همچنین با توجه به رابطهای که بین مقدار−احتمال و اندازه نمونه وجود دارد، معمولاً در نمونههای بزرگ، با وجود کوچک بودن اندازه اثر با یک اطمینان بسیار بالا فرضیه ادعا پذیرفته میشود و محقق با تکیه صرف به مقدار−احتمال بهسمت حمایت از نتایج بیاهمیت عملی سوق داده میشود؛ بدین ترتیب بسیاری از مطالعات پژوهش میتوانند در زمره تحقیقاتی قرار گیرند که دارای تعدادی آزمون فرض معنادار شده، اما فاقد وجاهت کاربردی و اهمیت علمی است.
این دوگانگی در اهمیت موضوع و اهمیت آماری از سوی محققان مختلفی مورد توجه قرار گرفته ا 3 field"/>field"/> (1995) میگوید: مسئله این نیست که آیا تفاوتها (منظور اختلاف بین آماره و مقدار پارامتر تحت فرض صفر است) معنادار هستند (چون تقریباً همیشه در نمونههای بزرگ هستند)، اما آیا این تفاوت قابل توجه است؟ سطح معناداری را فراموش کنید، اهمیت عملی نتیج افزایش توان آزمون در نمونههای بزرگ بدان معناست که محققان میتوانند اثرهای جزئی را با تکیه به اعتبار نمونه بزرگی که در اختیار دارند تشخیص دهند، اما تفسیر نتایج با تکیه صرف به مقدار−احتمال فقط میتواند به پشتیبانی از فرض ادعایی بینجامد که اهمیت عملی کمی در مطالعات کاربرد در این مقاله به رابطه اندازه نمونه و مقدار−احتمال متمرکز و به اندازه اثر و فاصلههای اطمینان توجه شده است.