فصلنامه علمی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه کامپیوتر، واحد نطنز، دانشگاه آزاد اسلامی، نطنز، ایران

2 گروه آموزشی مهندسی کامپیوتر دانشکده مهندسی برق و کامپیوتر، دانشگاه ملی مهارت، تهران، ایران

چکیده

زمینه و هدف:

داده‌کاوی آموزشی به‌عنوان یکی از حوزه‌های نوین و میان‌رشته‌ای، نقش مهمی در تحلیل رفتار یادگیرندگان، شناسایی عوامل مؤثر بر موفقیت یا افت تحصیلی و پشتیبانی از تصمیم‌گیری‌های آموزشی ایفا می‌کند. با رشد سامانه‌های آموزش الکترونیکی و افزایش حجم داده‌های آموزشی، نیاز به روش‌های هوشمند برای استخراج دانش نهفته در این داده‌ها بیش از پیش احساس می‌شود. روش‌های سنتی یادگیری ماشین، هرچند در بسیاری از پژوهش‌ها به کار گرفته شده‌اند، اما در مواجهه با داده‌های پیچیده، غیرخطی و چندبعدی آموزشی با محدودیت‌هایی از نظر دقت و قدرت تعمیم‌پذیری روبه‌رو هستند. در این میان، مدل‌های مبتنی بر یادگیری عمیق و شبکه‌های عصبی مصنوعی به دلیل توانایی بالا در مدل‌سازی روابط پیچیده، توجه پژوهشگران را به خود جلب کرده‌اند. هدف اصلی این پژوهش، توسعه و ارزیابی یک مدل ترکیبی هوشمند مبتنی بر شبکه‌های عصبی پیشخور شامل شبکه عصبی مصنوعی، شبکه یادگیری با سرعت بالا (ELM) و شبکه پرسپترون چندلایه به همراه روش‌های پیشرفته انتخاب ویژگی است تا ضمن شناسایی متغیرهای کلیدی مؤثر بر عملکرد تحصیلی دانشجویان، دقت پیش‌بینی وضعیت تحصیلی آن‌ها به‌طور معناداری افزایش یابد.

روش پژوهش:

در این مطالعه، مجموعه‌ای جامع از داده‌های آموزشی شامل اطلاعات دموگرافیک، اجتماعی–اقتصادی، وضعیت ثبت‌نام، سوابق آموزشی و نمرات تحصیلی دانشجویان مورد استفاده قرار گرفت. داده‌ها از سامانه‌های آموزشی دانشگاهی و همچنین مجموعه‌داده‌های عمومی معتبر گردآوری شدند. پس از انجام پیش‌پردازش‌های لازم از جمله پاک‌سازی داده‌ها، مدیریت مقادیر گمشده و نرمال‌سازی ویژگی‌ها، فرآیند انتخاب ویژگی با استفاده از سه روش MRMR، Chi-square و ReliefF انجام شد. سپس سه شبکه عصبی ANN، ELM و MLP با استفاده از ۹۰ درصد داده‌ها آموزش داده شدند و ۱۰ درصد باقی‌مانده برای آزمون و اعتبارسنجی مدل‌ها مورد استفاده قرار گرفت. در نهایت، خروجی شبکه‌ها با بهره‌گیری از روش رأی‌گیری اکثریت به‌صورت یک مدل ترکیبی ادغام شد. عملکرد مدل پیشنهادی با استفاده از معیارهای استاندارد دقت، صحت، فراخوانی و معیار F ارزیابی گردید.

یافته‌ها و نوآوری:

نتایج حاصل از آزمایش‌ها نشان داد که روش ReliefF در مقایسه با سایر روش‌های انتخاب ویژگی، عملکرد بهتری در شناسایی ویژگی‌های مؤثر دارد. با استفاده از ۲۰ ویژگی برتر استخراج‌شده توسط این روش، مدل ترکیبی پیشنهادی به دقت ۸۱.۴۴ درصد و مقدار F برابر با ۷۲.۰۹ درصد دست یافت. در بررسی عملکرد شبکه‌های عصبی به‌صورت مستقل، شبکه ELM بهترین نتیجه را با دقت ۸۲.۸ درصد ارائه کرد که به‌طور متوسط ۲ تا ۴ درصد بالاتر از ANN و MLP بود. علاوه بر این، مقایسه مدل پیشنهادی با روش‌های سنتی یادگیری ماشین نشان داد که مدل ترکیبی شبکه‌های عصبی توانسته است دقت پیش‌بینی را بیش از ۷ درصد و دقت طبقه‌بندی را بیش از ۴ درصد بهبود بخشد که بیانگر برتری معنادار رویکرد پیشنهادی است.

نتیجه‌گیری و کارهای آینده:

یافته‌های این پژوهش نشان می‌دهد که ترکیب شبکه‌های عصبی پیشخور با روش‌های مناسب انتخاب ویژگی، رویکردی کارآمد و قابل اتکا برای پیش‌بینی وضعیت تحصیلی دانشجویان است. مدل پیشنهادی می‌تواند به‌عنوان یک ابزار تصمیم‌یار هوشمند در نظام‌های آموزشی برای شناسایی زودهنگام دانشجویان در معرض افت تحصیلی مورد استفاده قرار گیرد. در پژوهش‌های آینده، به‌کارگیری سازوکارهای توجه، روش‌های پیشرفته‌تر انتخاب ویژگی، مدل‌های یادگیری عمیق‌تر و استفاده از مجموعه‌داده‌های بزرگ‌تر و متنوع‌تر می‌تواند به بهبود بیشتر دقت و تعمیم‌پذیری مدل منجر شود..

کلیدواژه‌ها

عنوان مقاله [English]

Improving the accuracy of predicting students' academic success and failure based on the efficiency of deep feedforward neural networks

نویسندگان [English]

  • H. ziafat 1
  • Gh. Azariarani 2

1 Department of computer engineering, Nat.C., Islamic Azad University, Natanz, Iran

2 Department of Computer engineering, faculty of electrical and computer engineering, technical and vocational university, (TVU), tehran, iran

چکیده [English]

Background and Objective:

Educational data mining, as a modern and interdisciplinary field, plays a crucial role in analyzing learners’ behavior, identifying factors influencing academic success or failure, and supporting educational decision-making. With the growth of e-learning systems and the increasing volume of educational data, the need for intelligent methods to extract hidden knowledge from these data has become more pronounced. Although traditional machine learning methods have been widely used in numerous studies, they face limitations in terms of accuracy and generalization capability when dealing with complex, nonlinear, and high-dimensional educational data. In this context, deep learning–based models and artificial neural networks have attracted significant attention due to their strong ability to model complex relationships. The main objective of this study is to develop and evaluate an intelligent hybrid model based on feedforward neural networks, including Artificial Neural Networks ( ANN ), Extreme Learning Machines (ELM), and Multilayer Perceptron (MLP), combined with advanced feature selection methods, in order to identify key variables affecting students’ academic performance and significantly improve the accuracy of academic status prediction.

Research Methodology:

In this study, a comprehensive set of educational data was utilized, including demographic, socio-economic, enrollment-related information, educational records, and students’ academic grades. The data were collected from university educational systems as well as reputable public datasets. After performing necessary preprocessing steps such as data cleaning, handling missing values, and feature normalization, the feature selection process was carried out using three methods: MRMR, Chi-square, and ReliefF. Subsequently, the three neural networks (ANN, ELM, and MLP) were trained using 90% of the data, while the remaining 10% was used for testing and model validation. Finally, the outputs of the networks were integrated into a hybrid model using a majority voting strategy. The performance of the proposed model was evaluated using standard metrics, including accuracy, precision, recall, and the F-measure.

Findings and Contributions:

The experimental results demonstrated that the ReliefF method outperformed the other feature selection techniques in identifying influential features. Using the top 20 features selected by this method, the proposed hybrid model achieved an accuracy of 81.44% and an F-measure of 72.09%. In the evaluation of individual neural networks, the ELM model exhibited the best performance with an accuracy of 82.8%, which was on average 2–4% higher than that of ANN and MLP. Moreover, comparison with traditional machine learning approaches revealed that the hybrid neural network model improved prediction accuracy by more than 7% and classification accuracy by over 4%, indicating the significant superiority of the proposed approach.

Conclusion and Future Work:

The findings of this study indicate that combining feedforward neural networks with appropriate feature selection methods provides an efficient and reliable approach for predicting students’ academic status. The proposed model can serve as an intelligent decision-support tool in educational systems to enable early identification of students at risk of academic failure. Future research may focus on incorporating attention mechanisms, more advanced feature selection techniques, deeper learning models, and larger and more diverse datasets to further enhance the accuracy and generalizability of the model.

کلیدواژه‌ها [English]

  • Academic performance prediction
  • educational data mining
  • Extreme learning machine
  • Relief feature selection
  • Deep feedforward neural networks

نامه به سردبیر

سر دبیر نشریه فناوری آموزش، با تواضع انتشار نامه های واصله از نویسندگان و خوانندگان و بحث در سامانه نشریه را ظرف 3 ماه از تاریخ انتشار آنلاین مقاله در سامانه و یا قبل از انتشار چاپی نشریه، به منظور اصلاح و نظردهی امکان پذیر نموده است.، البته این شامل نقد در مورد تحقیقات اصلی مقاله نمی باشد.

توچه به موارد ذیل پیش از ارسال نامه به سردبیر لازم است در نظر گرفته شود:


[1]نامه هایی که شامل گزارش از آمار، واقعیت ها، تحقیقات یا نظریه ها هستند، لازم است همراه با منابع معتبر و مناسب باشند، اگرچه ارسال بیش از زمان 3 نامه توصیه نمی گردد

[2] نامه هایی که بجای انتقاد سازنده به ایده های تحقیق، مشتمل بر حملات شخصی به نویسنده باشند، توجه و چاپ نمی شود

[3] نامه ها نباید بیش از 300 کلمه باشد

[4] نویسندگان نامه لازم است در ابتدای نامه تمایل یا عدم تمایل خود را نسبت به چاپ نظریه ارسالی نسبت به یک مقاله خاص اعلام نمایند

[5] به نامه های ناشناس ترتیب اثر داده نمی شود

[6] شهر، کشور و محل سکونت نویسندگان نامه باید در نامه مشخص باشد.

[7] به منظور شفافیت بیشتر و محدودیت حجم نامه، ویرایش بر روی آن انجام می پذیرد.

CAPTCHA Image