نوع مقاله : مقاله پژوهشی
نویسندگان
1 گروه مهندسی صنایع ، دانشکده فنی و مهندسی، دانشگاه تربت حیدریه، تربت حیدریه ، ایران
2 گروه مهندسی صنایع، دانشکده فنی و مهندسی، دانشگاه فردوسی مشهد، مشهد، ایران
چکیده
پیشینه و اهداف: در حال حاضر پیشرفتهای قابل توجهی در عرصه فناوری اطلاعات و ارتباطات در جوامع مختلف دیده میشود. با توجه به این پیشرفتها، دانشگاهها به عنوان یک نهاد پیشرو در عرصه علم، به سمت فرآیندهای الکترونیکی در مسیر مدیریت آموزش حرکت نمودهاند و در محیطهای آموزشی، پایگاههای اطلاعاتی با حجم اطلاعات زیاد وجود دارد. با تحلیل این دادههای انبوه سیستمهای آموزشی، میتوان روشهایی را برای بهبود وضعیت آموزشی دانشجویان ارایه داد. دادهکاوی آموزشی به دنبال کشف دانش موجود در دادههای سیستم آموزشی بودهاست. یکی از کاربردهای دادهکاوی آموزشی، پیشبینی عملکرد تحصیلی دانشجویان است. پیشبینی عملکرد تحصیلی دانشجویان و ارائه راهکارهای مفید از اهمیت ویژهای در موفقیت نظامهای آموزشی برخوردار است و میتواند به تصمیمگیری درست مدیران، جهت افزایش بازدهی سیستم آموزشی و عملکرد بهتر دانشجویان، کمک شایانی کند. هدف مقاله حاضر، شناسایی شاخصهای مؤثر بر عملکرد تحصیلی، پیشبینی وضعیت تحصیلی دانشجویان با استفاده از تکنیکهای دادهکاوی و در نهایت، ارائه روندی جدید برای اصلاح روش انتخاب واحد و راهکارهای آموزشی در جهت افزایش کارایی سیستم آموزش است.
روشها: گامهای این پژوهش بر اساس مدل Crisp تعیین شده است. در پژوهش حاضر، پایگاهدادهای شامل 9 مجموعه داده از درسهای تخصصی رشته مهندسی صنایع استفاده شدند. دوره تحصیلی دانشجویان در نظر گرفته شده کارشناسی بودهاست. شاخصهای تاثیرگذار بر عملکرد دانشجویان، بر اساس تحقیقات قبلی و نظر خبرگان شناسایی شدهاست. دادههای جمعیتشناختی و سوابق تحصیلی دانشجویان مقطع کارشناسی رشته مهندسی صنایع وارد پایگاه داده شدند. پس از پیشپردازش دادهها، 13 شاخص در نظر گرفته شد و با کمک الگوریتمهای مختلف، مدلهای مختلفی برای پیشبینی وضعیت تحصیلی دانشجویان در نیمسال بعدی ارائه گردید. مدلهای شبکه بیزی، لوجیت بوست، پارت و درخت تصمیم به عنوان پرکاربردترین الگوریتم های دادهکاوی آموزشی در این پژوهش مورد استفاده قرار گرفته و جهت بررسی عملکرد الگوریتمها از دو شاخص صحت و سطح زیر نمودار عملکرد استفاده شد. 9 پایگاه داده دروس در دو حالت دو و چند کلاسه در نظر گرفتهشدند. در ادامه، مقایسهای میان نتایج حاصل از 4 الگوریتم مختلف صورت گرفتهاست.
یافتهها: با توجه به شاخصهای بهره اطلاعات و نسبت بهره، تمامی 13 شاخص در نظر گرفته شده، به عنوان شاخصهای مؤثر شناسایی شدند. این شاخصها عبارتند از: معدل، کل واحدهای گذرانده، تعداد ترمهای مشروطی، نوع پذیرش، وضعیت تأهل، جنسیت، سال ورود به دانشگاه، سن، محل زندگی، ترم حاضر، نمره درس پیشنیاز، استاد درس، تکرارد در اخذ واحد. از بین 4 مدل در نظر گرفته شده، بهترین مدل در دستهبندی و پیشبینی عملکرد آموزشی دانشجویان ، الگوریتم Logit Boost شناخته شد. این الگوریتم، در هر دو حالت دو و چندکلاسه براساس شاخصهای درصد صحت و سطح زیر نمودار ROC عملکرد بهتری از خود نشان دادهاست.
نتیجهگیری: با توجه به عملکرد قابل قبول الگوریتمهای دادهکاوی، استفاده از این الگوریتمها در پیشبینی عملکرد دانشجویان مناسب است و میتوان مدل پیشنهادی را به عنوان یک ابزار پشتیبان تصمیمگیری در سیستمهای آموزشی مورد استفاده قرار داد. در نهایت، با توجه به نتایج بهدست آمده و نظرخواهی از خبرگان دانشگاهی، فرایند انتخاب واحد، بازطراحی گردید. فرایند ارایه شده با استفاده از دادههای موجود در سیستمهای آموزشی و علم دادهکاوی، دانش مفیدی به تصمیمگیرندگان جهت تصمیم صحیح و مناسب ارایه میدهد. تصمیمگیرندگان میتوانند با بررسی پیشبینیهای انجام شده توسط الگوریتم دادهکاوی و کسب اطلاعات مفید، تصمیمات مناسب اخذ نمایند، تا سیستم آموزشی بازدهی بیشتری داشتهباشد.
کلیدواژهها
موضوعات
عنوان مقاله [English]
Predicting and analyzing the performance of students through data mining techniques to improve academic performance
نویسندگان [English]
- M. Ghodoosi 1
- F. Mirsaeedi 2
- H. Koosha 2
1 Department of industrial Engineering, university of Torbat Heydarieh, Torbat Heydarieh,Iran
2 Department of Industrial Engineering, Ferdowsi University of Mashhad, Iran
چکیده [English]
Background and Objectives: Nowadays, significant advancements in information technology and communication field in different societies are seen. Given that these advancements, universities as a leading institution in the field of science, have moved towards electronic processes in the management of education and educational environments, there are databases with a large amount of information. By analyzing this massive data of educational systems, methods can be provided to improve the educational status of students. Educational data mining has sought to discover the knowledge contained in the data of the educational system. One of the applications of educational data mining is to predict students' academic performance. Predicting students' academic performance and providing useful solutions is of particular importance in the success of educational systems and can help managers make the right decisions to increase the efficiency of the educational system and better student performance. The purpose of this paper is to identify the effective indicators on academic performance, predict students' academic status using data mining techniques, and finally present a new trend for modifying unit selection and educational strategies to increase the efficiency of the education system.
Methods: steps of this research are determined according to CRISP model. In current research, Databases containing 9 datasets of specialized courses in industrial engineering were used. The students' grade was bachelor's degree. Indicators affecting student performance have been identified based on previous researches and expert opinions. Demographic data and academic records of undergraduate students are entered in database. After data preprocessing, 13 attributes are selected, different models were proposed to predict student's academic status in the next semester. Then, a comparison between the results of 4 different algorithms has been done.
Findings: All 13 attributes are identified to be effective according to information gain and gain ratio. This 13 attributes as follow: GPA, Total passed units, Number of conditional terms, Type of admission, Marital status, Gender, University admission year, Living place , Age, Current semester, Prerequisite course score, instructor of the course, Repeat the course. Between of 4 considered models, the Logit Boost algorithm is known as the best model in categorizing in two class and multi-class according to the accuracy rate and ROC.
Conclusion: Because of acceptable performance of data mining algorithms, the use of these algorithms in predicting student performance is appropriate and the proposed model can be used as a support tool for decision making in educational systems. Finally, according to the obtained results and the opinion of academic experts, the unit selection process was redesigned. The proposed model can be used as a decision support tool in educational systems. Finally, due to the results obtained and the opinions of the academic experts, the process of unit selection was redesigned. The presented process uses the available data in educational systems and data mining science, provides useful knowledge to decision-makers to make the right and appropriate decision. Decision makers can make appropriate decisions by examining the predictions made by the data mining algorithm and obtaining useful information, in order to make the educational system more efficient.
کلیدواژهها [English]
- Educational data mining
- unit selection
- academic performance
- Logit Boost
COPYRIGHTS
©2020 The author(s). This is an open access article distributed under the terms of the Creative Commons Attribution (CC BY 4.0), which permits unrestricted use, distribution, and reproduction in any medium, as long as the original authors and source are cited. No permission is required from the authors or the publishers.
ارسال نظر در مورد این مقاله