Выпускная квалификационная работа “Разработка информационной системы сбора и анализа цифрового следа студентов”
Автор (ы)
Аффилиация
Новосибирский государственный технический университет, студент
Научный руководитель
Аннотация
В настоящее время актуальность анализа данных успеваемости студентов с целью возможности редактирования учебного процесса обуславливается тем, что большинство учебных организаций получают данные только к концу семестра, когда они уже не всегда актуальны. В данном проекте реализован способ получения данных в течение недели после прошедшего занятия.
Актуальность данной тематики обуславливается отсутствием современных бесплатных систем и программ, которые считывают в форматированном виде рукописный или печатный текст с помощью фотокамеры мобильного телефона в виде электронных таблиц. Постепенно, объем данных для анализа данных стал настолько большим, что его невозможно было обработать вручную и появилась необходимость в автоматизации процесса мониторинга успеваемости обучающихся, поэтому сейчас активно развиваются сферы по анализу данных (Data Analysis) и машинного обучения (Machine Learning), позволяющие обрабатывать большие данные (Big Data) эффективно и точно. Актуальность и новизну теме добавляет и тот факт, что после решения задачи не требуется хранить первоначальные файлы или какие-либо промежуточные данные как в бумажном, так и в цифровом виде. В качестве сферы анализа данных выбрана учебная отрасль, так как она является одной из самых важных и крупных, а полученное решение позволяет использовать приложение для любого письменного языка лишь с незначительными изменения, которые зависят от формата входных данных. Поддерживаются как печатный, так и отсканированный вариант студенческого журнала. Данные заполнения студенческого журнала вымышленные и любое совпадение случайно.
Своевременное определение возможного снижения числа студентов позволяют скорректировать учебный план или провести собрание, чтобы определить причины непосещения конкретных предметов студентами, принять меры для сохранения количества обучающихся в текущем семестре и персонализировать расписание или преподавательский состав для данной студенческой группы различными доступными способами в дальнейшем, чтобы улучшить заинтересованность и показатели вовлеченности в учебный процесс.
Объектом исследования является студенческий журнал, состоящий из таблиц и рукописного текста, с данными о посещаемости и успеваемости студентов по предметам из расписания университета. Используемые в работе средства анализа данных и машинного обучения позволяют преобразовать и визуализировать исходные данные, при этом существенно сэкономив ресурсы, а сделанные мобильные приложения готовы для дальнейшего использования в учебном процессе. Каждый год появляются новые статьи и методы для улучшения точности в разных отраслях анализа данных и оптического распознавания текста (OCR), что показывает интерес к задаче.
Цель работы – разработка информационной системы для своевременного определения факторов влияющих на посещения предметов студентами, используя ETL процессы в рамках мобильного приложения и визуализацией данных в режиме реального времени.
В процессе работы были изучены эффективные методы анализа данных, выполнена обработка рукописного текста, сгенерирована собственная OCR модель для распознавания рукописных символов, сделаны два мобильных приложения, веб-сервис и визуальная аналитическая панель (дашборд) для визуализации данных.
В рамках выпускной квалификационной работы было необходимо разработать информационную систему сбора и анализа цифрового следа студентов. Для этого требовалось решить задачи чтобы:
- Определить основные технологии для решения задачи.
- Найти общедоступные наборы данных рукописных символов.
- Произвести подготовку данных для дальнейшего обучения модели.
- Создать программную реализацию классификации символов.
- Построить ETL систему извлечения, перемещения и загрузки данных.
- Создать мобильные приложения с графическим интерфейсом.
- Сделать визуальные представления полученных результатов.
Результатом работы является реализация мобильных приложений и визуального представления выходных данных используя веб-сервис и дашборд с возможностью фильтрации результатов.
Содержание работы
Автор предпочел не показывать работу на сайте
Конкурс, в котором автор работы принял участие:
Отрасль наук
Форма представления работы
Дата публикации работы: 05.07.2022
Добавить комментарий