教育大数据,顾名思义就是教育行业的数据分析应用。
而大数据,则需要具备5V的特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
其中的“大”主要指的是 Volume(大量),我们现阶段用的数据分析,大部分情况下的数据量还达不到这个“大”的级别。
从应用层面来看,教育行业数据分析实践的过程中会有哪些痛点?又有哪些具体的应用呢?
教育行业在数据分析的应用方面,主要痛点有以下四个方面:
1.数据涉及面窄 数据主要来源为数字化校园系统产生的,其他教学管理的数据多为手工录入非结构化数据
数据维度少,数据来源不足。
2.数据接口不完善 内部信息系统的教务系统、一卡通系统、图书馆系统、财务系统等数据都不规范一致,数据结构也不一样,各业务系统接口对接难度大
业务接口与数据结构还不规范
3.缺乏统一的数据管理平台 没有统一的数据处理中心对数据进行管理,没有人力维护各系统的接入
有效数据量少,数据质量差,达不到大数据处理分析要求
4.项目成本及投入,项目限制 传统大数据平台项目成本高,收效慢,既不能适应学校的管理模式
定制化内多多,成本高,周期长不适用
数据挖掘门槛过高,无法将深入的数据分析挖掘工作常规的推广,也不能用作教学科研使用
教育大数据系统的搭建主要涉及平台的选择,在这里我们用一张图来表示。
在具体的应用方面,即数据分析体系搭建上,可以在以下四个方面开展。
在这方面可以进行招生分析、就业分析、住宿分析、图书馆分析、资产数据统计分析等。
在这里可以进行教学质量评估、上网行为分析、学生成绩分析、学生特长能力分析
可以进行学生轨迹分析、学生画像、学生舆情监控
可以开展科研成果分析统计、科研项目研究、科研经费跟踪研究,对整个科研情况有全面的了解和掌握。
具体详细的应用场景可以看下图
我们举个学生兴趣偏好分析的例子
应试教育中有个很大的问题就是,一个老师面对很多学生,很难照顾到每个人,了解他们的兴趣偏好。那如果能够通过学生主动点击学习的课程类型、学习时长,是不是就能对他们的兴趣偏好有一个大致的判断了。
于是,可以进行能力偏重分析、学生感兴趣的内容分析、薄弱知识点改善方式、改善行为、课程属性、兴趣课程功能、参考资料点击率分析、课程内容点击次数分析、各阶段课程功能驻留时间分析。
以此可以知道学生整体在哪方面能力较强、哪项较弱,课程内容的哪些部分反馈较好,哪些需要改进。还可以借助右边的筛选器,按区域、学校、年级、学生是否有任职进行切分,能了解到每个群体、每个个体的学习情况。
教育大数据的应用,其实重点在于知道要分析哪些数据,如何收集这些数据。建立一个好的数据分析体系才是这件事中最重要的事情。
教育大数据有哪些:
一、教学活动大数据
1)教师教学过程数据,积累教学资源
2)教师教学成果分析
3)学生行为轨迹
4)学生学情分析及预警系统
5)学生综合评价体系
6)基于知识图谱,做单个学生的学科薄弱点分析及精准提升路径设计
二、教育管理大数据
1、单校看:
学校师资分析
学科能力分析 2、区域内看
同学段下不同学校的教育能力分析
3、跨区域看
不同区域,各学段的教育能力分析
同学段下,不同区域的教育能力分析
吴恩达是斯坦福大学计算机科学家,他通过AI人工智能系统收集所有关于学生举动的信息,从中提取最有效的内容并将其纳入系统设计,从而使他的课程能够自动实现:教学的改善,学生理解力和成绩的提高,基于个人需求的定制教育。
比如,他追踪学生与视频讲座的互动行为:当学生观看视频时,点击了暂停或快进键,又或是在视频结束前选择了放弃——这种数字互动意味着学生提早溜出了课堂。他能发现学生多次回看同一门课程,或者后退至上一个视频浏览课程内容的行为。此外,他也会在视频课程中穿插突击测验,其目的并不是要督促学生集中注意力学习,这种重视课堂纪律的古老教学形式不是他关注的内容,他想知道的是,学生是否正在领会教学材料,以及是否卡在了某个问题上。每一个学生个体,都是他的观察对象。
通过追踪学生在计算机或平板电脑上完成作业和测验的情况,吴恩达教授能够确定学生需要额外帮助的具体内容。他可以分析整个班级的数据,观察这一群体的学习情况,并以此为依据对课程进行调整。他甚至可以把这些信息与不同年级的不同班级作对比,从中判断最有效的课程元素。
成千上万的学生参与了他的课程学习——数量大到足以支撑他的研究成果,而大多数教育研究的开展仅仅基于小范围的观察对象。然而,班级规模本身并不是重点,数据才是其中的关键。吴恩达教授已经发掘了数据的非凡效果。比方说,在追踪学生观看视频课程顺序的过程中,他发现了一个令人困惑的现象——大部分学生的学习是循序渐进的,然而在课程进行了数周之后(第7课前后),他们会跳回到第3课——其中的原因是什么?他做了进一步的研究,发现第7课要求学生用线性代数书写一条公式,而第3课是一堂关于数学知识的复习课,显然许多学生对自己的数学能力信心不足。由此,吴恩达教授知道了该如何改进他的课程,即在那些容易让学生感到气馁的地方提供更多的数学知识回顾。而具体在哪里加入复习的知识点,正是数据提示给他的。
这就是未来教育的初始模样,更精准全面的分析信息,更个性化自主的学习方案。
,
教育大数据,是指整个教育活动过程中所产生的以及根据教育需要采集到的,一切用于教育发展并可创造巨大潜在价值的数据集合。
• 教育大数据有两大来源:教学活动过程产生+教育管理过程采集。
• 教育大数据要能服务教育发展,具有教育目的性,而非盲目的囊括一切数据。
• 教育大数据之“大”并非指数量之大,而是强调“价值”之大。
疫情是块试金石。面对突如其来的新冠肺炎疫情,学生开展大规模在线教育。这是我国教育系统应对重大突发公共卫生事件能力的一次检验,也是我国在线教育推进过程中一次规模空前的实战演习。
教育行政机构、教师、学生、家长如何看待这次大规模的在线教育“实战演习”?我国在线教育现状如何?在线教育未来的发展趋势如何?2020年2月底至3月初,信息化与基础教育均衡发展省部共建协同创新中心和中关村互联网教育创新中心组建课题组,开展全国大规模在线问卷调查,调查范围涉及华东、华中和华南等七大区域,其中,中小学生及其家长样本62446份,中小学教师样本7111份,教育行政机构3110份。课题组希望运用大规模在线调查数据,作出理性分析,对于促进我国教育信息化引领教育现代化、实现教育现代化2035目标,提供科学的数据支撑。
地方教育行政机构
从初期的茫然无措
慢慢走向从容应对
受调查的3110份教育行政机构样本中,疫情期间开展“停课不停学”活动的占样本总量97.01%,表明几乎所有地区都积极响应教育部的号召,开展“停课不停学”工作。并且,七成受访学校制定了教学指导方案及工作指南,为中小学教师在线教学及管理工作提供必要的指导。
地方教育行政部门从疫情初期茫然无措,慢慢走向从容应对,群策群力,在很短时间内动员大量人力、物力、财力,有效实现“停课不停学”,充分体现新型举国体制的优越性。这次大规模在线教育实践,既是我国教育信息化基础设施和师生信息素养的重大考验,也是对地方教育行政部门教育治理能力和治理体系现代化的重要检验,为指导地方教育行政部门发展未来在线教育提供了难得的机遇。
在线教学设备
超七成学生使用智能手机
1%家长表示无网络电视无手机
受调查的62446份中小学生及其家长样本中,学生在线学习时使用最多的终端设备为智能手机,占样本总量的73%,这表明手机作为当今互联网接入量最多的设备,具有使用方便、便于携带、不受地点限制等特点,在疫情期间学生进行居家在线学习过程中发挥了不可替代的重要作用。平板电脑的使用占样本总量的12%,电视占比5%,这表明在有些学生群体家庭中,可能存在手机等移动设备不足的情况,因此需要利用网络电视进行学习。此外,笔记本电脑、台式电脑与其他设备分别占4%、3%与3%。值得注意的是,还有1%的受访家长表示既没有网络电视也没有。
温馨提示,如有数据需请详细阅图。
“大数据”概念不是突然出现的, 而是信息技术发展的结果, 大数据是新信息技术的宝藏。
相较于传统的数据, 人们将大数据的特征总结为5个“V”, 即体量大(Volume)、 速度快(Velocity)、 模态多(Variety)、 难辨识(Veracity)和价值密度低(Value)。这五个特征都对信息技术带来了巨大挑战, 同时也产生了应对这些挑战的大数据系统, 其中以Apache Hadoop为典型代表的技术架构, 以及数据挖掘和机器学习等人工智能技术在大数据方面的应用正在逐渐克服这些挑战。
从系统构成的角度来看, 可以将大数据系统分解为三个层次:基础设施层、 计算层和应用层, 这种分层结构对于大数据系统的分布式演进具有非常重要的意义。
本书作为教材, 篇幅及内容较多, 需要较多的课时进行教学。建议在实际教学中将本书的内容分为理论教学与实验教学两个方面进行, 其中理论教学课时为48(或32)学时, 实验教学为48学时, 共计96(或80)学时。
需要数据滴滴我
标签:教育,数据