2022年06月29日 星期三
教育数据的共享价值如何实现
方海光

    ■“聚焦国家教育数字化战略行动”理论篇③

    编者按

    大数据及其处理技术的发展,使得广泛存在于教育中的各类数据的价值得以被重新认识。在我国教育数字化转型的关键期,我们应该如何合理运用大数据以改善教育生态?本期专刊刊发记者采访报道,并邀请专家、局长就此展开讨论。

    

    当前国家教育数字化转型是抓住全球数字时代发展的战略机遇,以高水平的教育数字化引领教育现代化发展。国家“十四五”规划和2035远景目标纲要提出,“以数字化转型整体驱动生产方式、生活方式和治理方式变革”。从教育数字化服务基础来看,高共享性特征的数据一体化建设可以支持教育数字化转型,提升教育生态系统建设。大规模教育数据共享是国家教育数字化转型建设应用的基础,也是解决当前“互联网+教育”生态下的大规模教育“数据孤岛”问题的途径之一。

    如何组织和构建可重用的国家教育数字化转型的数据一体化共享体系,提取出教育数据的价值,创造教育数据一体化共享价值,这是当前我国面临的新的基础性问题。教育数字化转型的高质量发展将打牢良好数据生态的基础,建立数据一体化和数据共享价值体系可以加快教育数据要素价值化的进程。

    为什么要进行教育数据一体化建设?

    教育数据一体化是通过共享或合并来自两个及以上应用的数据,创建一个具有更多功能的数据服务的过程。传统的教育数据服务系统依靠持续的数据积累,为特定的教育教学过程建模。当这种情况发生时,逻辑方式是通过数据共享或合并进行整合的,在其他情况下,来自一个数据服务系统的数据被重新设计开发,才能和另一个数据服务系统的数据进行匹配,之后持续地为新的特定的教育教学过程进行建模和重新设计。因此,进行教育数据一体化设计是解决传统教育数据服务的必然趋势。

    第一,数据系统管理分散。我国教育数字化转型将集成众多教育信息系统和教育数据库系统,积累了大量的基础数据。然而,丰富的数据资源由于建设时期不同,使用设备不同、技术发展阶段不同和开发部门不同等原因,数据存储管理极为分散,导致数据不能直接整合分析,造成了过量的数据冗余,决策无法获得有效的数据支持。

    第二,资源应用程度不高。目前已有的一些教育信息系统集成度低、互联性差、信息管理分散,同时数据的完整性、准确性、及时性等方面存在较大差距。多年来分散开发或引进的各种教育信息系统仍然存在许多信息孤岛,缺乏可用度高的信息资源体系。

    第三,管理决策能力不足。目前我国教育数字化转型能支持管理和决策的应用少,教育信息系统中的数据不仅没有通过有效工具充分挖掘利用,而且数据的共享价值达不到应用部门对信息资源整体开发利用的要求。

    因此,对于大量的教育数据需要提供统一的数据接口,采用通用的标准和规范,从而获得共享的数据源,通过教育数据一体化消除彼此隔离的数据孤岛,进而有效整合现有及未来的教育应用系统的数据资源。

    教育数据共享可以创造价值吗?

    如何共享教育数据?如何共享教育数据一体化数据?这些未共享的数据都是国家教育数字化转型仍未被完全开发利用的庞大教育资源。许多个人和组织为了完成各自的任务都收集了广泛的不同类型的数据,但因为限制数据访问权限、数据保密等问题造成了底层数据重复开发,浪费了大量的人力、物力和财力。而这时,数据共享就体现了其重要性。那么,教育数据共享可以创造哪些价值呢?

    首先,教育数据共享能推动教育生态发展。学校将其所拥有的数据向各类学校和单位共享,可以减少其在数据采集、整合等方面所投入的人力、物力,从而将更多的精力重点放在学校治理、人才培养与创新应用等方面,促进教育生态的良性发展。

    其次,教育数据共享能够促进教育现代化建设,从而为构建智慧教育新生态奠定基础。例如,利用教育数据共享可以实现从多个维度多个层面对教师的教学质量、学生的学习效果等进行评价,摆脱以往只能依据教学经验进行评价的局限性,使教学评价更多元、更精准、更有针对性。

    最后,教育数据共享能够推动农村教育的现代化进程,让农村地区、偏远地区等教育落后的学校也可以享受到优质的教育资源,从而助力乡村振兴,促进教育公平。

    如何提取教育数据共享价值?

    教育数据一体化从开始对收集到的教育数据进行标准化的处理,才能方便今后对数据进行深度分析。这样做并不是意味着将非结构化的数据转化为结构化的数据,而是要用直观的方法对接收的数据进行分类。实际上,获得教育数据并不是一件容易的事。对于高等教育阶段的学生而言,数据的收集并不是主要问题。然而,对于职业教育和中小学及幼儿园阶段的学生而言,挑战却很大,因为有些数据的收集存在健康和法律问题,有的则存在伦理道德的问题。

    当然,在已有的教育数据基础上,提取教育数据共享价值的途径主要有:一是教育预测,发现预计事实发生的可能性,如要具备判断一个学生在什么情况下事实上有能力完成某项任务的能力;二是分组聚类,发现自然归类分组的规律性,如把有相同兴趣爱好的学生分在同一个小组;三是相关分析,发现和解释变量之间的关系,如分析学生在寻求指导后,判断我们给予学生的帮助是否可靠正确;四是机器学习,使用可视的机器自我学习的方法,如输入大量的类似错题的笔记图片给机器“学习”,最后它就会知道这是特定的错误类型;五是模型洞察,使用开发出的模式进行深入分析的方法,如通过课堂教师教学视频分析模型进而寻找优秀教师上课的优点所在。

    总之,通过提取教育数据共享价值,能够为每一个学生创设一个量身定做的学习环境,提供个性化的课程,还能创建早期提醒系统以便提前知道存在哪些教育教学风险。因此,我们应该积极迎接教育数字化转型,通过数据来分析学习,进一步改善教学的方式与方法,进一步彰显教育数据共享价值。

    (作者系首都师范大学教育学院教授)

分享按钮
中国教育报