北大团队荣获2025年“数据要素X”大赛北京分赛一等奖
2025-10-25 08:2110月17日,2025年“数据要素X”大赛北京分赛颁奖仪式举行。本次大赛设立教育教学赛道,紧密结合教育改革与发展方向,聚焦智慧教育、教育公平、教学质量评估与提升、在线教育效果分析等领域,旨在推动教育领域数据驱动的创新发展。经过初赛评选和现场决赛,北京大学外国语学院团队项目“千亿语言学习语料库数据集YULK的生态与应用”从全国285个优秀项目中脱颖而出,荣获教育教学赛道一等奖。

颁奖现场
“千亿语言学习语料库数据集YULK的生态与应用”项目响应国家教育数字化战略与“四新”建设,针对语言教学精准化不足与学生数据素养薄弱的核心痛点,依托千亿级YULK语料库,构建数据驱动的语言学习体系与服务生态。项目专注于教育领域,通过YULK语料库及相关平台,为教师、研究人员和学生提供数据驱动的语言教学、科研赋能,推动语言学习与数字素养的深度融合。该项目的核心优势在于:高质量的语料库数据资源、面向教育场景自主研发的垂类大模型以及通过SQL编程语言有效培养学生的数据思维与编程能力,切实推动“语言+数据”复合型人才培养与教育数字化转型。
千亿语言学习语料库数据集覆盖新闻、学术、教育等17个领域,通过SQL查询、K值检索等轻量化工具,为智能翻译、语音助手等场景提供高质量数据支撑。目前已形成“数据生产-模型训练-应用落地”生态闭环,成为语言学习AI研发的核心基础设施。
该项目由北京大学牵头,联合贵州语料酷科技有限公司共同完成,充分彰显了校企协同创新的力量。未来,北京大学外国语学院将积极推进人工智能与语言学习的深度融合,构建“因能施教、以评促学”的智慧学习新场景,利用学习行为深度挖掘技术,解决传统教育中知识机械记忆主导、分层学习路径缺失、思维训练可视化不足等问题,为全国语言学习教育数字化提供可复制的解决方案。
信息来源: 北大外国语学院

