成人直播

学院新闻
数据之律,算海扬帆:探赜索隐数据科学与算子学习前沿 │本科生讨论班系列纪实八
发布时间:2025-05-27  点击次数:


数据科学作为一门交叉学科,融合了统计学、计算机科学以及特定领域知识,旨在从海量数据中提取有价值的见解与模式。其核心方法论涵盖数据采集、清洗、转换、分析和可视化,通过应用机器学习、深度学习等先进技术,构建预测模型并支持决策制定。数据科学的专业性体现在对数据伦理的严格遵守、对算法模型的审慎评估以及对结果的可解释性和可复现性的重视,从而确保数据驱动的结论具有可靠性和公正性。

赵晓飞教授指导的本科生科研讨论班,聚焦数据科学的数学基础与算子学习前沿。旨在为本科生提供深入了解数据科学核心理论和先进技术的平台,培养学生的科研兴趣与创新能力。

第一次讨论班,2023级计算数学专业硕士研究生温珍叶同学主讲,主题为“统计学习的核心框架与方法论”。温珍叶同学系统阐述了统计学习的基本概念,细致讲解了监督学习与非监督学习两大类别,并深入探讨了预测函数、损失函数、过拟合问题以及模型复杂度与估计准确性之间的权衡关系。此外,他还介绍了贝叶斯学习框架、正则化方法、模型选择准则(AIC, BIC),并对多元正态模型、蒙特卡洛方法以及贝叶斯模型的比较与选择等前沿内容进行了阐述。报告内容涵盖了风险最小化与模型评估策略,为同学们深入理解统计学习的理论体系和实际应用起到了良好的作用。

第二次讨论班,2022级计算数学专业博士研究生常之鹏主讲,主题为“算子学习的基本原理与方法体系”。常之鹏同学首先介绍了算子学习的研究背景,强调其在处理高维复杂物理系统中的关键作用。他深入讲解了算子学习中输入输出为函数或场的建模方式,并区分了传统点到点学习与算子层面学习的本质差异。他还详细介绍了DeepONetFourier Neural OperatorFNO)等典型模型,以及训练数据的获取方式、输入函数的编码机制和损失函数设计中的泛化能力考量。此外,他展示了算子学习在多物理场耦合问题和数据驱动PDE求解中的应用,凸显其在速度与精度上的优势。

两次讨论班中,主讲同学内容详实,逻辑清晰,展示了扎实的理论基础与对研究前沿的深刻理解。在报告结束后,赵晓飞教授对报告内容进行了点评和补充,针对实际应用、模型可解释性和可扩展性等问题进行了深入交流。

本次系列讨论班不仅帮助本科生系统学习了数据科学和算子学习的核心概念、方法与前沿技术,也激发了他们对相关领域的科研热情。通过与高年级研究生和指导老师的互动交流,同学们进一步明确了科研方向,提升了科研能力,为未来在数据科学领域开展深入研究奠定了坚实的基础。

(通讯员:银瑞杰、胡雪红 摄影:刘晓欢)