报告题目:数据 – 知识发展环境的机器学习
报告所属学科:管理科学与工程
报告人:Witold Pedrycz(加拿大阿尔伯塔大学)
报告时间:2025年3月14日 15:30-18:30
报告地点:经管学院706室
报告摘要:
机器学习的前所未有的进展可归因于有效利用大量数据,最近通过众多大语言模型和基础模型的构建得到了证明。
然而,令人感到有趣的是,尽管机器学习在很大程度上依赖于数据,但知识在其中的作用并未得到明确的考虑。在本次讲座中,我们主张合成一个统一的机器学习知识-数据框架。作为一种新范式,机器学习知识-数据专注于在该领域的设计实践中,数据与知识的审慎和协调互动。
首先从历史角度阐述了知识-数据环境的基本理论,并指出其关键要点。接着,讨论面向问题的知识来源、知识的分类以及其主要特征。
数据和知识在抽象层次上有着显著的不同,知识通常是在符号层次上进行形式化和表示的,而数据则主要是数值型的。这构成了一个真正的挑战,因为数据本质上是数字化的。我们强调,在开发一个统一且协调的数据与知识框架来应对学习过程时,必须调和高度不同的抽象层次(数值-定性),在这方面,信息颗粒发挥了关键作用。
我们提供了一种知识分类法,通过区分科学知识和常识性知识,阐述了随之而来的知识表示方案谱系。随后,讨论了基于知识的机器学习设计的主要类别,包括物理信息驱动的机器学习(依赖于科学知识),通过知识驱动的约束(正则化)增强数据驱动模型,通过知识扩展数据驱动模型的开发,以及在规则传达的知识存在下构建机器学习模型的方式。在分析这些类别时,还明确解释了如何避免数据盲目化的有害影响。最后,讨论了知识-数据统一环境的选定方案和随之而来的学习方案,并对基于大语言模型的知识获取进行了研究。
报告人简介:
Witold Pedrycz,加拿大阿尔伯塔大学讲席教授,加拿大皇家科学院院士,波兰科学院外籍院士,电气和电子工程师协会会士。现担任《Information Sciences》和《Wiley Interdisciplinary Review Data Mining and Knowledge Discovery》主编,及《Granular Computing》共同主编。主要研究方向包括粒计算、智能系统、模糊集和模糊系统、模式识别等;并发表多篇高质量论文,出版著作21本,H指数136,计算机科学和电子学排名第70位。
学院地址:江苏省南京市江宁区将军大道29号
邮政编码:211106
版权所有:中国·永利yl23455(股份)有限公司-官方网站 ALL RIGHTS RESERVED 苏ICP备05070685号