KDD聚焦:图神经网络、AI公平性与包容性
今年的KDD大会圆满落幕。作为大会主席,Huzefa Rangwala对会议热点有着深刻洞察。他明确指出:图神经网络与AI公平性是今年最受瞩目的两大方向。图作为一种数据结构,天然适合表达事物之间的关联关系,而图神经网络能够从中挖掘出隐藏的模式——这对于知识发现而言,无疑是强大的工具。

“我们的世界以多种方式相互连接,因此你会看到图神经网络在从社交网络、交通网络到知识图谱和药物发现的许多不同领域中找到应用,”Rangwala说。他所在的某机构机器学习解决方案实验室,整合了某机构科学家的专业知识与云服务资源,专门为客户解决机器学习难题。在加入某机构之前,Rangwala曾任某大学计算机教授,研究方向涵盖生物医学、学习科学和社会科学。如今,他的团队与医疗、生命科学、体育、制造等行业的客户合作,应用场景极为丰富。
“比如,我们正在用图神经网络表示蛋白质这类大分子,以及它们的相互作用伙伴,”Rangwala举例说,“这本质上是在加速药物发现或寻找新的生物疗法。实际上我们已经把这套方法部署给了某制药公司客户。”
不过,挑战依然存在。“尚未解决的关键问题之一,是如何将蛋白质这样的输入转换成图结构的表示形式。这是第一步:怎么稳健地构建特征,从而获得好结果。”此外,“其他开放挑战跟深度学习中的常见问题类似:怎么确保最终结果可解释、鲁棒?终端用户不会只满足于一个预测分数,他们还想知道为什么。”
在KDD会议上,Rangwala看到了许多应对挑战的思路。“有很多关于如何扩展、如何高效运行和训练这些模型的想法——随着数据集变大、交互数量增加、表示形式变大,方法包括并行化、高效数据结构,甚至新的公式和计算机架构。但真正让我兴奋的是,我们看到如此多的应用——蛋白质、分子、信息提取、推荐、异常检测——所有这些都能带来更好的科学和商业成果。这就是围绕这些技术的挑战和令人兴奋之处。”
从理论到实践
Rangwala坦言,KDD会议所展示的应用广度是其最大的吸引力之一。“我真的喜欢应用科学。我不局限于某一种特定方法或某个特定领域。我最感兴趣的是如何利用这些计算和机器学习技术来解决具有挑战性的问题,”他说,“KDD会议最让我兴奋的是,它不仅展示核心数据科学方法的创新,而且很多研究人员专注于如何使用这些方法——如何从理论走向实践?如何把机器学习研究成果变成终端用户可用的工具?”
“首先,即使在研究轨道上,也有很多跨学科的工作。而且KDD设有应用数据科学轨道,你不仅能看前沿研究,还能看到转化研究——知道这些方法是怎么落地的。这跟我背景很合拍,因为我真的喜欢应用科学。不管物理学、生物学、化学还是社会科学,能用计算技术解决挑战性问题,就是我的兴趣所在。”
可信赖AI计算
在知识发现领域,公平性近年来已成为突出课题。Rangwala解释说:“可信赖性对于AI技术的采用和实现其社会收益至关重要。可信赖意味着它们需要公平、可解释,并且可复现。”对此行业有很多讨论:是数据有偏见,还是社会本身有偏见?“整个领域已经意识到这些问题,并提出了正确的问题——比如构建审计方法或缓解方法。最重要的是,他们赋权不同的利益相关者——开发者、决策者和最终用户——来补充解决方案,确保算法的可信赖性。”
在KDD会议上,专门有一天叫“可信AI日”。研究轨道里也有很多相关主题的会议。Rangwala还特别提到:“‘KDD中的女性’活动真的很令人兴奋,因为这是第一次线下举办。Judith Spitz(某机构创始人)与某研究机构的Johannes Gehrke共同主持,安排了交流午餐,并请嘉宾讲述职业历程,特别针对KDD中的女性及非二元性别个体。这是我很热衷的事情——如何建立更具包容性的社区。”
研究领域
机器学习
标签
KDD、图神经网络、负责任的AI
