李晓东,博士,现为厦门大学信息学院计算机科学与技术系助理教授,硕士生导师。2016年于山东大学获得计算机科学与技术工学学士学位,并入选基础学科拔尖人才培养计划,2021年于香港大学获得计算机科学专业哲学博士学位,2021至2024年在香港大学和新加坡国立大学从事博士后工作。

教学方面:
曾担任香港大学《Advanced Database System》、《Advanced Topics in Computer Science》、《Data Mining》和厦门大学《面向对象程序设计(Java)》等课程的助教,参与相关教学工作,目前负责设计《汇编语言程序设计》课程改革方案,为后续课程序列做准备,并推进课程与学科发展工作。
科研方面:
研究方向为大规模图数据管理和挖掘,近两年来主要关注图算法与大语言模型的交互和对齐技术,主持厦门市科技计划项目一项,在VLDB、ICDE等本领域一流会议和期刊上发表论文二十余篇,谷歌引用累计约六百次。曾担任ICDM图数据研讨会联合主席,SIGKDD、SIGMOD、SIGIR、MM、CIKM等国际会议的程序委员会委员,TKDE、IPM、PR、ESWA、KBS、SWEVO、ASOC、NEUNET、TST等一流期刊的审稿人。
主要研究内容:
(1)图数据库查询优化技术
聚焦传统查询语言缺乏面向子图的高阶语义支持问题,提出基于子图的图数据库查询语法扩展,设计面向子图的数据库高阶索引结构,通过显著子图马尔可夫路径建模实现知识图谱的高效子图匹配和亿级图谱的子图统计显著性检验。该技术成功应用于新冠药物知识图谱的靶点关系挖掘、粤港澳智慧城市多源数据融合的实时查询匹配,并为(2)中的可解释分析提供去噪后的结构基元。

图1 基于图数据库查询优化的知识图谱挖掘架构图
(2)大规模知识图谱可解释分析
针对跨域实体对齐中的语义噪声难题,利用显著子图的拓扑鲁棒性设计高阶邻居过滤算法,生成低噪声上下文提示,实现大模型与图谱的零训练知识对齐,并结合分层动作空间对多源知识进行细粒度解构,支撑多维度异质数据的可解释性抽取,显著提升知识图谱的可解释抽取能力,相关成果应用于交通和电力安全项目的异常检测场景。

图2 大规模知识图谱可解释分析架构图
(3)图文跨模态联合推理技术
突破多源异构数据协同决策瓶颈,引入子图增强的结构知识,压缩动作空间并实现图结构化的多跳推理规划和中间推理评估,支撑多目标优化决策,分层消解大模型检索增强过程中的时空与语义冲突,实现文本、表格、图谱的联合推理。该技术已在电池控制优化和交通路网补全等跨模态场景中验证了联合推理有效性。

图3图文跨模态联合系统架构图