传统机器学习主要面向“单标记样本,一个标记(label)通常对应一个概念类别。然而,现实任务中常会遇到“多标记”样本,即一个样本同时与多个类别相关。这类多义性数据伴随一些机器学习技术表现出标记强度不精确、示例表示不丰富、监督信息不充分等瓶颈问题。实验室围绕多义性机器学习方向进行持续技术攻关,取得了一系列关键技术突破:
①针对现有机器学习框架中的类别监督形式在面向多义性对象时无法充分体现多义性信息的突出问题,原创性地提出了“标记分布学习(LDL)”理论及框架,实现了对多义性数据的高效学习和预测,吸引了大量国际同行开展跟随研究:②针对标记多义性问题中的标记增强进行了深入研究,构建了标记增强基础理论框架,使得预测模型可以在更为丰富的监督信息下进行训练,不仅为扩展标记分布学习范式的适用性提供有力支撑,而且对于探索类别监督信息的本质具有重要意义,为审视传统学习范式提供新的视角。上述方法被广泛应用于计算机视觉、自然语言处理、情感计算、医学诊断、火星探测等不同领域的实际问题。
该项研究工作获国家自然科学杰出青年科学基金、国家重点研发计划课题等项目资助,共发表CCF A类期刊和会议论文35篇,获得发明专利授权5项。作为第二完成人和完成单位、以LDL为核心科学发现点之一的项目“面向多义性对象的新型机器学习理论与方法2020年获国家自然科学奖二等奖,2019年获教育部自然科学奖一等奖。张敏灵教授应邀担任第30届国际人工智能联合大会(IJCAI'2l)Workshop Program Co-Chair、应邀于ICMIP'20(The5 th International Conference on Multimedia and Image Processing)国际会议作大会主旨报告等。