e世博线上娱乐-注册娱乐城送彩金-盛大娱乐场开户注册

科研動(dòng)態(tài)

我院謝文波副教授研究成果在模式識(shí)別領(lǐng)域國(guó)際頂級(jí)期刊《Pattern Recognition》發(fā)表

文章作者:謝文波 責(zé)任編輯:唐亮 審核人:彭博 文章來(lái)源:

我院謝文波副教授在模式識(shí)別領(lǐng)域國(guó)際頂級(jí)期刊《Pattern Recognition》(SCI 一區(qū))上發(fā)表學(xué)術(shù)論文“Data Skeleton Learning: Scalable active clustering with sparse graph structures”。該論文針對(duì)現(xiàn)有成對(duì)約束主動(dòng)聚類(lèi)算法計(jì)算復(fù)雜度高、可擴(kuò)展性弱、難以適配大規(guī)模數(shù)據(jù)處理的核心行業(yè)痛點(diǎn),提出了基于數(shù)據(jù)骨架學(xué)習(xí)的可擴(kuò)展主動(dòng)聚類(lèi)框架DSL。其核心創(chuàng)新在于:面向大規(guī)模數(shù)據(jù)聚類(lèi)的稀疏性先驗(yàn),設(shè)計(jì)了數(shù)據(jù)骨架圖與最小約束圖雙稀疏圖結(jié)構(gòu),分別實(shí)現(xiàn)數(shù)據(jù)內(nèi)在關(guān)聯(lián)刻畫(huà)與聚類(lèi)結(jié)果高效迭代更新;提出基于最短路徑的約束推導(dǎo)機(jī)制,僅依托人工標(biāo)注的原始約束即可完成約束關(guān)系精準(zhǔn)推導(dǎo),大幅降低人工標(biāo)注成本;設(shè)計(jì)自頂向下的骨架迭代精煉策略,通過(guò)對(duì)高可疑度邊開(kāi)展定向人機(jī)交互,實(shí)現(xiàn)嵌套聚類(lèi)結(jié)構(gòu)的精準(zhǔn)構(gòu)建。論文通過(guò)理論分析,嚴(yán)格證明了該方法實(shí)現(xiàn)精準(zhǔn)聚類(lèi)的人工約束上界,同時(shí)將算法時(shí)間復(fù)雜度降至線(xiàn)性對(duì)數(shù)級(jí)別O(nlogn)、空間復(fù)雜度優(yōu)化至線(xiàn)性級(jí)別O(n),復(fù)雜度性能顯著優(yōu)于主流主動(dòng)聚類(lèi)算法,為算法的大規(guī)模數(shù)據(jù)適配能力提供了完備的理論支撐?;?8個(gè)跨規(guī)模、跨領(lǐng)域真實(shí)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,DSL算法在絕大多數(shù)場(chǎng)景下,僅需更少的人工標(biāo)注約束即可取得更優(yōu)的聚類(lèi)精度。該工作突破了傳統(tǒng)主動(dòng)聚類(lèi)算法的可擴(kuò)展性瓶頸,優(yōu)化了人機(jī)協(xié)同的主動(dòng)聚類(lèi)工作流,為數(shù)據(jù)挖掘、知識(shí)標(biāo)注、AI大模型預(yù)訓(xùn)練等大規(guī)模數(shù)據(jù)處理場(chǎng)景提供了兼顧精度與效率的新技術(shù)路徑。論文鏈接(代碼與數(shù)據(jù)公開(kāi)):https://www.sciencedirect.com/science/article/abs/pii/S0031320325016814


圖1 DSL方法整體框架流程圖

更新時(shí)間:2026-04-14

Copyright? 2018 All Rights Reserved. 西南石油大學(xué)計(jì)算機(jī)與軟件學(xué)院