DASFAA 2026 將于 2026 年 4 月 27 日至 30 日在韓國(guó)濟(jì)州島舉行DASFAA 2026。DASFAA(International Conference on Database Systems for Advanced Applications,數(shù)據(jù)庫(kù)系統(tǒng)高級(jí)應(yīng)用國(guó)際會(huì)議)是亞太地區(qū)數(shù)據(jù)庫(kù)領(lǐng)域極具影響力的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議之一,為中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的 B 類(lèi)會(huì)議。會(huì)議每年舉辦一次,自 1989 年首屆召開(kāi)至今已舉辦 30 屆,長(zhǎng)期受到全球數(shù)據(jù)庫(kù)、大數(shù)據(jù)、數(shù)據(jù)挖掘領(lǐng)域?qū)W術(shù)界與工業(yè)界的高度關(guān)注。我院碩士研究生潘海洋、王甜同學(xué)作為學(xué)生第一作者的論文《SPGRF: A Structure-Preserving Graph Reduction Framework》、《Certified Pseudo-label Enhanced Active Learning Framework for Pattern Interest Evaluation》被接收。
碩士研究生潘海洋在國(guó)際會(huì)議DASFAA發(fā)表學(xué)術(shù)論文《SPGRF: A Structure-Preserving Graph Reduction Framework》。該論文針對(duì)現(xiàn)有圖約簡(jiǎn)方法大多局限于低階圖屬性或特定任務(wù),忽略了圖的高階結(jié)構(gòu),導(dǎo)致約簡(jiǎn)圖無(wú)法滿(mǎn)足各類(lèi)下游任務(wù)期望的根本局限,提出了一種任務(wù)無(wú)關(guān)的結(jié)構(gòu)保持圖約簡(jiǎn)框架(SPGRF)。核心創(chuàng)新包括:提出了一種從局部到全局的邊重要性評(píng)估方法,結(jié)合基于圖卷積網(wǎng)絡(luò)(GCN)的預(yù)測(cè)模型來(lái)評(píng)估邊權(quán)重,從而指導(dǎo)構(gòu)建初始圖骨架;設(shè)計(jì)了一種基于鄰域的骨架增強(qiáng)機(jī)制,通過(guò)識(shí)別并恢復(fù)關(guān)鍵的直接和間接連接來(lái)彌補(bǔ)結(jié)構(gòu)損失。在多個(gè)真實(shí)圖數(shù)據(jù)集上的廣泛實(shí)驗(yàn)表明,SPGRF在結(jié)構(gòu)保留、執(zhí)行效率以及多項(xiàng)下游任務(wù)性能上均顯著優(yōu)于多種先進(jìn)基線(xiàn)方法(SSumM、WIS、SsAG等)。尤其在頻繁模式挖掘(FPM)任務(wù)中表現(xiàn)卓越,即使在約簡(jiǎn)率低至10%的情況下,Top-k(k=800)頻繁模式的準(zhǔn)確率依然高達(dá)96%。該工作為圖數(shù)據(jù)的通用高效分析提供了一種兼顧多尺度結(jié)構(gòu)保真度與高擴(kuò)展性的新路徑。

圖1 SPGRF總體流程
碩士研究生王甜在國(guó)際會(huì)議DASFAA發(fā)表學(xué)術(shù)論文《Certified Pseudo-label Enhanced Active Learning Framework for Pattern Interest Evaluation》。該論文針對(duì)現(xiàn)有頻繁模式挖掘(FPM)技術(shù)通常依賴(lài)于單一維度的客觀(guān)評(píng)估指標(biāo)(如支持度或模式大小),且未能充分考慮用戶(hù)主觀(guān)偏好的根本局限 ,提出了一種用于模式興趣評(píng)估的可靠偽標(biāo)簽增強(qiáng)主動(dòng)學(xué)習(xí)框架(CPALF)。核心創(chuàng)新包括:開(kāi)發(fā)了一種融合代表性(基于最近鄰關(guān)系)與不確定性(基于信息熵)的新型主動(dòng)學(xué)習(xí)查詢(xún)策略,通過(guò)有限的人機(jī)交互高效獲取用戶(hù)偏好;提出了一種集成半監(jiān)督學(xué)習(xí)與增量訓(xùn)練的方法,利用偽標(biāo)簽過(guò)濾策略(PLFS)從無(wú)標(biāo)簽數(shù)據(jù)中篩選高置信度的偽標(biāo)簽訓(xùn)練樣本;引入了類(lèi)別感知重放策略(CaRS)的增量學(xué)習(xí)范式,以緩解持續(xù)學(xué)習(xí)過(guò)程中的災(zāi)難性遺忘問(wèn)題 。在Twitter、Twitch、Skitter等六個(gè)真實(shí)世界圖數(shù)據(jù)集上的廣泛實(shí)驗(yàn)表明,CPALF在僅使用約3%的標(biāo)注數(shù)據(jù)的情況下,即可達(dá)到與全監(jiān)督學(xué)習(xí)相當(dāng)?shù)男阅?,最高預(yù)測(cè)準(zhǔn)確率可達(dá)96% 。該工作為資源受限環(huán)境下基于用戶(hù)主觀(guān)興趣的圖數(shù)據(jù)模式挖掘提供了一種兼具高預(yù)測(cè)精度與低標(biāo)注成本的新范式 。

圖 2 CPALF總體流程