2024年12月3日下午,西南石油大學(xué)計(jì)算機(jī)與軟件學(xué)院邀請(qǐng)李文教授在明理樓B306教室以視覺(jué)遷移學(xué)習(xí)與應(yīng)用為主題,為我院研究生作學(xué)術(shù)報(bào)告。
李文是電子科技大學(xué)教授、博士生導(dǎo)師、國(guó)家海外高層次人才計(jì)劃入選者。主要研究方向?yàn)橛?jì)算機(jī)視覺(jué)與遷移學(xué)習(xí),專(zhuān)注于開(kāi)放場(chǎng)景下的視覺(jué)模型泛化性難題,提出多個(gè)有影響力的跨領(lǐng)域的目標(biāo)檢測(cè)、語(yǔ)義分割等計(jì)算機(jī)視覺(jué)算法模型,在T-PAMI、IJCV、CVPR、ICCV、ECCV等在內(nèi)的領(lǐng)域重要國(guó)際期刊和國(guó)際會(huì)議論文100余篇,Google Scholar的總引用次數(shù)10000余次。
在講座中,李文教授探討了視覺(jué)遷移學(xué)習(xí)的核心問(wèn)題與應(yīng)用前景。他首先強(qiáng)調(diào)了人工智能交互中感知與生成的重要性,指出在真實(shí)開(kāi)放環(huán)境下,視覺(jué)數(shù)據(jù)的分布差異給感知模型的泛化能力帶來(lái)了巨大挑戰(zhàn)。
接著,他詳細(xì)闡述了面向圖像感知的遷移學(xué)習(xí),通過(guò)衡量源域(訓(xùn)練數(shù)據(jù))和目標(biāo)域(測(cè)試數(shù)據(jù))的分布差異,并在模型學(xué)習(xí)中減少這種差異,有效提升模型的泛化性能。從泛化性誤差來(lái)看,遷移學(xué)習(xí)可以從數(shù)據(jù)、模型和標(biāo)簽三個(gè)層面遷移。
此外,他還介紹了面向視頻生成的遷移學(xué)習(xí),特別是如何無(wú)監(jiān)督地挖掘和遷移視頻中的結(jié)構(gòu)信息,提出了可變錨點(diǎn)模型、動(dòng)作隱式學(xué)習(xí)模型以及同時(shí)關(guān)注結(jié)構(gòu)信息與非結(jié)構(gòu)信息的動(dòng)作優(yōu)化模型等創(chuàng)新方法。
講座結(jié)束后,現(xiàn)場(chǎng)師生與李文教授圍繞源域、目標(biāo)域等概念,目標(biāo)域數(shù)據(jù)的重建,結(jié)構(gòu)型數(shù)據(jù)的處理,大模型訓(xùn)練與小任務(wù)微調(diào),擴(kuò)散模型,以及如何使用Transformer提取運(yùn)動(dòng)信息等議題展開(kāi)了熱烈而深入的討論。李文教授耐心解答了師生們的疑問(wèn),并分享了自己的見(jiàn)解和經(jīng)驗(yàn)。
此次講座不僅為西南石油大學(xué)師生提供了與頂尖學(xué)者面對(duì)面交流的機(jī)會(huì),更激發(fā)了大家對(duì)視覺(jué)遷移學(xué)習(xí)與應(yīng)用領(lǐng)域的濃厚興趣和深入思考。

主辦單位:計(jì)算機(jī)與軟件學(xué)院
科學(xué)技術(shù)發(fā)展研究院