報告題目:視覺(jué)Transformer模型結構設計及其應用
報 告 人: 張敬 副教授
報告時(shí)間:2024年01月11日(周四)10:00-11:00
報告地點(diǎn):逸夫樓445A(線(xiàn)上)
研究生院 電氣與控制工程學(xué)院
2024年1月10日
報告人簡(jiǎn)介:
張敬,博士,2015年畢業(yè)于中國科學(xué)技術(shù)大學(xué)自動(dòng)化系,目前在悉尼大學(xué)計算機系從事博士后研究,主要從事計算機視覺(jué)與深度學(xué)習等人工智能領(lǐng)域的相關(guān)科學(xué)研究工作,在 CCF A類(lèi)國際會(huì )議/期刊以及IEEE 匯刊等國際著(zhù)名期刊已發(fā)表學(xué)術(shù)論文90余篇,谷歌學(xué)術(shù)引用6200余次。長(cháng)期擔任著(zhù)名國際學(xué)術(shù)期刊和會(huì )議審稿人、程序委員會(huì )委員、高級程序委員會(huì )委員及領(lǐng)域主席。2023年晉升為美國電氣和電子工程師協(xié)會(huì )(IEEE)高級會(huì )員。提出的ViTAE Transformer可廣泛應用于圖像分類(lèi)、目標檢測、語(yǔ)義分割、視頻實(shí)例分割、圖像摳圖、目標跟蹤、文字檢測和識別、遙感圖像分析等多個(gè)領(lǐng)域,取得了非常有競爭力的結果,相關(guān)GitHub倉庫關(guān)注量超過(guò)5000。該模型在相關(guān)比賽或者公開(kāi)數據集多次名列第一,受到廣泛關(guān)注。