來源:頭條號@華中科技大學(xué)本科招生,整理自華中科技大學(xué)新聞網(wǎng)、華中科技大學(xué)電子信息與通信學(xué)院、華中科技大學(xué)教師個人主頁、中國科技網(wǎng)
當(dāng)一腔熱血的青年遇到一片可以施展才華的“寶地”,故事便由此開始。他放棄百度、華為、字節(jié)跳動等名企的誘人高薪,選擇站上“三尺講臺”,成為深受學(xué)生喜愛的青年教師;他帶領(lǐng)團(tuán)隊(duì)勇闖“高效率視覺目標(biāo)識別”研發(fā)難關(guān),創(chuàng)造性發(fā)明空間稀疏的視覺自注意力模型,為計算機(jī)視覺研究領(lǐng)域“解鎖”更多可能。他是華中科技大學(xué)青年學(xué)者王興剛,堅(jiān)持用“青春無悔、只爭朝夕”的奮斗精神,詮釋新時期青年科學(xué)家的中國自信。
王興剛,華中科技大學(xué)電子信息與通信學(xué)院副教授、博士生導(dǎo)師、碩士生導(dǎo)師。先后在美國天普大學(xué)和加州大學(xué)洛杉磯分校進(jìn)行訪問學(xué)習(xí)。2021年入選國家青年人才計劃,2015年入選中國科協(xié)青年人才托舉工程。曾榮獲中國電子教育學(xué)會優(yōu)秀博士論文提名獎、湖北省優(yōu)秀博士論文、微軟學(xué)者等榮譽(yù)。
放棄百萬年薪,選擇華中大
王興剛與華中科技大學(xué)的淵源頗深,他在華中大先后完成了本科和博士學(xué)業(yè)。讀博期間,他憑實(shí)力奪得2012年度全亞洲唯一的計算機(jī)視覺領(lǐng)域“微軟學(xué)者”獎。
“一開始不夠自信,當(dāng)時的對手太強(qiáng)了?!蓖跖d剛回憶,剛?cè)ノ④泚喼迣W(xué)院實(shí)習(xí)時,與亞太地區(qū)一流高校的計算機(jī)學(xué)科博士生競爭微軟學(xué)者獎學(xué)金。
功夫不負(fù)有心人,一路過關(guān)斬將,王興剛最終成為亞洲區(qū)十位獲獎的微軟學(xué)者之一,也是唯一一個從事計算機(jī)視覺研究方向的獲獎?wù)摺!斑@給了我莫大信心——我們?nèi)A中大出來的學(xué)生,完全可以跟業(yè)界頂尖選手過招,并爭得一席之地。”王興剛說。
2014年12月博士畢業(yè)的王興剛,有企業(yè)為他開出百萬年薪,但他放棄了誘人高薪,選擇留校,成為華中科技大學(xué)“三尺講臺”上的一員。在王興剛看來,熱愛是他做出這個看似“不劃算”選擇的原動力。
當(dāng)前,新一輪科技革命和產(chǎn)業(yè)革命正在發(fā)生變革,這與我國高質(zhì)量發(fā)展形成歷史性交匯。王興剛認(rèn)為,加快發(fā)展新一代人工智能是“事關(guān)我國能否抓住新一輪科技革命和產(chǎn)業(yè)變革機(jī)遇的戰(zhàn)略問題”,是“我們贏得全球科技競爭主動權(quán)的重要戰(zhàn)略抓手”,作為新時期青年科學(xué)家,理應(yīng)當(dāng)仁不讓、一馬爭先,立足于“四個面向”,踐行科研報國初心。
“作為80后青年學(xué)者,我們經(jīng)歷了中國科研由弱到強(qiáng)的發(fā)展歷程、由不自信到自信的心路歷程?!痹谕跖d剛看來,科研自信是土生土長的中國學(xué)者的自信,是關(guān)于中國科研體系的自信,是“四個自信”在科研領(lǐng)域的集中體現(xiàn)。
“解鎖”計算機(jī)視覺識別巨大潛力
計算機(jī)視覺作為人工智能領(lǐng)域前沿研究學(xué)科,是一門關(guān)于如何運(yùn)用照相機(jī)和計算機(jī)來獲取被拍攝對象的數(shù)據(jù)與信息的學(xué)問,好比給計算機(jī)安裝上“眼睛”和“大腦”,讓計算機(jī)能夠感知環(huán)境。視覺識別是計算機(jī)視覺的基礎(chǔ)問題,其研究目的是讓計算機(jī)、機(jī)器人的“眼睛”能在圖像視頻中精確的定位出感興趣的目標(biāo)位置并確定目標(biāo)類別。
日前,華中科技大學(xué)與地平線計算機(jī)視覺聯(lián)合研究中心為期四年的合作研究落下帷幕。4月2日,王興剛團(tuán)隊(duì)關(guān)于《基于神經(jīng)結(jié)構(gòu)搜索的高效率人體姿態(tài)估計》論文獲得了《計算機(jī)可視媒體》期刊2021年度最佳論文獎。該獎項(xiàng)包含獎金1000美元,將在CVM 2022大會上頒發(fā)。
目前,全球計算機(jī)視覺識別研究主要存在三大難題,即當(dāng)前的深度神經(jīng)網(wǎng)絡(luò)模型難以準(zhǔn)確靈活地刻畫復(fù)雜的視覺場景特征,視覺識別模型依賴于完美精確的人工標(biāo)注數(shù)據(jù)來進(jìn)行訓(xùn)練和學(xué)習(xí),方法需要的計算量大、功耗高,難以在低成本硬件上實(shí)時運(yùn)行。
剛開始,實(shí)驗(yàn)設(shè)備缺乏、團(tuán)隊(duì)經(jīng)費(fèi)不足、人手嚴(yán)重不夠。王興剛團(tuán)隊(duì)摒棄國外競爭對手做大算力大模型的思路,從數(shù)據(jù)高效和計算高效的思路實(shí)現(xiàn)獨(dú)辟蹊徑。他帶領(lǐng)團(tuán)隊(duì)歷經(jīng)四年研究,提出空間稀疏的視覺自注意力模型,為實(shí)現(xiàn)高效率的計算機(jī)視覺識別“解鎖”巨大潛力,在圖像視頻語義分割、目標(biāo)檢測等視覺識別問題中被廣泛采用。
此外,空間稀疏的視覺自注意力模型的影響力還輻射到生命科學(xué)領(lǐng)域,于2021年被《自然》封面文章蛋白質(zhì)結(jié)構(gòu)預(yù)測AI AlphaFold使用,有效解決了人工智能程序AlphaFold的內(nèi)存爆炸和計算速度慢難題。谷歌DeepMind創(chuàng)始人哈撒比斯博士評價:“該模型的成功啟發(fā)了采用注意力方法來解譯蛋白質(zhì)序列的探索?!?/p>
“從最開始的一窮二白、艱難起步,到站上國際舞臺與世界頂尖同行同臺競技,從敢于競爭到善于競爭,我們是華中大精神的踐行者。”王興剛自信滿滿。未來,他也將在這個極具挑戰(zhàn)的領(lǐng)域,繼續(xù)深耕,不斷創(chuàng)造新成果。