國(guó)家自然科學(xué)基金網(wǎng)“資助成果 ”報(bào)道:上海交通大學(xué)鄒衛(wèi)文教授團(tuán)隊(duì)提出了光子學(xué)與計(jì)算科學(xué)交叉的創(chuàng)新思路,研制了實(shí)現(xiàn)高速?gòu)埩烤矸e運(yùn)算的新型光子張量處理芯片,相關(guān)成果以“基于集成光子芯片的高階張量流式處理(High-order tensor flow processing using integrated photonic circuits)”為題發(fā)表在2022年12月《自然?通訊》(Nature Communications)期刊上。論文鏈接:https://www.nature.com/articles/s41467-022-35723-2。
多維數(shù)據(jù)堆疊構(gòu)成的張量形式是數(shù)據(jù)處理的高效形式,有利于發(fā)掘數(shù)據(jù)中的內(nèi)在結(jié)構(gòu)特征,在雷達(dá)、通信、人工智能、生命科學(xué)等領(lǐng)域得到廣泛應(yīng)用。隨著未來(lái)信息技術(shù)的發(fā)展,數(shù)據(jù)生成速度呈現(xiàn)爆炸式增長(zhǎng),海量數(shù)據(jù)的多維堆疊及其高效快速處理成為當(dāng)前面臨的重要科學(xué)挑戰(zhàn)。為應(yīng)對(duì)這一挑戰(zhàn),傳統(tǒng)電學(xué)處理器通常采用通用化矩陣乘法(Generalized Matrix Multiplication, GeMM)策略將高階張量運(yùn)算轉(zhuǎn)化成為矩陣乘法運(yùn)算,將多級(jí)嵌套的循環(huán)運(yùn)算轉(zhuǎn)化為并行運(yùn)算,通過(guò)提升計(jì)算核心數(shù)量來(lái)增大張量處理的整體速度。然而,GeMM策略依賴于數(shù)據(jù)的大量復(fù)制,需要額外內(nèi)存占用以及內(nèi)存與處理器間的反復(fù)通信開(kāi)銷(xiāo),是提升多維數(shù)據(jù)張量運(yùn)算速度的核心瓶頸之一。
鄒衛(wèi)文教授團(tuán)隊(duì)提出了基于光子集成手段構(gòu)建張量運(yùn)算過(guò)程的學(xué)科交叉研究思路,既可發(fā)揮出光學(xué)的寬帶高速特性將運(yùn)算時(shí)鐘頻率提升至數(shù)十GHz,又可利用光學(xué)的多自由度直接表征張量數(shù)據(jù)的不同維度。該思路無(wú)需進(jìn)行張量到矩陣的轉(zhuǎn)換,可實(shí)現(xiàn)輸入張量到輸出張量的流式計(jì)算(圖1)。基于這一創(chuàng)新思路,該團(tuán)隊(duì)設(shè)計(jì)并研制了一款光子張量處理芯片(圖2),綜合利用了光學(xué)的波長(zhǎng)、空間與時(shí)延三個(gè)自由度,在多通道圖像上成功驗(yàn)證了時(shí)鐘頻率為20GHz的高速?gòu)埩烤矸e運(yùn)算,芯片算力密度為588 GOP/s/mm2,后續(xù)通過(guò)提升光子器件集成規(guī)模有望達(dá)到1TOP/s/mm2以上。團(tuán)隊(duì)利用該芯片構(gòu)建了用于視頻動(dòng)作識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)(圖3),網(wǎng)絡(luò)中的卷積層在光子張量處理芯片上完成,最終在KTH視頻數(shù)據(jù)集上實(shí)現(xiàn)了97.9%的識(shí)別準(zhǔn)確率,接近理想識(shí)別準(zhǔn)確率98.9%。本研究成果表明光子集成芯片可在超高時(shí)鐘頻率下實(shí)現(xiàn)張量流式處理,解決額外內(nèi)存占用與訪存問(wèn)題,為構(gòu)建高性能計(jì)算、寬帶信號(hào)處理等先進(jìn)信息系統(tǒng)提供了新的技術(shù)途徑。
原文鏈接:我國(guó)學(xué)者在光子張量處理芯片方面取得進(jìn)展 (nsfc.gov.cn)