9月25日的杭州云棲大會上,達(dá)摩院院長張建鋒現(xiàn)場展示了這款全球最強(qiáng)的AI芯片——含光800,這也是阿里巴巴第一顆自研芯片。
在業(yè)界標(biāo)準(zhǔn)的ResNet-50測試中,含光800推理性能達(dá)到78563IPS,比目前業(yè)界最好的AI芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍。
張建鋒說:“在全球芯片領(lǐng)域,阿里巴巴是一個新人,玄鐵和含光800是平頭哥的萬里長征第一步,我們還有很長的路要走。”
據(jù)悉,含光為上古三大神劍之一,該劍含而不露,光而不耀,正如含光800帶來的無形卻強(qiáng)勁的算力。在杭州城市大腦的業(yè)務(wù)測試中,1顆含光800的算力相當(dāng)于10顆GPU。
含光800性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構(gòu),通過推理加速等技術(shù)有效解決芯片性能瓶頸問題;軟件層面集成了達(dá)摩院先進(jìn)算法,針對CNN及視覺類算法深度優(yōu)化計算、存儲密度,可實現(xiàn)大網(wǎng)絡(luò)模型在一顆NPU上完成計算。
含光800已開始應(yīng)用在阿里巴巴內(nèi)部核心業(yè)務(wù)中。根據(jù)云棲大會的現(xiàn)場演示,在城市大腦中實時處理杭州主城區(qū)交通視頻,需要40顆傳統(tǒng)GPU,延時為300ms,使用含光800僅需4顆,延時降至150ms。
拍立淘商品庫每天新增10億商品圖片,使用傳統(tǒng)GPU算力識別需要1小時,使用含光800后可縮減至5分鐘。
含光800將通過阿里云對外輸出AI算力。基于含光800的AI云服務(wù)當(dāng)天正式上線,相比傳統(tǒng)GPU算力,性價比提升100%。