訂閱
糾錯(cuò)
加入自媒體

燧原科技發(fā)布首款人工智能推理產(chǎn)品 “云燧i10”

2020-12-22 08:48
美通社
關(guān)注

上海2020年12月21日 /美通社/ -- 燧原科技今日發(fā)布首款人工智能推理產(chǎn)品 “云燧?i10”。這是一款面向云端數(shù)據(jù)中心的高性能推理卡。云燧i10是單槽位標(biāo)準(zhǔn)卡,支持PCIe 4.0,F(xiàn)P32算力達(dá)到17.6TFLOPS,BF16/FP16算力70.4TFLOPS。同時(shí),燧原科技發(fā)布了推理引擎“鑒算TopsInference”,可以為深度學(xué)習(xí)應(yīng)用提供低延遲、高吞吐率的推理性能,并降低數(shù)據(jù)中心的部署成本。云燧i10將于明年第一季度上市。

燧原科技發(fā)布首款人工智能推理產(chǎn)品 -- “云燧(R)i10”

燧原科技發(fā)布首款人工智能推理產(chǎn)品 -- “云燧i10”

根據(jù)權(quán)威市場(chǎng)機(jī)構(gòu)預(yù)測(cè),云數(shù)據(jù)中心對(duì)于人工智能推理芯片的需求將從2022年開(kāi)始超越對(duì)于訓(xùn)練芯片的需求,整個(gè)推理市場(chǎng)蓄勢(shì)待發(fā)。云端推理解決方案更注重綜合指標(biāo),包括算力、時(shí)延、成本等,也更為關(guān)注用戶體驗(yàn)的優(yōu)化。

“云燧i10”擁有卓越的算力、出色的通用性以及優(yōu)異的價(jià)值特性:

高算力、多精度:FP32算力17.6TFLOPS,BF16/FP16算力70.4TFLOPS;采用自主指令集,支持從FP32到INT8等多種精度,而最大功耗僅為150W;

高能效、高可靠性:采用動(dòng)態(tài)調(diào)頻調(diào)壓(DVFS)技術(shù),根據(jù)負(fù)載加速應(yīng)用性能,支持RAS、ECC;

設(shè)備虛擬化:實(shí)現(xiàn)多用戶支持,最大可支持4個(gè)設(shè)備實(shí)例,具備計(jì)算與存儲(chǔ)資源的獨(dú)享性,多用戶間安全隔離;單顆芯片上可同時(shí)部署不同的業(yè)務(wù)與負(fù)載,實(shí)現(xiàn)多任務(wù)并行,有效提高利用率;支持KVM、Xen等系統(tǒng)虛擬化平臺(tái);

易編程、生態(tài)開(kāi)放:開(kāi)放C++和Python編程接口,支持CNN及NLP典型模型,支持主流機(jī)器學(xué)習(xí)框架,并通過(guò)SDK提供深度定制。

燧原科技同時(shí)推出針對(duì)推理產(chǎn)品的高性能神經(jīng)網(wǎng)絡(luò)模型推理引擎“鑒算TopsInference”,通過(guò)計(jì)算圖優(yōu)化、算子融合、模型壓縮、量化等優(yōu)化技術(shù),可以為深度學(xué)習(xí)應(yīng)用提供低延遲、高吞吐率的推理性能。通過(guò)TopsInference的推理加速,配合i10 的高算力及虛擬化技術(shù),數(shù)據(jù)中心可以高性價(jià)比地部署計(jì)算密集型深度學(xué)習(xí)工作負(fù)載。此外TopsInference除TensorFlow、PyTorch模型格式外,還支持ONNX通用模型格式,借助燧原GCU-CARA架構(gòu)的可編程性,可以應(yīng)對(duì)未來(lái)深度神經(jīng)網(wǎng)絡(luò)日益多樣化、復(fù)雜的增長(zhǎng)趨勢(shì)。

燧原科技發(fā)布首款人工智能推理產(chǎn)品 -- “云燧(R)i10”

燧原科技創(chuàng)始人兼CEO趙立東表示燧原科技要堅(jiān)持雙輪驅(qū)動(dòng),爭(zhēng)做行業(yè)領(lǐng)導(dǎo)者

“繼去年12月發(fā)布了首款面向數(shù)據(jù)中心的人工智能訓(xùn)練加速卡“云燧T10”,今天我們又推出針對(duì)云端推理市場(chǎng)的第一款人工智能推理加速卡“云燧i10”,以滿足由于AI應(yīng)用和落地場(chǎng)景迅速擴(kuò)大,市場(chǎng)和客戶對(duì)更高性價(jià)比以及國(guó)產(chǎn)化和差異化云端推理產(chǎn)品的需求。燧原科技也因此成為國(guó)內(nèi)唯一一家同時(shí)擁有云端訓(xùn)練和推理加速產(chǎn)品的初創(chuàng)公司,形成業(yè)務(wù)閉環(huán)!膘菰萍糃EO趙立東表示,“當(dāng)前全球科技產(chǎn)業(yè)特別是集成電路產(chǎn)業(yè)正在發(fā)生深刻變革,燧原科技會(huì)繼續(xù)加速技術(shù)創(chuàng)新和產(chǎn)品迭代,拉近與世界先進(jìn)水平的距離,構(gòu)筑自主創(chuàng)新技術(shù)的護(hù)城河。與此同時(shí),與上下游伙伴合作,加速業(yè)務(wù)落地,擴(kuò)大市場(chǎng)規(guī)模。針對(duì)互聯(lián)網(wǎng)數(shù)據(jù)中心、垂直行業(yè)(金融、保險(xiǎn)、教育、醫(yī)療及運(yùn)營(yíng)商等)、新基建三大業(yè)務(wù)方向的應(yīng)用場(chǎng)景,完善訓(xùn)練和推理軟件棧、工具鏈和解決方案。通過(guò)產(chǎn)學(xué)研協(xié)作,共建國(guó)產(chǎn)化產(chǎn)業(yè)生態(tài),助力中國(guó)人工智能和集成電路產(chǎn)業(yè)的發(fā)展。”

燧原科技發(fā)布首款人工智能推理產(chǎn)品 -- “云燧(R)i10”

燧原科技創(chuàng)始人兼COO張亞林介紹“云燧i10”推理系統(tǒng)

燧原科技COO張亞林介紹道:“云燧i10在多項(xiàng)基準(zhǔn)測(cè)試中,性能領(lǐng)先,并已完成與浪潮、新華三及Supermicro等服務(wù)器廠商推理服務(wù)器的適配?蛇m用于視頻圖像、語(yǔ)音、自然語(yǔ)言處理、知識(shí)圖譜等多種應(yīng)用場(chǎng)景,并針對(duì)內(nèi)容理解、推薦、識(shí)別等高精度場(chǎng)景做了優(yōu)化。與此同時(shí),面向多元的開(kāi)發(fā)需求,我們提供不同層次的開(kāi)發(fā)模式,針對(duì)客戶定制化算法模型聯(lián)合開(kāi)發(fā),從而實(shí)現(xiàn)與客戶的雙贏。此外,云燧i10與云燧T10以及“馭算TopsRider”軟件平臺(tái)搭配,可實(shí)現(xiàn)算法模型在數(shù)據(jù)中心訓(xùn)推一體化的快速生產(chǎn)部署!

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)