訂閱
糾錯(cuò)
加入自媒體

中國的“Databricks”們:打造AI基礎(chǔ)架構(gòu),我們是認(rèn)真的

中國的“Databricks”們:打造AI基礎(chǔ)架構(gòu),我們是認(rèn)真的

AI落地最大的驅(qū)動(dòng)因素是基礎(chǔ)架構(gòu)的升級(jí)

近年來,大數(shù)據(jù)分析、AI等領(lǐng)域一直備受關(guān)注,常有引人關(guān)注的融資事件發(fā)生。美國數(shù)據(jù)科學(xué)公司Databricks剛剛在今年8月底完成了16億美元H輪融資,其最新估值高達(dá)380億美元,相比7個(gè)月前G輪融資時(shí)280億美元的估值,又輕松增加了100億美元。

Databricks“紅了”,連帶著“深巷里的美酒”——數(shù)據(jù)科學(xué)也得到了更多關(guān)注。雖然數(shù)據(jù)科學(xué)是一門復(fù)雜的學(xué)科,但如今已進(jìn)入金融、工業(yè)乃至千行百業(yè),這一過程其實(shí)也是AI從“可用”到“好用”的一個(gè)縮影。

“AI落地的關(guān)鍵,是其價(jià)值的彰顯,以及尋找到適合的商業(yè)落地途徑!本耪略茦ODataCanvas董事長(zhǎng)方磊指出,“以前,人們認(rèn)為算法可能是壁壘。但隨著技術(shù)的快速迭代、開源開放,事實(shí)證明算法并非高不可攀,AI落地最大的驅(qū)動(dòng)因素是基礎(chǔ)架構(gòu)的升級(jí)!

01

AI基礎(chǔ)架構(gòu)升級(jí)刻不容緩

當(dāng)前,中國正處于企業(yè)數(shù)智化轉(zhuǎn)型的時(shí)代拐點(diǎn);仡櫺畔⒒l(fā)展的歷程可以發(fā)現(xiàn),1980年-2000年,這是基礎(chǔ)信息化時(shí)代,服務(wù)器、存儲(chǔ)、操作系統(tǒng)、數(shù)據(jù)庫等基礎(chǔ)設(shè)施軟硬件快速發(fā)展;2000年-2020年,進(jìn)入到流程數(shù)字化時(shí)代,云計(jì)算開始大行其道,云成為基礎(chǔ)設(shè)施,各類SaaS應(yīng)用百花齊放;2020年以后,市場(chǎng)邁入新的階段,其標(biāo)志是“決策智能化”,相關(guān)領(lǐng)域包括數(shù)據(jù)科學(xué)平臺(tái)、云原生數(shù)據(jù)倉庫、開源技術(shù)等迎來爆發(fā)的機(jī)會(huì)。

決策智能化的實(shí)現(xiàn),需要一個(gè)“智能化的底座”,也就是常說的AI基礎(chǔ)架構(gòu)。通過AI基礎(chǔ)架構(gòu)的不斷完善和升級(jí),AI應(yīng)用落地的效率會(huì)更高,也更容易!癆I基礎(chǔ)架構(gòu)的價(jià)值就在于,它能夠讓企業(yè)在其上自主地開發(fā)AI應(yīng)用!狈嚼诟爬ǖ。

AI落地的探索源于算法的創(chuàng)新,之后涌現(xiàn)出的一批AI企業(yè),致力于為客戶提供定制化的端到端的AI應(yīng)用開發(fā)。這在無形中造成了AI落地的高門檻。隨著各行各業(yè)對(duì)智能化的需求愈發(fā)迫切,AI已經(jīng)成了眾多行業(yè)頭部客戶的剛需。但是這些頭部客戶不僅業(yè)務(wù)規(guī)模龐大,而且十分復(fù)雜,其需求也各不相同。如果仍然沿用過去那種“千人千面”的定制化端到端應(yīng)用開發(fā)模式,很難快速滿足這些頭部客戶的業(yè)務(wù)需求,而且AI應(yīng)用的門檻依然高高在上,客戶始終掌握不了主動(dòng)權(quán)。

“從各行業(yè)頭部客戶的需求來看,他們更希望圍繞自身的業(yè)務(wù)開發(fā)自己的AI應(yīng)用,這就需要一個(gè)自主可控的基礎(chǔ)設(shè)施!狈嚼诒硎,“依托AI基礎(chǔ)架構(gòu),由企業(yè)自主開發(fā)AI應(yīng)用,鍛煉并形成自主的AI能力,這才是市場(chǎng)主流,也是AI應(yīng)用落地的內(nèi)驅(qū)力!

Databricks之所以受到市場(chǎng)追捧,正是因?yàn)樗宰钌瞄L(zhǎng)的流數(shù)據(jù)處理為出發(fā)點(diǎn),向上發(fā)展機(jī)器學(xué)習(xí)、建模,向下打造數(shù)據(jù)湖倉一體,不斷擴(kuò)展和完善AI基礎(chǔ)架構(gòu),為最上層的AI應(yīng)用提供一個(gè)優(yōu)化的承載平臺(tái),即AI Foundation。

中國的“Databricks”們:打造AI基礎(chǔ)架構(gòu),我們是認(rèn)真的

來源:Databricks

實(shí)際上,目前業(yè)內(nèi)對(duì)于AI基礎(chǔ)架構(gòu)還沒有一個(gè)統(tǒng)一而明確的定義。但從應(yīng)用實(shí)踐,以及像Databricks這樣的標(biāo)桿企業(yè)的做法來看,AI基礎(chǔ)架構(gòu)至少包含兩大基石,即“數(shù)據(jù)”與“算法”。

以前,大多數(shù)的應(yīng)用都是離線的,比如獲得一份營銷名單。但是現(xiàn)在,客戶對(duì)在線應(yīng)用的需求越來越迫切,很多時(shí)候一個(gè)模型已經(jīng)建好,卻發(fā)現(xiàn)數(shù)據(jù)“供不應(yīng)求”。由此可見,AI應(yīng)用離不開一個(gè)實(shí)時(shí)的數(shù)據(jù)底座,AI基礎(chǔ)架構(gòu)的重要性在此時(shí)得以凸顯。4年前,九章云極DataCanvas就開始打造支持高并發(fā)的實(shí)時(shí)數(shù)倉,如今經(jīng)過品牌升級(jí),一個(gè)功能和性能都更加完善的HSAP(Hybrid Serving/Analytical Processing)實(shí)時(shí)數(shù)倉產(chǎn)品DingoDB呈現(xiàn)出來。這就是九章云極DataCanvas眼中,AI應(yīng)用不可或缺的數(shù)據(jù)底座。

談到AI基礎(chǔ)架構(gòu)的門檻,方磊表示:“算法是技術(shù)上的門檻,但我們已經(jīng)實(shí)現(xiàn)了突破。我們的自動(dòng)機(jī)器學(xué)習(xí)產(chǎn)品,在性能等指標(biāo)上已經(jīng)不遜于國外同類產(chǎn)品,甚至更強(qiáng)。其實(shí),更高的門檻還是在客戶,或者說應(yīng)用層面。當(dāng)前,自建AI基礎(chǔ)架構(gòu)的需求主要集中在各行業(yè)的頭部客戶身上。作為AI廠商,必須有意愿和能力服務(wù)好這些頭部客戶。我們公司從2014年就開始專注并深耕這一領(lǐng)域!

02

九章云極、Databricks像?不像?

從市場(chǎng)大勢(shì)來看,正是決策智能化時(shí)代的到來,才使得像Snowflake、Databricks這樣以數(shù)據(jù)為驅(qū)動(dòng),以創(chuàng)新的AI基礎(chǔ)架構(gòu)支撐AI、大數(shù)據(jù)應(yīng)用落地的企業(yè)成了資本市場(chǎng)的寵兒。

就在Databricks成立的2013年,同樣崇尚數(shù)據(jù)科學(xué)的九章云極DataCanvas也在中國順勢(shì)而起。盡管地處不同,但兩者卻有不少相似之處,尤其在能力建設(shè)和商業(yè)模式愿景上,九章云極DataCanvas和Databricks更頗有幾分默契,這是巧合?還是殊途同歸?

首先,兩家公司的定位相似,都是數(shù)據(jù)科學(xué)的研發(fā)者、應(yīng)用者和推動(dòng)者,并且都在主攻AI基礎(chǔ)架構(gòu)升級(jí)的方向。但是由于出發(fā)點(diǎn)不同、所擅長(zhǎng)的細(xì)分技術(shù)領(lǐng)域不同,Databricks最早以流數(shù)據(jù)處理成名,而九章云極DataCanvas則以開源自動(dòng)機(jī)器學(xué)習(xí)見長(zhǎng),因此在具體構(gòu)建AI基礎(chǔ)架構(gòu)時(shí),兩者選擇的路徑有所差異。

其次,從產(chǎn)品線來看,雖然在細(xì)節(jié)上略有差異,但從整體能力建設(shè)上看,兩家公司的產(chǎn)品可以說是如出一轍,都涵蓋了分析和數(shù)據(jù)兩大部分。在分析部分,九章云極DataCanvas享有業(yè)內(nèi)頗受好評(píng)的開源架構(gòu)機(jī)器學(xué)習(xí)平臺(tái)DataCanvas APS,該平臺(tái)囊括了算子倉庫、模型訓(xùn)練、數(shù)據(jù)處理、自動(dòng)機(jī)器學(xué)習(xí)等,再配合數(shù)據(jù)層面的DingoDB實(shí)時(shí)數(shù)倉,構(gòu)建出數(shù)據(jù)實(shí)時(shí)計(jì)算分析閉環(huán)。而Databricks除了眾所周知的Spark以外,還有同樣知名的數(shù)據(jù)湖倉一體Delta Lake,以及機(jī)器學(xué)習(xí)、數(shù)據(jù)測(cè)試與管理、數(shù)據(jù)解釋和建模產(chǎn)品等。兩家公司通過持續(xù)不斷的創(chuàng)新,致力于讓AI基礎(chǔ)架構(gòu)變得更加“厚實(shí)而飽滿”,可謂異曲同工。

中國的“Databricks”們:打造AI基礎(chǔ)架構(gòu),我們是認(rèn)真的

來源:九章云極DataCanvas

“在數(shù)據(jù)科學(xué)這一領(lǐng)域,我們與Databricks擁有相似的愿景、目標(biāo)和戰(zhàn)略,想做同樣的事,即打造AI基礎(chǔ)架構(gòu),將算力和網(wǎng)絡(luò)充分利用起來!狈嚼诒硎,“對(duì)于有人將我們稱作‘中國的Databricks’,我們感到非常榮幸。這是對(duì)我們的一種認(rèn)可。但我們也清醒地認(rèn)識(shí)到,AI基礎(chǔ)架構(gòu)市場(chǎng)空間巨大,還有很多‘細(xì)致的活兒’要做。這也是我們繼續(xù)快速前進(jìn)的動(dòng)力!

03

把AI嵌入到云里去

任何一個(gè)想有一番作為的企業(yè),肯定都不會(huì)滿足于“成為別人”,九章云極DataCanvas也是如此,成為“中國的Databricks”不是終點(diǎn),“做自己”成為一個(gè)獨(dú)特的存在才是最終目標(biāo)。

實(shí)際上,因?yàn)橹忻纼蓢蟮绞袌?chǎng)和競(jìng)爭(zhēng)環(huán)境,小到企業(yè)的AI應(yīng)用需求,都存在差異。在兩塊不同的土地上長(zhǎng)出的苗,可能屬于同一種類,但在個(gè)體上會(huì)有顯著的差別。試舉一例,在美國市場(chǎng),一直是AWS、Azure、Google Cloud“三朵云”打天下。無論是Snowflake還是Databricks,都生長(zhǎng)在這“三朵云”之上。但在中國,云計(jì)算市場(chǎng)大相徑庭,云的碎片化現(xiàn)象顯而易見,不同的區(qū)域、不同的行業(yè)可能造就了上千朵云。雖然從AI應(yīng)用落地的角度,中美客戶的需求沒有差別,但是在具體的路徑選擇和落地方式上,還是有各自的傾向和習(xí)慣。

方磊坦言,九章云極DataCanvas現(xiàn)階段將主要圍繞各行業(yè)的頭部客戶群體,為其打造AI基礎(chǔ)架構(gòu)。因?yàn)檫@部分客戶的需求最迫切,并且有資金也有技術(shù)能力實(shí)現(xiàn)AI的自主開發(fā)。基于對(duì)中國未來AI行業(yè)生態(tài)發(fā)展的預(yù)判,九章云極DataCanvas建設(shè)性地提出了“云中云”戰(zhàn)略(An AI Cloud in the Clouds),即將AI基礎(chǔ)架構(gòu)及相關(guān)AI能力,嵌入到形形色色的行業(yè)云、區(qū)域云、企業(yè)云、聯(lián)盟云等千朵云中。為了滿足不同云生態(tài)的需求,九章云極DataCanvas必須讓自己的解決方案實(shí)現(xiàn)更加靈活、高效的交付。而“云中云”顯然是事半功倍的做法,可以很好地借力打力,將九章云極DataCanvas的AI能力隨云輸出。

中國的“Databricks”們:打造AI基礎(chǔ)架構(gòu),我們是認(rèn)真的

來源:九章云極DataCanvas

對(duì)于AI基礎(chǔ)架構(gòu),很多行業(yè)用戶一開始的認(rèn)知是模糊的,仍需要持續(xù)的教育。但是某些先行先試的行業(yè)頭部企業(yè),已經(jīng)從AI基礎(chǔ)架構(gòu)的升級(jí)中嘗到了甜頭。比如在銀行業(yè),原來需要幾天才能完成審批的貸款,現(xiàn)在可以實(shí)時(shí)審批;在制造業(yè),工業(yè)質(zhì)量檢測(cè)能力的提升、設(shè)備預(yù)測(cè)性維護(hù)的實(shí)現(xiàn)等都得益于AI的應(yīng)用……諸如此類的案例應(yīng)用不勝枚舉。

“在構(gòu)建AI基礎(chǔ)架構(gòu)的基礎(chǔ)之上,有數(shù)據(jù)、有場(chǎng)景、有預(yù)算、有團(tuán)隊(duì),用戶就可以開發(fā)自己的AI應(yīng)用了!狈嚼诒硎,“原來,用戶習(xí)慣‘伸手’向廠商要‘交鑰匙’的AI解決方案。但這種單獨(dú)定制的解決方案并非長(zhǎng)久之計(jì)!崩缒炒笮弯撹F企業(yè)在全球擁有300多條產(chǎn)線,每條產(chǎn)線用到的設(shè)備、供應(yīng)商各不相同。如果沒有一個(gè)統(tǒng)一的平臺(tái)支撐其建模、分析、應(yīng)用開發(fā)和管理,那么系統(tǒng)將不堪重負(fù)。說到底,用戶還是要依靠自身AI能力的提高,運(yùn)用通用的技術(shù),自主掌握AI應(yīng)用開發(fā)。在這種情況下,AI基礎(chǔ)架構(gòu)就是必須的。這也是九章云極DataCanvas的商業(yè)機(jī)會(huì)。

04

珠玉在前 事半功倍

打造千朵云生態(tài)的AI基礎(chǔ)架構(gòu),是九章云極DataCanvas的商業(yè)定位;而打造中國開源數(shù)據(jù)科學(xué)第一平臺(tái),則是九章云極DataCanvas的初心。兩者并不矛盾。正相反,數(shù)據(jù)科學(xué)與AI基礎(chǔ)架構(gòu)從學(xué)科和商業(yè)應(yīng)用兩個(gè)不同的維度,在九章云極DataCanvas身上實(shí)現(xiàn)了平衡與統(tǒng)一。

在很長(zhǎng)時(shí)間里,數(shù)據(jù)科學(xué)曲高和寡。在中國,像九章云極DataCanvas這樣長(zhǎng)期堅(jiān)持深耕數(shù)據(jù)科學(xué)領(lǐng)域的廠商鳳毛麟角。Databricks可以說是全球范圍內(nèi)數(shù)據(jù)科學(xué)領(lǐng)域最先跑出的企業(yè)。它居高不下的熱度至少證明了,數(shù)據(jù)科學(xué)這個(gè)市場(chǎng)大有可為。

新基建、云原生、數(shù)智化升級(jí)、開源,在這些利好因素下,再加上有Databricks這樣的珠玉在前,以及九章云極DataCanvas等公司多年來的精耕細(xì)作,數(shù)據(jù)科學(xué)的未來值得期待。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)