訂閱
糾錯(cuò)
加入自媒體

Databricks 崛起啟示錄

2022-04-25 14:26
新眸
關(guān)注

新眸大公司研究組作品

作者|葉靜

編輯|桑明強(qiáng)

在數(shù)據(jù)庫(kù)領(lǐng)域,如果問(wèn)當(dāng)下誰(shuí)最火,那Databricks一定排得上號(hào)。

去年8月,距離10億美元的G輪融資剛過(guò)去7個(gè)月,Databricks再次獲得16億美元H輪融資,身價(jià)搖身一變成380億美元,成為外界一致認(rèn)為的超級(jí)獨(dú)角獸。一直以來(lái),數(shù)據(jù)領(lǐng)域備受關(guān)注,如果從2007年開(kāi)始計(jì)算,全球的數(shù)據(jù)量至今已經(jīng)膨脹了近200倍,數(shù)字化被寫(xiě)入戰(zhàn)略規(guī)劃成了各類(lèi)行業(yè)的共識(shí)。

在數(shù)據(jù)量井噴的背景下,上云趨勢(shì)也越來(lái)越明確,以Snowflake、Databricks為代表的大數(shù)據(jù)公司應(yīng)運(yùn)而生,前者基于AmazonS3打造了云端的數(shù)據(jù)倉(cāng)庫(kù),后者除了推出Lakehouse(湖倉(cāng)一體),現(xiàn)在又押寶機(jī)器學(xué)習(xí),試圖包管數(shù)據(jù)在抵達(dá)機(jī)器學(xué)習(xí)之前的所有流程。

不同的是,Databricks已經(jīng)從原來(lái)的infra向更廣泛場(chǎng)景延伸,和昔日的伙伴Snowflake同臺(tái)競(jìng)技。與此同時(shí),以AWS為代表的云巨頭,也都曾戰(zhàn)略性投資過(guò)Databricks,但現(xiàn)在也都在自研數(shù)據(jù)分析套件,競(jìng)合關(guān)系漸趨白熱化,讓數(shù)據(jù)基礎(chǔ)設(shè)施的戰(zhàn)火撲朔迷離。

01從0到1

企業(yè)的性格往往被它的創(chuàng)始人和技術(shù)背景所決定。

十幾年前在UC Berkley的AI實(shí)驗(yàn)室里,Ghodsi和伙伴發(fā)起Spark項(xiàng)目:做一個(gè)能夠更輕松處理大量數(shù)據(jù)和機(jī)器算法的引擎,并且開(kāi)源了代碼。相比較多數(shù)開(kāi)源項(xiàng)目,面向的都是底層技術(shù)性強(qiáng)要求的infra工程師,spark面向更廣泛的客戶(hù)群,同時(shí)在上層加了很多的新的API,降低了技術(shù)門(mén)檻。

因?yàn)闆](méi)有優(yōu)秀的開(kāi)發(fā)者社區(qū)運(yùn)營(yíng)和推廣團(tuán)隊(duì),Spark變現(xiàn)比較難,之后團(tuán)隊(duì)成員決定成立Databricks,以商業(yè)化方式推動(dòng)Spark社區(qū)發(fā)展。即便Spark是過(guò)去硅谷的頂流產(chǎn)品,但這并沒(méi)有讓AWS等巨頭買(mǎi)賬,他們選擇繞過(guò)Databricks,直接將Spark集成到自己的產(chǎn)品里。在Databricks賣(mài)產(chǎn)品還不如辦Spark峰會(huì)收入高的時(shí)候,Amazon EMR已經(jīng)針對(duì)Spark實(shí)現(xiàn)了幾億營(yíng)收。

Databricks創(chuàng)始團(tuán)隊(duì)走了一條不被大眾熟知的激進(jìn)的路:云。

雖然不管對(duì)公司還是客戶(hù)來(lái)說(shuō),云可以更快部署,也更容易維護(hù),但正如聯(lián)合創(chuàng)始人Reynold Xin所說(shuō),大部分的人知道云是未來(lái),但絕不是現(xiàn)在。當(dāng)時(shí)只有小部分風(fēng)投注資這家初創(chuàng)企業(yè),New Enterprise Associates的投資者Pete Sonsini說(shuō):“我們?cè)贒atabricks的軟件收入為零時(shí)投資,認(rèn)為他們會(huì)在大流行中加速發(fā)展,也許是一兩個(gè)月,每個(gè)人都無(wú)法及時(shí)知道會(huì)發(fā)生什么”。和Databricks一樣,他們也在賭未來(lái)。

圖:Databricks年度融資及估值變動(dòng)

2013到2015這三年,雖然有硅谷風(fēng)投支持,Databricks也借力這些資金吸引人才,推出了基于云端的簡(jiǎn)化大數(shù)據(jù)處理平臺(tái)Databricks Cloud,但不管是招主管、找融資還是見(jiàn)客戶(hù),Databricks都會(huì)被質(zhì)疑:真的不支持on-prem嗎?

因?yàn)楸晨縎park,很多客戶(hù)甚至愿意年付幾千萬(wàn)美金讓Databricks提供咨詢(xún)定制化項(xiàng)目,但Databricks做的是一個(gè)給數(shù)據(jù)工程師的平臺(tái),這是當(dāng)時(shí)大部分公司聞所未聞的玩法,也是前幾年商途不順的原因之一。值得一提的是,彼時(shí)的云界開(kāi)源前輩Cloudera曾改名“Cloud Era”,可在當(dāng)時(shí)的市場(chǎng)情況下,最終還是轉(zhuǎn)向了on-prem做定制和售后支持才得以存活。

在這種邏輯下,云廠商把開(kāi)源軟件拿來(lái)經(jīng)過(guò)簡(jiǎn)單的封裝,再作為服務(wù)賣(mài)出去。由于這個(gè)過(guò)程只需要簡(jiǎn)單的部署和調(diào)試,工程成本極低,定價(jià)也不高,巨頭從中賺走了大部分,這對(duì)Databricks來(lái)說(shuō)相當(dāng)于吸血,怎樣和有錢(qián)有人的云巨頭對(duì)抗,是Databricks亟需在技術(shù)上打造的壁壘。

他們賭的另一條路,是不做數(shù)倉(cāng)。

彼時(shí)數(shù)據(jù)倉(cāng)庫(kù)競(jìng)爭(zhēng)過(guò)于激烈,以亞馬遜為首的巨頭占據(jù)了大部分市場(chǎng)份額,Databricks繼續(xù)小眾打法:避開(kāi)紅海,嘗試切入一個(gè)新興卻可能會(huì)有爆炸性增長(zhǎng)的小市場(chǎng),針對(duì)數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和AI的方向做產(chǎn)品。

開(kāi)源小公司的優(yōu)勢(shì)在于更懂項(xiàng)目,迭代更快,能夠聚焦、死磕產(chǎn)品性能,而公有云大廠很難在單一方向投入最好的工程師。隨著數(shù)據(jù)量的爆發(fā),云的生態(tài)優(yōu)勢(shì)逐漸被認(rèn)可,加上當(dāng)時(shí)市面上也沒(méi)有大量競(jìng)品,這給Databricks的產(chǎn)品帶來(lái)了機(jī)會(huì)。

另一方面,在2019年微軟投資Databricks之前,正巧CEO納德拉推動(dòng)云為先的戰(zhàn)略,兩家合作的Azure Databricks進(jìn)入了微軟的企業(yè)許可協(xié)議。微軟從一個(gè)大數(shù)據(jù)競(jìng)爭(zhēng)劣勢(shì)的云產(chǎn)品搖身成為業(yè)界領(lǐng)先,形成了云巨頭三足鼎立的局面;因?yàn)閹缀跛写笃髽I(yè)都和微軟有ELA,共生效應(yīng)之下,客戶(hù)原本買(mǎi)云買(mǎi)Office的預(yù)算自然流向了Databricks。

有人將Databricks創(chuàng)始團(tuán)隊(duì)比作一群幸運(yùn)的加州嬉皮士RD,他們信仰技術(shù),信仰來(lái)源,信仰共享和長(zhǎng)期主義,這些也都成為了Databricks的底色。

1  2  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)