訂閱
糾錯(cuò)
加入自媒體

知識圖譜走出至暗時(shí)刻

世界擁有不計(jì)其數(shù)的實(shí)體,以人力已無法將實(shí)體和概念建立完整的聯(lián)系,而知識圖譜可以彌補(bǔ)這樣的空缺。

@數(shù)科星球 原創(chuàng)

作者丨科科  編輯丨十里香

人工智能行至半途,在各行各業(yè),AI的滲透與日俱增。作為人工智能的分支,知識圖譜可謂歷史已久。如今,新的應(yīng)用場景被開發(fā),一幅技術(shù)革命的畫面已然呈現(xiàn)在世人面前。

01

沉默的技術(shù)高地

和大多數(shù)的AI技術(shù)一樣,知識圖譜也是一種交叉學(xué)科,其橫跨了包括知識工程、自然語言處理、機(jī)器學(xué)習(xí)、圖數(shù)據(jù)庫等在內(nèi)的多個(gè)領(lǐng)域。

在構(gòu)建知識圖譜的流程中,也要通過知識建模、關(guān)系抽取、圖存儲(chǔ)、自動(dòng)推理、圖譜表示學(xué)習(xí)、語義搜索、智能問答、圖計(jì)算分析等一系列步驟才可得以完成。

在這個(gè)角度上,說知識圖譜是復(fù)雜的技術(shù)并不為過。

在這項(xiàng)技術(shù)的發(fā)展時(shí)間線上,數(shù)科星球(ID:digital-planet)看到,其有谷歌、百度等搜索引擎企業(yè)參與,再到后來,知識圖譜開始走出大企業(yè),開始在醫(yī)療、金融和安全等領(lǐng)域發(fā)揮作用,人們喜聞樂見的小度音箱和天貓精靈等產(chǎn)品更是新一代知識圖譜技術(shù)應(yīng)用的集中體現(xiàn)。

由大型搜索引擎公司所構(gòu)建的知識圖譜,正在賦能于垂直,其提供了更多的旨在表明實(shí)體和關(guān)系的語義信息,可以賦能用戶在不同場景下查詢。

如今,市面上仍然可以看到上一代知識圖譜產(chǎn)品的影子:比如出現(xiàn)在谷歌搜索結(jié)果信息流右側(cè)的知識卡片等等。

知識圖譜技術(shù)支撐起了互聯(lián)網(wǎng)發(fā)展的下一個(gè)高峰。機(jī)器人的聊天、企業(yè)服務(wù)行業(yè)的智能問答產(chǎn)品以及現(xiàn)在的搜索引擎中的智能推薦,都用到了知識圖譜功能?偟膩碚f,知識圖譜正在走出通用的象牙塔,向著垂直領(lǐng)域發(fā)展。這種垂直不僅意味著垂直行業(yè),更意味著在決策、推薦和問答場景中的細(xì)分。

現(xiàn)在,在知識圖譜界已出現(xiàn)兩大技術(shù)方向——其一是數(shù)據(jù)互聯(lián)網(wǎng),可以理解成基于網(wǎng)頁的產(chǎn)品形態(tài);其二是事物互聯(lián)網(wǎng),其交互場景不以傳統(tǒng)互聯(lián)網(wǎng)形態(tài)存在,如在數(shù)科星球(ID:digital-planet)報(bào)道過的汽車后市場、高鐵等領(lǐng)域就以音頻等方式存在。

所以,未來知識圖譜的競爭將在人們看不見的語義網(wǎng)絡(luò)中展開。在巨型企業(yè)中,語義網(wǎng)絡(luò)的競爭已經(jīng)成為常態(tài),其中谷歌有Freebase、IBM Waston有DBpedia和Yago、Amazon Alexa有True Knowledge,幾乎每個(gè)人都接觸過的蘋果Siri有Wolfram Alpha等等。

有了知識圖譜,大數(shù)據(jù)分析、語言理解就能更上一個(gè)臺(tái)階。在發(fā)現(xiàn)更多概念和事物之間的關(guān)系后,“隱藏”知識將被發(fā)現(xiàn),當(dāng)然這其中少不了運(yùn)用圖數(shù)據(jù)庫、自然語言處理、機(jī)器學(xué)習(xí)等多方面的技術(shù)。

在未來,知識圖譜技術(shù)將會(huì)增強(qiáng)機(jī)器學(xué)習(xí)的可解釋性,將在圖卷積輔助圖像分類等多個(gè)領(lǐng)域發(fā)揮出越來越重要的作用。數(shù)科星球(ID:digital-planet)將在其后的文章中一一解答知識圖譜所涉及的相關(guān)領(lǐng)域。

02

知識圖譜技術(shù)正在成為新變量

在人工智能發(fā)展早期,人們希望通過用計(jì)算機(jī)符號模擬人腦知識并推倒人類的心智,在神經(jīng)網(wǎng)絡(luò)中,強(qiáng)調(diào)信息傳導(dǎo)。現(xiàn)在由于計(jì)算機(jī)算力和數(shù)據(jù)量的提升,人工智能的研究取得了長足進(jìn)步。

在新的時(shí)代下,遙感影像、攝像頭、問卷調(diào)查、手機(jī)信令、GPS追蹤等領(lǐng)域以肉眼可見的速度成長。在這個(gè)過程中,所謂“多源異構(gòu)數(shù)據(jù)”正在呈指數(shù)級爆發(fā)。

數(shù)據(jù)的來源更多了,數(shù)據(jù)的類型也不僅僅是上個(gè)時(shí)代喜聞樂見的表格等信息。在這樣的趨勢下,數(shù)據(jù)庫行業(yè)也在發(fā)生變革,基礎(chǔ)庫、主題庫甚至專題庫紛紛上線,以地理信息、IoT、軌跡數(shù)據(jù)為代表的時(shí)空數(shù)據(jù)正在得到大面積應(yīng)用,AP、TP數(shù)據(jù)庫需求顯著分化。

對于企業(yè)來說,多源異構(gòu)數(shù)據(jù)的處理難度變得越來越高。在制造業(yè)中,儀器的檢修、采購、運(yùn)行數(shù)據(jù)以及產(chǎn)品的銷售、退回記錄和反饋都會(huì)遺留在各種各樣的終端之上。在這種情況下,與其將所有數(shù)據(jù)整理成一個(gè)整體,不如將數(shù)據(jù)之間建立關(guān)聯(lián),來改善運(yùn)營現(xiàn)狀,而這就是知識圖譜更大的應(yīng)用場景。

從信息的模糊到準(zhǔn)確、從數(shù)據(jù)的失真到真實(shí),構(gòu)成了企業(yè)在提高效率方面的新閉環(huán),其中不可缺少的就是知識圖譜所帶來的諸多好處。

如今的知識圖譜產(chǎn)品甚至正在沖擊傳統(tǒng)ERP市場。在之前,人們已經(jīng)習(xí)慣手動(dòng)錄入數(shù)據(jù)到數(shù)據(jù)庫,再通過SQL查詢。現(xiàn)在,二維表可能被知識圖譜取代,割裂在不同領(lǐng)域的知識正在成為一個(gè)整體。

這種整體的知識也正在成為企業(yè)新的競爭力體現(xiàn):如在智能搜索、競品分析、反欺詐、論文查重和實(shí)時(shí)輿情分析中,知識圖譜都有用武之地。

一段時(shí)間后,隨著軟件廠商在圖數(shù)據(jù)模型、規(guī)則模型和算法模型的進(jìn)一步積累,各行各業(yè)也將出現(xiàn)服務(wù)于不同行業(yè)的知識圖譜產(chǎn)品。至少,已經(jīng)有不少公司正在這樣做。

03

知識圖譜的未來展望

客觀上,世界擁有不計(jì)其數(shù)的實(shí)體,以人力已無法將實(shí)體和概念建立完整的聯(lián)系,而知識圖譜可以彌補(bǔ)這樣的空缺。

目前知識圖譜行業(yè)還存在一些軟肋有待攻破:

其一,知識圖譜對所屬行業(yè)的業(yè)務(wù)了解不夠透徹,底層技術(shù)能力難以覆蓋完整的生產(chǎn)流程;

其二,一些知識圖譜公司將太多精力投入在可視化展示之中,而在場景的深度挖掘以及數(shù)據(jù)積累上還有待提高;

其三,是行業(yè)人才匱乏,技術(shù)難以趕上業(yè)務(wù)需求的增長。

在不足的另一側(cè),是行業(yè)的迅速增長。艾瑞的咨詢報(bào)告顯示,2021年,知識圖譜核心市場規(guī)模預(yù)計(jì)達(dá)到107億元,而到2026年,相應(yīng)規(guī)模將超過296億元,2021-2026年CA?GR=22.5%。知識圖譜成為20%以上增長的行業(yè)之一,高速的增長理應(yīng)引起廣大投資者們的重視。

目前,金融和公安行業(yè)已成為知識圖譜行業(yè)應(yīng)用最快的垂直行業(yè)。在上述兩個(gè)行業(yè)中,企業(yè)的投入不遺余力,成為了知識圖譜行業(yè)增長的不可忽視的動(dòng)力。在未來,政務(wù)+知識圖譜的市場將被喚醒,一些行業(yè)專家認(rèn)為,政務(wù)的需求同樣不可忽視。

目前,知識圖譜的國家標(biāo)準(zhǔn)正在積極籌備中,一些知名企業(yè)也在其中起到了重要作用。以達(dá)觀數(shù)據(jù)為例,其產(chǎn)品已廣泛應(yīng)用于汽車工業(yè)、軍事裝備、核工業(yè)、電力電網(wǎng)、能源、消費(fèi)電子、通信、集成電路、船舶制造、材料、航空航天、制藥、醫(yī)療設(shè)備、機(jī)械裝備、礦業(yè)、鋰電等領(lǐng)。

回顧知識圖譜的發(fā)展歷史,人們會(huì)驚訝于該領(lǐng)域的崛起速度。早期,ConceptNet 5.0也僅包含2800萬個(gè)RDF三元組關(guān)系描述,而現(xiàn)在,這樣的數(shù)據(jù)已超千億級別。

*數(shù)科星球(ID:digital-planet)出品

       原文標(biāo)題 : 知識圖譜走出至暗時(shí)刻

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號