您所在位置:首頁 > 新聞動態(tài) > 行業(yè)新聞

深度語義因果圖譜

發(fā)布時間:2021-12-28

瀏覽次數(shù):245

       自從2012年Google推出知識圖譜(Knowledge Graph)以來,知識圖譜的概念逐漸獲得了學(xué)界以及工業(yè)界的認(rèn)可和廣泛使用。相匹配的自動化信息抽取技術(shù)與之循環(huán)發(fā)展,形成了當(dāng)前網(wǎng)絡(luò)上的各種開放或領(lǐng)域知識圖譜。自動化、大規(guī)模的提取手段也成為知識圖譜技術(shù)相比于上世紀(jì)70年代的專家系統(tǒng)而言更具有競爭力的核心因素之一。


       然而,知識圖譜覆蓋面的拓寬以及對特定領(lǐng)域建模的深入,現(xiàn)有表達(dá)方式的不足逐漸顯露。在需要復(fù)雜知識架構(gòu)以及深度推理的領(lǐng)域,扁平化的二元關(guān)系的表達(dá)不足以精確刻畫知識結(jié)構(gòu)并保證知識的連通性。因此,我們在對知識進(jìn)行建模的時候引入遞歸的表達(dá)結(jié)構(gòu)以支持深度語義以及內(nèi)容的可達(dá)性。


       例如,細(xì)菌性肺炎和病毒性肺炎都會導(dǎo)致患者出現(xiàn)咳嗽的癥狀,但是咳嗽的具體表現(xiàn)并不相同:細(xì)菌性肺炎導(dǎo)致的咳嗽大多有痰,而病毒性肺炎多致干咳。如果要保留內(nèi)容的準(zhǔn)確性,則需要把干咳和咳痰作為兩個獨立的實體分別和兩種肺炎聯(lián)系起來,但是干咳和咳痰內(nèi)部的聯(lián)系就難以表達(dá);而如果要清楚表達(dá)這種內(nèi)在聯(lián)系,則需要指數(shù)級地擴充實體或關(guān)系數(shù)量。更不遑論這些癥狀往往還具有更細(xì)致的分類且一些分類標(biāo)準(zhǔn)還往往適用于多種癥狀和體征(比如時間特征)。對于這樣的深度語義,我們引入遞歸的表達(dá)方式,對于上述例子,我們只需要建立如下所示的嵌套的關(guān)系:
  • (細(xì)菌性肺炎,導(dǎo)致,(咳嗽,條件,有痰))
  • (病毒性肺炎,導(dǎo)致,(咳嗽,條件,無痰))
       本質(zhì)上,知識圖譜基于描述邏輯(Description Logic)形式化模型。作為一階謂詞邏輯(First-order Predicate Logic)的一個子集,其僅包含至多2元的謂詞。引入嵌套結(jié)構(gòu)之后,則其可表達(dá)更豐富的多元關(guān)系。在實踐中,這樣的遞歸結(jié)構(gòu)往往是具有特定深度和模式的,因此可以將每種特定的嵌套結(jié)構(gòu)展開與某個多元謂詞相對應(yīng)。比如,上述例子可以等價于:
  • 導(dǎo)致(細(xì)菌性肺炎,咳嗽,有痰)
  • 導(dǎo)致(病毒性肺炎,咳嗽,無痰)

       早期的知識圖譜多用于表示事實性內(nèi)容,比如“奧巴馬是美國總統(tǒng)”??陀^事實結(jié)合一些簡單的元規(guī)則(Meta Rules)可以實現(xiàn)簡單的推理,但是隨著人工智能的推進(jìn),人們對推理的廣度、深度和精度提出了越來越高的要求,因果知識圖譜應(yīng)運而生。因果圖譜除了包含事實性內(nèi)容之外,還會將實體依照因果關(guān)系進(jìn)行連接,或者建立已有關(guān)系到因果語義的轉(zhuǎn)換方式。因何也將該方法論融入技術(shù)路線,在構(gòu)造事實性知識庫的同時不斷探索其與因果的認(rèn)識論的結(jié)合方式,打造更優(yōu)的深度語義因果知識圖譜。因何推出的醫(yī)學(xué)知識圖譜就是或者結(jié)合的典型實踐,除了按照事實關(guān)系組織醫(yī)學(xué)實體以外,還對其中部分關(guān)系賦予了因果語義,使其既可以像通用的醫(yī)學(xué)百科一樣進(jìn)行查詢以外,還能夠根據(jù)患者的實際病癥進(jìn)行推理,模擬醫(yī)生的思維方式進(jìn)行智能診斷。目前,醫(yī)學(xué)知識庫搭配診斷算法已經(jīng)在山西省人民醫(yī)院落地實踐,并對提升診療流程的效率、降低成本起到了積極作用。

11111.png



22222.png