原創
2024/02/23 11:54:45
來源:米兰体育官网入口
作者:Tian
1788
本文摘要
我們(men) 一般探討智能對話,如智能客服、智能助手、無人駕駛、無人超市等。這類應用程序中的“智能”不但是由機器學習(xi) 方法來訓練一個(ge) 通用模型,並且大語言模型依據用戶輸入的文本形成回答,並且了解輸入的文本,如語義(yi) 理解。在理解用戶輸入的文本之後,就需要將這些信息整合起來形成一個(ge) 語義(yi) 網絡。
我們(men) 一般探討智能對話,如智能客服、智能助手、無人駕駛、無人超市等。這類應用程序中的“智能”不但是由機器學習(xi) 方法來訓練一個(ge) 通用模型,並且大語言模型依據用戶輸入的文本形成回答,並且了解輸入的文本,如語義(yi) 理解。在理解用戶輸入的文本之後,就需要將這些信息整合起來形成一個(ge) 語義(yi) 網絡。

知識圖譜是一種能夠敘述知識係統與(yu) 信息中間關(guan) 係的圖譜,根據繁雜的測算得到大量的數據。與(yu) 傳(chuan) 統統計學習(xi) 方法相比,可以更好的挖掘信息中包含的內(nei) 容。
發展曆程
知識圖譜可分為(wei) 發覺、存儲(chu) 和運用階段。
發掘階段主要是通過挖掘大量文本中的信息來發現海量內(nei) 容。
存儲(chu) 和應用階段主要是對已有的內(nei) 容進行存儲(chu) 和應用,比如檢索、推薦、問答等。
知識圖譜從(cong) 最早的結構化數據開始,再到半結構化數據再到現在的非結構化數據,經曆了從(cong) 簡單到複雜的發展曆程。
概念與(yu) 特點
知識圖譜是對現實世界中存有的實體(ti) 和關(guan) 聯性開展抽象表達、描述和推理的一種方法。它是一種基於(yu) 圖結構、圖論和數據庫管理的新式計算機應用技術,能夠實現實體(ti) 與(yu) 實體(ti) 中間關(guan) 係的形式化表現。
它是一種以圖形結構表明知識的方式,以圖形方式表明和存儲(chu) 知識點與(yu) 內(nei) 容間的關(guan) 係。幫我們(men) 更好地機構與(yu) 理解,及其推理和運用知識。它被應用於(yu) 許多領域,如智能助手、智能客服、智能家居等。
大語言模型知識圖譜特點主要在於(yu) 理解和生成自然語言文本,基於(yu) 深度神經網絡技術,對大規模文本數據進行訓練和學習(xi) ,以實現對給定輸入文本的生成、分類、翻譯等任務。
實體(ti) 抽取
實體(ti) 抽取是知識圖譜中最重要的環節,實體(ti) 抽取的目的是從(cong) 一段文本中提取出包含特定信息的實體(ti) 。實體(ti) 抽取的任務包括實體(ti) 分類和關(guan) 係分類。
實體(ti) 分類可以使用條件隨機,實體(ti) 關(guan) 係分類主要包括依存關(guan) 係抽取、命名實體(ti) 識別等。
依存關(guan) 係抽取是將一段文本中的兩(liang) 個(ge) 詞進行關(guan) 聯,可以提取出其中包含的相關(guan) 信息。目前已經有很多基於(yu) 依存關(guan) 係的方法在知識圖譜中進行實體(ti) 抽取。
關(guan) 係抽取
知識地圖裏的關(guan) 係提取就是從(cong) 知識圖譜中提取實體(ti) 間的關(guan) 係。比如,一個(ge) 實體(ti) 是“蘋果”,它對應“水果”,水果對應“蘋果”,這樣一個(ge) 實體(ti) 就能與(yu) 其它實體(ti) 有關(guan) 。提取關(guan) 係的目的是使關(guan) 係敘述更準確。
為(wei) 了精確敘述知識圖譜中實體(ti) 間的關(guan) 係,我們(men) 應該從(cong) 知識庫中提取實體(ti) 和關(guan) 係的特點。我們(men) 可以使用已有的內(nei) 容來構建特點關(guan) 係,還可以通過機器學習(xi) 方法來訓練特點關(guan) 係,或者利用設計算法來找到一些方法。
總結
知識圖譜適合於(yu) 描述、推理和管理,以提升知識學習(xi) 與(yu) 應用效率。我們(men) 應該首先明確一些重要的界定,例如類型,哪些信息有意義(yi) ,哪些沒有意義(yi) ,使用一些已有的知識來構建,並挑選及管理不同種類的知識。
“大語言模型與(yu) 知識圖譜” 相關(guan) 推薦
專(zhuan) 屬1v1客服

為(wei) 您提供最全麵的谘詢服務
谘詢熱線

掃碼立即谘詢
預約溝通