成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

數(shù)據(jù)庫漢語查詢句中查詢目標(biāo)信息的研究

計(jì)算機(jī)科學(xué)2007Vol 134№13 數(shù)據(jù)庫漢語查詢句中查詢目標(biāo)信息的研究3)鄭逢斌 葛 強(qiáng) 湯賽麗 黨蘭學(xué)(河南大學(xué)計(jì)算機(jī)與信息工程學(xué)院數(shù)據(jù)與知識工程研究所 開封475001) 摘 要 在自然語言

計(jì)算機(jī)科學(xué)2007Vol 134№13 

數(shù)據(jù)庫漢語查詢句中查詢目標(biāo)信息的研究3)

鄭逢斌 葛 強(qiáng) 湯賽麗 黨蘭學(xué)

(河南大學(xué)計(jì)算機(jī)與信息工程學(xué)院數(shù)據(jù)與知識工程研究所 開封475001)

 

摘 要 在自然語言處理的研究中, 最有希望的應(yīng)用領(lǐng)域之一是自然語言接口。計(jì)算機(jī)對自然語言中的查詢語言理

解的正確程度是自然語言接口質(zhì)量好壞的關(guān)鍵。通過對漢語查詢句———即用于數(shù)據(jù)庫自然語言查詢的祈使句和特指問句、是非問句、正反問句、選擇問句等共五類句型的研究, 建立并研究了復(fù)合概念、邏輯概念與標(biāo)準(zhǔn)概念的內(nèi)在聯(lián)系, 將查詢目標(biāo)概念分解為直接查詢目標(biāo)、邏輯推理目標(biāo)和比較判斷目標(biāo)三個階段, 研究了這三個階段的關(guān)系。關(guān)鍵詞 自然語言處理, 人機(jī)接口, 查詢目標(biāo) 

A Study of the Q uery Aim Information of the uery ZH EN G Feng 2Bin  GE G 2Xue

(Institute of Data and Knowledge Enginerring , College , Henan University , Kaifeng 475001)

 

Abstract  Natural is hopef ul fields in the research on Natural Language Processing. Accuracy of query of natural language is key to quality of the natural language interface. Through the study Chinese query sentence , the Chinese query sentence is consist of the imperative sentence and special question , the yes 2or 2no question ,the positive and negative question , choose question etc. Build and study the relation of composing conception , logical conception , standard conception. The conception of the query aim is decom 2posed into three phases , there are direct query aim , logic discursion aim and compare judge aim , the relation of the three phases has been studied . K eyw ords  Natural language processing ,Man 2machine interface ,Query aim  

中, 最主要的也是系統(tǒng)最關(guān)心的就是要分清查詢目標(biāo)與查詢

條件, 一般的查詢句有以下形式[4~6]:

(查詢句) ::=〈(查詢實(shí)體〉||〈條件信息〉||〈目標(biāo)信息〉

) 3||〈干擾噪音〉

(查詢實(shí)體) ::=〈實(shí)體名〉或間接〈實(shí)體名〉

(條件信息) ::=[(域名) 十][(關(guān)系符) 十]域值[十環(huán)境詞]

(目標(biāo)信息) ::=〈域名〉或間接〈域名〉(關(guān)系符) ::={=, ≠, ≤, ≥, <, >, ∈}

說明:(1) 查詢句可由若干個條件信息或目標(biāo)信息組成, 其中可能有若干干擾噪聲。

(2) 條件信息中域名和操作符有時(shí)可以缺省, 這主要因?yàn)橛蛑当旧硎翘囟ㄓ蛎闹怠?/p>

(3) […]表示其內(nèi)容或者沒有或者一次; (…) 表示其內(nèi)容

) 3表示其內(nèi)容可重復(fù)零次或多次。可一次; (…

定義1 本文中標(biāo)準(zhǔn)概念是指收錄在理解自然語言所使用的各個知識庫中的概念。與它同義的其它詞語稱為非標(biāo)準(zhǔn)概念。

定義2 本文中的復(fù)合概念是指能分解為多個標(biāo)準(zhǔn)概念或分解為一個標(biāo)準(zhǔn)概念與常量的算術(shù)運(yùn)算式的概念。如“中級職稱”“、明年”。

一個復(fù)合概念對應(yīng)多個標(biāo)準(zhǔn)概念, 它是多個標(biāo)準(zhǔn)概念算術(shù)運(yùn)算或邏輯運(yùn)算的結(jié)果; 當(dāng)一個概念解釋為唯一的一個標(biāo)準(zhǔn)概念時(shí)它就是標(biāo)準(zhǔn)概念同義詞了。

1 引言

本文所說的漢語查詢句是指用于數(shù)據(jù)庫自然語言查詢的疑問句和祈使句兩種類型, 疑問句分成特指問句、是非問句、正反問句、選擇問句四類。計(jì)算機(jī)理解漢語查詢句正確的程度是數(shù)據(jù)庫自然語言接口好壞的關(guān)鍵。所謂自然語言接口就是允許人們用某種自然語言的子集在限制領(lǐng)域內(nèi)同計(jì)算機(jī)進(jìn)行通訊。數(shù)據(jù)庫自然語言接口是人工智能與數(shù)據(jù)庫技術(shù)相結(jié)合的產(chǎn)物, 涉及到人工智能、自然語言處理、數(shù)據(jù)庫技術(shù)、人機(jī)接口等方面的研究[2,3]。狹義上的數(shù)據(jù)庫自然語言接口僅僅指數(shù)據(jù)庫自然語言查詢接口。

計(jì)算機(jī)處理漢語自然語言是多學(xué)科的研究工作, 但我國語言學(xué)界多數(shù)著重漢語教學(xué)方面的研究, 并且研究的成果是“給人看”的, 而不是“給計(jì)算機(jī)看”的。成果是“給人看”時(shí), 研究成果很難形式化, 不適合直接用計(jì)算機(jī)處理, 有些成果根本無法形式化, 它們對計(jì)算機(jī)處理用處不大。成果“給計(jì)算機(jī)看”時(shí)是形式化的, 可以用軟件逐步實(shí)現(xiàn)[1]。下文是作者從程序?qū)崿F(xiàn)的角度出發(fā)對漢語數(shù)據(jù)庫查詢句進(jìn)行了深入研究后關(guān)于查詢目標(biāo)部分的結(jié)論。

2 查詢目標(biāo)分類

作為以查詢數(shù)據(jù)庫內(nèi)容為目的的自然查詢語句, 主要包括查詢實(shí)體、查詢條件、查詢目標(biāo)等方面的信息以及語句表達(dá)上需要而與查詢內(nèi)容無關(guān)的干擾噪音。自然查詢語言處理

3) 基金項(xiàng)目:河南省科技攻關(guān)(No. 0424220146) , 河南大學(xué)重點(diǎn)理工科項(xiàng)目(No. 04ZDZR001) 。鄭逢斌 博士, 副教授, 主要研究方向?yàn)樽匀徽Z言理解, 軟件工程。

?9

0?

,

復(fù)合概念的含義在本系統(tǒng)中是固定的, 如果在不同的條件下含義不同屬于邏輯概念。

定義3 本文中的邏輯概念是指在不同的條件下有不同的含義(或值) 的概念。如“:退休年齡”。

在本文中邏輯概念用產(chǎn)生式表示, 存儲分為靜態(tài)存儲和動態(tài)存儲兩種形式, 靜態(tài)存儲可用二維關(guān)系表表示, 動態(tài)存儲用二級鏈表表示。所謂靜態(tài)存儲是指系統(tǒng)處于未運(yùn)行時(shí)的存儲狀態(tài), 動態(tài)存儲是指系統(tǒng)啟動運(yùn)行中的存儲狀態(tài)。系統(tǒng)在啟動時(shí)自動將靜態(tài)存儲狀態(tài)的知識轉(zhuǎn)化為動態(tài)存儲狀態(tài), 系統(tǒng)使用邏輯概念只對處于動態(tài)存儲狀態(tài)的知識進(jìn)行操作。求邏輯概念的值時(shí)要進(jìn)行邏輯推演才可以得知。

概念等價(jià)變換包括概念分解等價(jià)變換和概念合成等價(jià)變換。定義4 概念分解等價(jià)變換是指用復(fù)合概念知識庫將用戶輸入自然語言句子中復(fù)合概念逐步變換為只剩下域名和邏輯概念組成的復(fù)合式的過程。

在復(fù)合直接查詢目標(biāo)轉(zhuǎn)換為簡單直接查詢目標(biāo)、間接邏輯推理目標(biāo)轉(zhuǎn)換為直接邏輯推理目標(biāo)、件處理過程中都涉及概念分解等價(jià)變換定義5 換, 。

定義6 的結(jié)果。

查詢目標(biāo)分為直接查詢目標(biāo)、邏輯推理目標(biāo)、比較判斷目標(biāo)三個階段目標(biāo)。要得到這些目標(biāo)有時(shí)需要對概念進(jìn)行等價(jià)變換和邏輯推理。

定義7 直接查詢目標(biāo)是指通過知識庫的計(jì)算機(jī)操作命令直接對知識庫進(jìn)行操作得到的數(shù)據(jù), 或這些數(shù)據(jù)經(jīng)過概念合成等價(jià)變換的結(jié)果。

直接查詢目標(biāo)分簡單直接查詢目標(biāo)和復(fù)合直接查詢目標(biāo), 簡單直接查詢目標(biāo)是指只包含域名和聚集函數(shù)的目標(biāo); 復(fù)合直接查詢目標(biāo)是指由簡單直接查詢目標(biāo)經(jīng)過概念合成等價(jià)變換的目標(biāo)。

用自然語言描述直接查詢目標(biāo)可以有多種表達(dá)方式, 用戶不僅可以直接指定所要查詢的目標(biāo), 也可以用疑問代詞指代所要查詢的目標(biāo), 另外, 根據(jù)用戶的需求, 在查詢目標(biāo)中還可以出現(xiàn)聚集函數(shù)。據(jù)此, 本文又可以將簡單直接查詢目標(biāo)分為顯性目標(biāo)、疑問目標(biāo)和聚集目標(biāo)三類。

定義8 顯性目標(biāo)是指用域名直接給出的目標(biāo)。定義9 疑問目標(biāo)是指用疑問詞給出的目標(biāo)。定義10 聚集目標(biāo)是指用聚集函數(shù)給出的目標(biāo)。

在表達(dá)上, 當(dāng)將自然查詢語言中的每一個詞轉(zhuǎn)換為知識庫內(nèi)部表示后, 顯性目標(biāo)和疑問目標(biāo)都是與知識庫某些域名相對應(yīng), 而聚集目標(biāo)則與一個聚集函數(shù)(如:COUN T 、SUM 、AV G 、MAX 、MIN ) 相對應(yīng)。

定義11 數(shù)據(jù)提取目標(biāo)是指簡單直接查詢目標(biāo)中能轉(zhuǎn)換為同一個計(jì)算機(jī)命令語句的那些目標(biāo)。計(jì)算機(jī)實(shí)現(xiàn)數(shù)據(jù)提取目標(biāo)的過程稱為數(shù)據(jù)提取過程。

每個數(shù)據(jù)提取目標(biāo)最終轉(zhuǎn)換為一個SQL 語句, 簡單直接查詢目標(biāo)包括一個或多個數(shù)據(jù)提取目標(biāo), 因此簡單直接查詢目標(biāo)應(yīng)轉(zhuǎn)換成一個或多個SQL 語句。這幾個數(shù)據(jù)提取目標(biāo)由數(shù)據(jù)提取過程來實(shí)現(xiàn), 它們是并列的。如:張三與李四誰先退休? 通過一系列變換得到簡單直接查詢目標(biāo)為:張三的出生日期、性別、職業(yè)、職稱和李四的出生日期、性別、職業(yè)、職稱, 它對應(yīng)如下兩個數(shù)據(jù)提取目標(biāo):

數(shù)據(jù)提取目標(biāo)1:張三的出生日期, 性別, 職業(yè), 職稱。數(shù)據(jù)提取目標(biāo)2:李四的出生日期, 性別, 職業(yè), 職稱。定義12 數(shù)據(jù)提取子目標(biāo)是指數(shù)據(jù)提取目標(biāo)中每一個相互獨(dú)立的最小的數(shù)據(jù)目標(biāo); 如“:出生日期”“、性別”。

數(shù)據(jù)提取目標(biāo)=提取子目標(biāo)1 提取子目標(biāo)2 …… 提取子目標(biāo)n (n ≥1) 。數(shù)據(jù)提取目標(biāo)在分解為數(shù)據(jù)提取子目標(biāo)時(shí)有如下幾種情況:

(1) 提取子目標(biāo)1、提取子目標(biāo)2、…、提取子目標(biāo)n 為同一個知識庫的域名。

(2) 提取子目標(biāo)1、提取子目標(biāo)2、…、提取子目標(biāo)n 為多個不同知識庫的域名。

(3) 提取目標(biāo)i (i =1, 2, …, 算術(shù)運(yùn)算符 , —, 3) 。

4) n , 且為集函數(shù)的函數(shù)值。13識庫的產(chǎn)生式結(jié)論中出現(xiàn)的知識目標(biāo)的目標(biāo)。

邏輯推理目標(biāo)分為直接邏輯推理目標(biāo)和間接邏輯推理目標(biāo)。直接邏輯推理目標(biāo)是指知識庫邏輯概念推理知識庫的產(chǎn)生式結(jié)論中出現(xiàn)的知識目標(biāo), 如“張三的退休年齡是多少? ”例句中“退休年齡”; 間接邏輯推理目標(biāo)是指經(jīng)過概念分解等價(jià)變換最終變換為邏輯概念推理知識庫的產(chǎn)生式結(jié)論中出現(xiàn)的知識目標(biāo)的目標(biāo), 如“張三的退休日期是何時(shí)? ”例句中“退休

(退休日期=出生日期 退休年齡) 。日期”

定義14 邏輯推理目標(biāo)化解推演變換是指把直接邏輯推理目標(biāo)經(jīng)過應(yīng)用領(lǐng)域邏輯概念分解知識庫中的產(chǎn)生式逆向(即有結(jié)論到前提) 推理轉(zhuǎn)換為直接查詢目標(biāo)的過程。

定義15 邏輯推理目標(biāo)求值推演變換是指把直接查詢目標(biāo)所得的知識經(jīng)過應(yīng)用領(lǐng)域邏輯概念分解知識庫中的產(chǎn)生式推理轉(zhuǎn)換為直接邏輯推理目標(biāo)的過程。

邏輯推理目標(biāo)的結(jié)果本文用直接邏輯推理目標(biāo)隊(duì)列表示, 間接邏輯推理目標(biāo)到直接邏輯推理目標(biāo)的轉(zhuǎn)換用概念等價(jià)變換鏈表表示。

定義16 比較判斷目標(biāo)是指根據(jù)自然查詢句的要求, 對直接查詢目標(biāo)或邏輯推理目標(biāo)進(jìn)行比較, 根據(jù)比較結(jié)果產(chǎn)生回答的內(nèi)容, 這個結(jié)果就是比較判斷目標(biāo)。

比較的類型要考慮的因素有:句型、比較元素個數(shù)及比較關(guān)系、比較元素值的來源、比較結(jié)果類型等[7,8]。

從句型來看, 特殊問句和祈使句沒有比較判斷目標(biāo); 是非、選擇和正反問句的比較判斷目標(biāo)為直接查詢目標(biāo)或邏輯推理目標(biāo)的比較值。

從比較元素個數(shù)及比較關(guān)系來看又分為:兩個元素比較(比較關(guān)系有:=, ≠, ≤, ≥, <, >, —) ; 多個元素(比較關(guān)系有:MAX,MIN ,ORDER ) ; 一個元素與一個集合比較(比較關(guān)

) 等。系有:∈

從元素值的來源來看又分為:查詢所得數(shù)據(jù)和查詢句原帶數(shù)據(jù)。如:張三是北京人還是上海人? 張三和李四是不是一年出生的?

從比較數(shù)據(jù)的結(jié)果類型來看又分為:邏輯值(真, 假) , 數(shù)據(jù)值。如:張三是南陽人嗎? 張三比李四大多少?

比較結(jié)果用比較判斷目標(biāo)(一對多) 鏈表來表示。

(下轉(zhuǎn)第103頁)    

?9

1?

,

for XML. In :Proceedings of t he 8t h International World Wide Web Conference , May 1999. 77~9156

Bruno N , K oudas N ,Srivastava D. Holistic Twig Joins :Optimal XML Pattern Matching. In :ACM SIGMOD , J une 2002Wang H X , Park S , Fan W , et al. ViST :A Dynamic Index Met hod for Querying XML Data by Tree Structures. In :ACM SIGMOD ,J une 200378

McCreight E M. A space 2economical suffix tree construction algo 2rit hm. Journal of t he ACM , 1976,23(2) :262~272

Shasha D , Wang J T L , G iugno R. Algorit hmics and Applications of Tree and Graph Searching. In :ACMSymposium on Principles

9

of Database Systems (PODS ) , May 2002. 39~52

van Leeuwen J. Algorit hms for finding patterns in strings. In :Handbook of Theoretical Computer Science. Vol A , Algorit hms and complexity. Chapter 5. Elsevier , Amsterdam , 1990. 255~30010Sleepycat Software. http ://www. sleepycat. com. The Berkeley

Database (Berkeley DB )

11Ley M. DBL P database web site. http ://www. informatik. uni 2

t rier. de/ley/db , 2004

12XMAR K:The XML 2benchmark project. http ://monetdb. cwi.

nl/xml , 2004

(上接第91頁) 回答用戶目標(biāo)用回答用戶目標(biāo)隊(duì)列來表示。

  定義17 回答用戶目標(biāo)是指自然查詢句要求系統(tǒng)回答的內(nèi)容。回答用戶目標(biāo)可能是比較判斷目標(biāo), 也可能是邏輯推理目標(biāo)或者直接查詢目標(biāo)。

3 

查詢目標(biāo)關(guān)系

圖1 查詢目標(biāo)關(guān)系圖

  查詢目標(biāo)中各階段目標(biāo)的關(guān)系如圖1所示。在實(shí)際中,

許多查詢句的查詢目標(biāo)只包括三個階段中的部分階段, 分如下幾種情況:

(1) 當(dāng)回答用戶目標(biāo)=直接查詢目標(biāo)時(shí), 直接查詢目標(biāo)的內(nèi)容就是回答用戶目標(biāo)的值。如:請說出張三的籍貫(祈使句) , 哪里是張三的老家? (特殊疑問句) 。

(2) 當(dāng)回答用戶目標(biāo)=邏輯推理目標(biāo)時(shí), 邏輯推理目標(biāo)的內(nèi)容就是回答用戶目標(biāo)的值。如:請說出張三的退休日期(祈使句) , 張三哪年退休? (特殊疑問句) 。邏輯概念“退休日期”的值就是回答用戶目標(biāo)的值。

(3) 當(dāng)回答用戶目標(biāo)=判斷比較目、只有一個比較者和一個被比較者(是非問句或正反問句) 、比較者是直接查詢目標(biāo)或邏輯推理目標(biāo)、被比較者為常量或直接查詢目標(biāo)或邏輯推理目標(biāo)時(shí), 則回答用戶目標(biāo)的值是二者比較結(jié)果的邏輯值。如:張三是副教授嗎? 張三與李四的職稱一樣嗎? 張三與李四的退休年齡一樣嗎?

(4) 當(dāng)回答用戶目標(biāo)=判斷比較目、只有一個比較者和多個被比較者(選擇問句) 、比較者是直接查詢目標(biāo)或邏輯推理目標(biāo)、被比較者均為常量時(shí), 則回答用戶目標(biāo)的值是比較結(jié)果為真的對應(yīng)的被比較者。如:張三是講師還是副教授?

(5) 當(dāng)回答用戶目標(biāo)=判斷比較目、只有一個比較者和多個被比較者(選擇問句) 、比較者是直接查詢目標(biāo)或邏輯推理目標(biāo)、被比較者均為直接查詢目標(biāo)或邏輯推理目標(biāo)時(shí), 則回答用戶目標(biāo)的值是比較結(jié)果為真的對應(yīng)的被比較者概念對應(yīng)的

查詢條件塊。如:張三的職稱是與李四一樣還是與王五一樣?

結(jié)論 本文深入研究了漢語查詢句中查詢目標(biāo)信息, 用祈使句或特殊疑問句查詢時(shí), 回答用戶目標(biāo)一般等于直接查詢目標(biāo)或邏輯推理目標(biāo); 用是非問句、正反問句、選擇問句等方式查詢時(shí), 回答用戶目標(biāo)一般等于判斷比較目標(biāo)。這些信息作者都設(shè)計(jì)了存儲表示結(jié)構(gòu), 可已用計(jì)算機(jī)軟件來識別和轉(zhuǎn)換, 識別和轉(zhuǎn)換的算法將于另文討論。

參考文獻(xiàn)

12345678

鄭逢斌. 計(jì)算機(jī)理解自然查詢語言的研究與實(shí)現(xiàn)[D ]:[西南交通大學(xué)博士研究生學(xué)位論文].2004

孟小峰, 王珊. 中文數(shù)據(jù)庫自然語言查詢系統(tǒng)Nchiql 設(shè)計(jì)與實(shí)現(xiàn)

[J].計(jì)算機(jī)研究與發(fā)展,2001,38(9) :1080~1086

王英姿, 宗成慶, 陳肇雄, 黃河燕. ITS 系統(tǒng)中自然語言人機(jī)接口的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)研究與發(fā)展,1998,35(9) :814~818許龍飛, 楊曉昀, 唐世渭. 基于受限漢語的數(shù)據(jù)庫自然語言接口技術(shù)研究[J].軟件學(xué)報(bào),2002,13(4) :537~544

許龍飛, 唐世渭. 數(shù)據(jù)庫漢語自然語言查詢模型研究[J].計(jì)算機(jī)科學(xué),1999,26(8) :43~46

許龍飛1數(shù)據(jù)庫自然語言查詢技術(shù)研究[J].計(jì)算機(jī)科學(xué),1997,

24(5) :50~54

卞世力, 姚天順, 金鴻1一個中間語言生成目標(biāo)語言的原理和方法[J].軟件學(xué)報(bào),1994,5(9) :1~8

李保利, 周錫令1數(shù)據(jù)庫自然語言接口系統(tǒng)的研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,1999(12) :31~34

?1

03?

標(biāo)簽: