成人AV在线无码|婷婷五月激情色,|伊人加勒比二三四区|国产一区激情都市|亚洲AV无码电影|日av韩av无码|天堂在线亚洲Av|无码一区二区影院|成人无码毛片AV|超碰在线看中文字幕

近年來(lái)國(guó)外信息檢索技術(shù)應(yīng)用案例進(jìn)展研究

技術(shù)導(dǎo)航[文章編號(hào)]  1004-325X(2008)03-0091-05近年來(lái)國(guó)外信息檢索技術(shù)應(yīng)用案例進(jìn)展研究Research?。铮睢。茫幔螅澹蟆。铮妗。桑睿妫铮颍恚幔簦椋铮睢。遥澹簦颍椋澹觯幔臁。?/p>

技術(shù)導(dǎo)航

[文章編號(hào)] ?。保埃埃矗常玻担兀ǎ玻埃埃福埃常埃埃梗保埃?/p>

近年來(lái)國(guó)外信息檢索技術(shù)應(yīng)用案例進(jìn)展研究

Research?。铮睢。茫幔螅澹蟆。铮妗。桑睿妫铮颍恚幔簦椋铮睢。遥澹簦颍椋澹觯幔臁。裕澹悖瑁睿椋瘢酰澹蟆。幔簟。粒猓颍铮幔?/p>

姜曉曦(中國(guó)科學(xué)院研究生院  國(guó)家科學(xué)圖書館  北京?。保埃埃保梗埃?/p>

[摘    要]    元搜索、語(yǔ)義檢索、圖像檢索、日志檢索、代理檢索等新的檢索技術(shù)的出現(xiàn)越來(lái)越符合現(xiàn)代人們對(duì)檢索信息的要求。每個(gè)檢索技術(shù)各有其優(yōu)勢(shì)和劣勢(shì)。這些檢索技術(shù)在實(shí)踐中的應(yīng)用與實(shí)驗(yàn)更加證明了它們的高效性和實(shí)用性,國(guó)外有關(guān)機(jī)構(gòu)應(yīng)用案例的試驗(yàn)效果,為我國(guó)有關(guān)機(jī)構(gòu)更好地利用信息檢索技術(shù)提供了借鑒。[關(guān)鍵詞]     信息檢索    檢索技術(shù)    案例[中圖分類號(hào)]  G252.7          ?。畚墨I(xiàn)標(biāo)識(shí)碼]  ?。?/p>

[Abstract]  The?。澹恚澹颍纾澹睿悖濉。铮妗。螅澹觯澹颍幔臁。睿澹鳌。椋睿妫铮颍恚幔簦椋铮睢。颍澹簦颍椋澹觯幔臁。簦澹悖瑁睿椋瘢酰澹蟆。纾颍幔洌酰幔欤欤。恚澹澹簦蟆。簦瑁濉。颍澹瘢酰椋颍澹恚澹睿簦螅铮妗。穑澹铮穑欤濉。簦铩。颍澹簦颍椋澹觯濉。椋睿妫铮颍恚幔簦椋铮睿。裕瑁澹螅濉。睿澹鳌。椋睿妫铮颍恚幔簦椋铮睢。颍澹簦颍椋澹觯幔臁。簦澹悖瑁睿椋瘢酰澹蟆。椋睿悖欤酰洌濉。恚澹簦幔螅澹幔颍悖?, semanticretrieval,?。椋恚幔纾濉。颍澹簦颍椋澹觯幔欤。欤铮纭。颍澹簦颍椋澹觯幔臁。幔睿洹。幔纾澹睿簟。颍澹簦颍椋澹觯幔欤。牛幔悖琛。瑁幔蟆。椋簦蟆。幔洌觯幔睿簦幔纾澹蟆。幔睿洹。洌椋螅幔洌觯幔睿簦幔纾澹螅裕瑁濉。穑颍幔悖簦椋悖幔臁。幔穑穑欤椋悖幔簦椋铮睢。幔睿洹。澹穑澹颍椋澹睿悖濉。铮妗。簦瑁澹螅濉。簦澹悖瑁睿椋瘢酰澹蟆。洌澹妫椋睿椋簦澹欤。穑颍铮觯濉。簦瑁澹椋颉。澹妫妫澹悖簦椋觯澹睿澹螅蟆。幔睿洌穑颍幔悖簦椋悖幔欤椋簦。裕瑁濉。澹妫妫澹悖簟。铮妗。帷。妫澹鳌。悖铮颍颍澹欤幔簦椋觯濉。妫铮颍澹椋纾睢。铮颍纾幔睿椋幔簦椋铮睿蟆。幔穑穑欤椋睿纭。椋睿妫铮颍恚幔簦椋铮睢。颍澹簦颍椋澹觯幔臁。簦澹悖瑁睿椋瘢酰澹螅穑颍铮觯椋洌澹蟆。颍澹妫澹颍澹睿悖澹蟆。妫铮颉。洌铮恚澹螅簦椋恪。悖铮颍颍澹欤幔簦椋觯濉。椋睿螅簦椋簦酰簦椋铮睢。簦铩。酰螅濉。桑摇。簦澹悖瑁睿椋瘢酰澹蟆。鳎澹欤欤郏耍澹。鳎铮颍洌螅荨 。桑睿妫铮颍恚幔簦椋铮睢。颍澹簦颍椋澹觯幔?;?。遥澹簦颍椋澹觯幔臁。簦澹悖瑁睿椋瘢酰?;?。茫幔螅澹?/p>

        國(guó)外學(xué)界的專家們?yōu)榱顺浞掷枚鄻拥男畔①Y源,幫助用戶從海量信息里找到符合要求的資源,對(duì)信息檢索技術(shù)展開(kāi)了研究,語(yǔ)義檢索、視頻檢索、圖像檢索等新的檢索技術(shù)的出現(xiàn)越來(lái)越符合現(xiàn)代人們對(duì)檢索信息的要求,同時(shí)這些檢索技術(shù)在實(shí)踐中的應(yīng)用與實(shí)驗(yàn)更加證明了它們的高效性和實(shí)用性。

1    元搜索信息檢索技術(shù)

        元搜索指的是這類檢索技術(shù)將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排查、重新排序等處理后,作為自己的結(jié)果返回給用戶,服務(wù)方式是面向網(wǎng)頁(yè)的全文檢索。Innovative?。桑睿簦澹颍妫幔悖澹螅А。停澹簦幔疲椋睿洹【褪抢?/p>

[31]Johnson CA.?。樱铮悖椋幔臁。茫幔穑椋簦幔臁。幔睿洹。簦瑁濉。樱澹幔颍悖琛。妫铮颉。桑睿妫铮颍恚幔簦椋铮睿骸。牛幔恚椋睿椋睿?/p>

the?。遥铮欤濉。铮妗。樱铮悖椋幔臁。茫幔穑椋簦幔臁。椋睢。桑睿妫铮颍恚幔簦椋铮睢。樱澹澹耄椋睿纭。拢澹瑁幔觯椋铮颉。椋睢。停铮睿纾铮欤椋幔郏剩荩剩铮酰颍睿幔臁。铮妗。簦瑁濉。粒恚澹颍椋悖幔睢。樱铮悖椋澹簦。妫铮颉。桑睿妫铮颍恚幔簦椋铮睢。樱悖椋澹睿悖濉。幔睿洌裕澹悖瑁睿铮欤铮纾。玻埃埃罚ǎ叮海福福常福梗矗?/p>

[32]Spink?。?, Park?。?,?。耍铮螅瑁恚幔睢。樱。疲幔悖簦铮颍蟆。粒妫妫澹悖簦椋睿纭。粒螅螅椋纾睿澹洹。桑睿妫铮颍恚幔簦椋铮?/p>

Problem?。希颍洌澹颍椋睿纭。洌酰颍椋睿纭。祝澹狻。樱澹幔颍悖瑁骸。粒睢。牛穑欤铮颍幔簦铮颍。樱簦酰洌郏剩荩桑睿妫铮颍恚幔簦椋铮睢。校颍铮悖澹螅螅椋睿纭。幔睿洹。停幔睿幔纾澹恚澹睿?,?。玻埃埃叮ǎ担海保常叮叮保常罚福郏常常荩耍幔欤猓幔悖琛。剩 埃桑В怼。妫澹澹欤椋睿纭。欤酰悖耄保骸。裕瑁濉。遥铮欤濉。铮妗。牛恚铮簦椋铮睿蟆。椋睢。樱澹澹耄椋睿?/p>

Information on?。簦瑁濉。祝澹猓郏剩荩剩铮酰颍睿幔臁。铮妗。簦瑁濉。粒恚澹颍椋悖幔睢。樱铮悖椋澹簦。妫铮颍桑睿妫铮颍恚幔簦椋铮睢。樱悖椋澹睿悖濉。幔睿洹。裕澹悖瑁睿铮欤铮纾。玻埃埃叮ǎ叮海福保常福保福?/p>

[34]Laurie?。龋?, Friedman?。模拢。茫澹欤澹螅簦椋睿濉。粒。牛觯幔欤酰幔簦椋铮睢。铮妗。帷。校酰猓欤椋恪。蹋椋猓颍幔颍?/p>

Workshop: Teaching?。希欤洌澹颉。粒洌酰欤簦蟆。龋铮鳌。簦铩。樱澹幔颍悖琛。簦瑁濉。桑睿簦澹颍睿澹簟。妫铮颍遥澹欤椋幔猓欤濉。茫幔睿悖澹颉。桑睿妫铮颍恚幔簦椋铮睿郏剩荩剩铮酰颍睿幔臁。铮妗。茫铮睿螅酰恚澹颉。龋澹幔欤簦琛。铮睢。簦瑁澹桑睿簦澹颍睿澹?,?。玻埃埃叮ǎ常海玻梗矗常?/p>

[35]Agichtein?。?,?。拢颍椋欤臁。?,?。模酰恚幔椋蟆。樱桑恚穑颍铮觯椋睿纭。祝澹狻。樱澹幔颍悖琛。遥幔睿耄椋睿纭。猓?/p>

Incorporating?。眨螅澹颉。拢澹瑁幔觯椋铮颉。桑睿妫铮颍恚幔簦椋铮睿郏剩荩樱桑牵桑摇。疲铮颍酰怼。玻埃埃叮校颍铮悖澹澹洌椋睿纾?,?。玻埃埃叮ǎ常梗海保梗玻叮?/p>

[36]Nicholas D,?。龋酰睿簦椋睿纾簦铮睢。?,?。剩幔恚幔欤椤。龋?, etc.?。裕瑁濉。桑睿妫铮颍恚幔簦椋铮睢。樱澹澹耄椋睿?/p>

Behaviour of?。簦瑁濉。眨螅澹颍蟆。铮妗。模椋纾椋簦幔臁。樱悖瑁铮欤幔颍欤。剩铮酰颍睿幔欤螅郏剩荩桑睿妫铮颍恚幔簦椋铮睿校颍铮悖澹螅螅椋睿纭。幔睿洹。停幔睿幔纾澹恚澹睿?,?。玻埃埃叮ǎ担海保常矗担保常叮担?/p>

[37]Rutten?。蹋剩疲。樱瘢酰椋澹颍蟆。蹋。龋澹螅螅濉。拢。茫幔睿悖澹颍遥澹欤幔簦澹洹。桑睿妫铮颍恚幔簦椋铮睢。樱澹澹耄椋睿纾?/p>

Hints?。妫颍铮怼。簦瑁濉。玻埃埃场。龋澹幔欤簦琛。桑睿妫铮颍恚幔簦椋铮睢。危幔簦椋铮睿幔臁。裕颍澹睿洌蟆。樱酰颍觯澹ǎ龋桑危裕樱郏剩荩。剩铮酰颍睿幔臁。铮妗。龋澹幔欤簦琛。茫铮恚恚酰睿椋悖幔簦椋铮睿。玻埃埃叮ǎ常海保矗罚保担叮郏常福荩蹋澹鳎椋蟆。裕。樱澹澹耄椋睿纭。龋澹幔欤簦琛。桑睿妫铮颍恚幔簦椋铮睢。铮睢。簦瑁濉。桑睿簦澹颍睿澹簦骸。蹋椋妫澹螅簦欤濉。茫瑁铮椋悖?/p>

or?。拢幔洹。粒簦簦幔悖搿。铮妗。茫猓澹颍悖瑁铮睿洌颍椋??[J].Media,?。茫酰欤簦酰颍濉。幔睿洹。樱铮悖椋澹簦。玻埃埃叮ǎ矗海担玻保担常梗?/p>

[39

]Toms,?。牛欤幔椋睿濉。牵龋铮鳌。茫铮睿螅酰恚澹颍蟆。樱澹幔颍悖琛。妫铮颉。龋澹幔欤簦琛。桑睿妫铮颍恚幔簦椋铮睿郏剩荩?/p>

Health?。桑睿妫铮颍恚幔簦椋悖蟆。剩铮酰颍睿幔欤。玻埃埃罚ǎ常海玻玻常玻常担?/p>

[作者簡(jiǎn)介]

黃飛燕  女,1984年生,中國(guó)科學(xué)院國(guó)家科學(xué)圖書館碩士研究生,發(fā)表論文6篇。

徐  靜  女,1986年生,北京大學(xué)信息管理系碩士研究生。                      ?。凼崭迦掌冢海玻埃埃福埃玻玻玻?/p>

?91?

,

用這種搜索原理的產(chǎn)品之一,它可以幫助用戶找到對(duì)其有用但是還沒(méi)被注意到的資源。密西西比大學(xué)圖書館目前購(gòu)買了這個(gè)元搜索產(chǎn)品,并與該圖書館的頁(yè)面相結(jié)合,目的是為用戶提供更好的信息檢索服務(wù)[1]。

2    語(yǔ)義信息檢索技術(shù)

        完全基于造句法內(nèi)容建立的信息檢索系統(tǒng)具有很大的局限性,這種檢索技術(shù)應(yīng)用的挑戰(zhàn)之一就是開(kāi)發(fā)高質(zhì)量、高精確度的系統(tǒng)。為了實(shí)現(xiàn)這一目標(biāo),引用自然語(yǔ)言處理(Natural?。蹋幔睿纾酰纾濉。校颍铮悖澹螅螅椋睿?, NLP)技術(shù)在這類系統(tǒng)中是十分必要的。這種技術(shù)可以為信息檢索系統(tǒng)提供語(yǔ)義信息,在不同的NLP技術(shù)中語(yǔ)義信息描述的方法以及語(yǔ)義標(biāo)簽已經(jīng)受到學(xué)者的重視,并被研究者們逐步開(kāi)發(fā)和試驗(yàn)。

1.1    搜索

        密西西比大學(xué)圖書館采用主題和全文可用性兩種方法組織其電子資源,最常用的是“全文”類。該類別是由圖書館包含的全文資源的百分比定義的,如果該圖書館某類資源包含50%以上的全文,它就包含在“全文”這一類別中。這樣做雖然使得用戶檢索的資源不都是全文,但是至少保證了絕大部分是全文。其余的種類包括便覽、圖書館目錄、數(shù)字資源、公眾可獲得的數(shù)據(jù)庫(kù)和廣泛的主題類等。其中基于主題類搜索的元搜索工具預(yù)先自動(dòng)設(shè)定了每個(gè)主題大類的幾個(gè)核心數(shù)據(jù)庫(kù)作為默認(rèn)選項(xiàng),即使用戶不了解該主題領(lǐng)域也能搜索到相關(guān)的文獻(xiàn),如果用戶是該領(lǐng)域的專家則可以通過(guò)自己添加來(lái)擴(kuò)大檢索數(shù)據(jù)庫(kù)的數(shù)量。

2.1    語(yǔ)義元素在ESCRIRE工程中的應(yīng)用

        ESCRIRE(Embedded Structured?。悖铮睿簦澹睿簟。遥澹穑颍澹螅澹睿簦幔簦椋铮睿桑睢。遥澹穑铮螅椋簦铮颍椋澹?, 機(jī)構(gòu)庫(kù)中的嵌入式結(jié)構(gòu)內(nèi)容揭示)工程第1個(gè)目的是比較3種知識(shí)表示法的形式:概念圖表、描述邏輯和以目標(biāo)為導(dǎo)向的表示語(yǔ)言;第2個(gè)目的是為文檔檢索表達(dá)和處理文本內(nèi)容。學(xué)者R.Carolina?。停澹洌椋睿幔遥幔恚椋颍x擇了PubMed數(shù)據(jù)庫(kù)中4?。担埃捌嘘P(guān)生物文章的摘要,在ESCRIRE中進(jìn)行了試驗(yàn),ESCRIRE提出的響應(yīng)形式是簡(jiǎn)單的,它包含一個(gè)由相關(guān)文獻(xiàn)和提交的查詢組成的列表,Medina和他的研究隊(duì)伍在此基礎(chǔ)上提出了豐富該響應(yīng)形式的方法[2]?!∷麄兝帽倔w和資源描述豐富了提交給用戶的回答,通過(guò)Corese語(yǔ)義搜索引擎將查詢中使用的自然語(yǔ)言轉(zhuǎn)化成ESCRIRE語(yǔ)言,很容易地獲取有注釋的信息。其中包括由Corese語(yǔ)義搜索引擎檢索到的文章的摘要組成的超文檔,以及這個(gè)文檔也鏈接到的其他的文檔:PubMed中的原始文檔、制定的查詢和交互信息等,作者名、期刊、出版日期等同樣也包含在這個(gè)超文檔中,目的是給用戶提供額外的信息。

        這項(xiàng)試驗(yàn)使用了私人擁有的知識(shí)描述語(yǔ)言(ESCRIRE語(yǔ)言)來(lái)描繪域本體和注釋,在利用資源描述框架(ResourceDescriptiion?。疲颍幔恚澹鳎铮?,?。遥模疲┻^(guò)程中研究人員發(fā)現(xiàn)了一些轉(zhuǎn)換問(wèn)題,在語(yǔ)義網(wǎng)絡(luò)內(nèi)容檢索中,像RDF和OWL(WebOntology Language, 語(yǔ)義網(wǎng)本語(yǔ)言)這類的語(yǔ)言是被推薦的,利用這種語(yǔ)言可以模仿和共享特殊用戶團(tuán)體的知識(shí)。試驗(yàn)結(jié)論是私人擁有的語(yǔ)言是不被推薦使用的,因?yàn)樗鼈兣c語(yǔ)義網(wǎng)的結(jié)構(gòu)不協(xié)調(diào)。

1.2    響應(yīng)時(shí)間

        元搜索工具所有問(wèn)題之中最具有挑戰(zhàn)性的要數(shù)響應(yīng)時(shí)間了。一般來(lái)說(shuō)響應(yīng)時(shí)間受到圖書館網(wǎng)絡(luò)、校園網(wǎng)絡(luò)、校園外的網(wǎng)絡(luò)供應(yīng)者等因素的影響,如果將用戶搜索的資源所在的網(wǎng)絡(luò)和認(rèn)證的變量也算在內(nèi),響應(yīng)時(shí)間的問(wèn)題就更加難以控制了。密西西比大學(xué)圖書館購(gòu)買的是 InnovativesWeb?。粒悖悖澹螅蟆。停幔睿幔纾澹恚澹睿簟。停铮洌酰欤濉。ǎ祝粒停┑恼J(rèn)證系統(tǒng),該模型是基于EZ代理服務(wù)器(ezproxy)的。需要發(fā)現(xiàn)并解決的問(wèn)題包括追捕到棘手的轉(zhuǎn)換裝置、防火墻裝置、校園域名服務(wù)器(Domain?。危幔恚濉。樱澹颍觯澹颍?jiǎn)稱DNS)以及賣主的DNS等。MetaSearch?。ㄔ阉鳎┕ぞ咴诖矸?wù)器上放置了一個(gè)重要的載荷增長(zhǎng),通過(guò)統(tǒng)計(jì)數(shù)字得出,24%的代理服務(wù)器頁(yè)面請(qǐng)求來(lái)自MetaSearch產(chǎn)品。盡管取得了一定的進(jìn)展,但是響應(yīng)時(shí)間問(wèn)題仍然是元搜索最難克服的障礙,一個(gè)MetaSearch統(tǒng)計(jì)模塊應(yīng)該帶有使用數(shù)據(jù)和響應(yīng)時(shí)間的信息,響應(yīng)時(shí)間的信息對(duì)發(fā)現(xiàn)并修理故障和電子資源賣主是非常有用的。

1.3     結(jié)果相關(guān)性

        相關(guān)性的問(wèn)題是MetaSearch的熱點(diǎn)話題,把增加相關(guān)性計(jì)算作為一個(gè)檢索步驟意味著所有的結(jié)果都要返回、排列并且顯示出來(lái)。該圖書館使用的增加相關(guān)性的辦法是將默認(rèn)索引從關(guān)鍵字改稱題名關(guān)鍵字,對(duì)于用戶來(lái)說(shuō)恢復(fù)題名中的關(guān)鍵字使得檢索結(jié)果更加相關(guān),但是使用題名關(guān)鍵字需要注意的是: 這里有許多資源不支持題名關(guān)鍵字檢索。對(duì)于其他資源來(lái)說(shuō),題名關(guān)鍵字不是合適的索引。在這種情況下,檢索就會(huì)失敗并且注明索引是不被支持的。為了調(diào)解這種情況,有些資源就要從基本關(guān)鍵字檢索映射到題名關(guān)鍵字檢索,盡管這樣會(huì)降低相關(guān)性,但是可以避免錯(cuò)誤的出現(xiàn),同時(shí)允許結(jié)果被重新獲得。

2.2    語(yǔ)義角色標(biāo)簽(Semantic?。遥铮欤濉。蹋幔猓澹欤椋睿纭?,?。樱遥蹋?/p>

        語(yǔ)義角色是指一個(gè)造句法成分和一個(gè)謂語(yǔ)之間的關(guān)系。目前很多實(shí)踐都試圖將語(yǔ)義角色標(biāo)簽應(yīng)用到信息檢索系統(tǒng)中,但是都失敗了。西班牙阿利坎特大學(xué)的教授們進(jìn)行了一個(gè)試驗(yàn),將語(yǔ)義角色標(biāo)簽引進(jìn)到信息檢索系統(tǒng)中,對(duì)系統(tǒng)進(jìn)行了拓展,這個(gè)試驗(yàn)通過(guò)減少檢索出的不相關(guān)文獻(xiàn)的數(shù)量來(lái)提高檢索性能[3]。在語(yǔ)義角色注釋過(guò)程中,他們采用了兩種方法:最大熵和TiMBL法。最大熵模型提供了一個(gè)框架來(lái)對(duì)許多不同信息源的信息進(jìn)行集成分類,該試驗(yàn)采用的是最大熵條件概率模型;TiMBL是一個(gè)程序,該程序是用來(lái)執(zhí)行基于存儲(chǔ)器的知識(shí)運(yùn)算法則的。所有執(zhí)行的

?92?

,

運(yùn)算法則有共同點(diǎn),就是它們?cè)诖鎯?chǔ)器中明確地存儲(chǔ)了一些訓(xùn)練集的表示法,在試驗(yàn)過(guò)程中新的案例是根據(jù)存儲(chǔ)的案例中最相似的進(jìn)行推斷來(lái)分類的。該小組在進(jìn)行試驗(yàn)時(shí)使用了SemBol方法,該方法共分為3個(gè)步驟:首先將句子中動(dòng)詞的意義消除歧義;其次在識(shí)別階段,關(guān)于消除歧義動(dòng)詞的論據(jù)分界必須確定;最后在標(biāo)簽階段,充當(dāng)這些論據(jù)的角色必須被消除歧義。根據(jù)這個(gè)SemBol方法,實(shí)驗(yàn)小組提出了一個(gè)擴(kuò)展的信息檢索系統(tǒng),其結(jié)構(gòu)如圖1所示。圖1    利用SemBol方法擴(kuò)展的信息檢索系統(tǒng)框架[3]

局限性,例如查詢的種類受限制、查詢的性能比較低。為了解決這類問(wèn)題,基于內(nèi)容的圖像檢索是目前學(xué)者們積極追求的檢索技術(shù)。

        基于內(nèi)容的圖像檢索(Content-based?。桑恚幔纾濉。遥澹簦颍椋澹觯幔欤┎捎玫蛯哟蔚膱D像特征如顏色、形狀和結(jié)構(gòu)等來(lái)檢索。目前為止,基于顏色的圖像檢索技術(shù)仍然很流行,并在很多CBIR檢索應(yīng)用中被采用。它由于本身的易于應(yīng)用和有效性以及顏色元素在圖像中容易記住等優(yōu)勢(shì),比基于形狀和結(jié)構(gòu)的圖像檢索應(yīng)用得廣泛。但是澳大利亞Monash大學(xué)信息技術(shù)學(xué)院的兩位學(xué)者經(jīng)過(guò)調(diào)查研究發(fā)現(xiàn),基于顏色的圖像檢索也存在著一定的局限性,因此他們提出了基于向量量化(VQ?。郑澹悖簦铮颉。眩酰幔睿簦椋帷。簦椋铮睿┑膱D像檢索[4]。他們認(rèn)為VQ是圖像檢索的一種有效的方式,因?yàn)閺模郑训脕?lái)的壓縮數(shù)據(jù)能夠直接映射到像素模式,這就意味著基于圖像VQ壓縮數(shù)據(jù)可以捕獲圖像的語(yǔ)義和特征。該檢索技術(shù)首先將圖像分成固定大小的像素塊——向量,對(duì)于每個(gè)向量編碼本都會(huì)搜索到一個(gè)最匹配的代碼,同時(shí)登陸的索引號(hào)就會(huì)代替向量進(jìn)行轉(zhuǎn)移或存儲(chǔ),索引號(hào)的序列就是被壓縮的比特流;其次,編碼本和比特流被傳送到解碼器進(jìn)行解碼,解碼后的向量是一個(gè)初始向量的近似值;最后會(huì)得到一個(gè)高度壓縮的比率。在VQ壓縮后,每個(gè)像素塊都用一個(gè)編碼索引號(hào)表示,學(xué)者們就可以根據(jù)這些索引號(hào)來(lái)抽取圖像特征,完成圖像標(biāo)引和檢索。兩位研究者利用這一原理對(duì)VQ圖像檢索進(jìn)行了試驗(yàn),試驗(yàn)結(jié)果表明,VQ圖像檢索技術(shù)可以在圖像標(biāo)引中捕獲像素的空間信息,提高了圖像檢索的效率。此外,研究者將該檢索方法與現(xiàn)有的基于顏色的檢索技術(shù)進(jìn)行了比較分析,結(jié)果顯示,VQ圖像檢索技術(shù)比現(xiàn)存3種方法的檢索性能要略勝一籌。

  這個(gè)信息檢索系統(tǒng)包括4個(gè)模塊:IR模塊、問(wèn)題處理模塊、句子處理模塊和語(yǔ)義模塊。當(dāng)一個(gè)完整的句子查詢輸入系統(tǒng)中時(shí),該句子被看成是一個(gè)事件,IR系統(tǒng)就是將與事件有關(guān)的文本的片段定位在查詢里,查詢結(jié)束后,IR模塊在系統(tǒng)中檢索出了一個(gè)段落或文獻(xiàn)集,將該集中的動(dòng)詞和句子中的動(dòng)詞相比較,并將與該動(dòng)詞有關(guān)的句子列成表;隨后,選出來(lái)的句子通過(guò)SemBol方法被標(biāo)注為語(yǔ)義角色,試驗(yàn)的最后一個(gè)關(guān)系集被應(yīng)用了,該關(guān)系集是建立在句號(hào)和語(yǔ)義角色之間的。只有包含正確語(yǔ)義角色的句子才被選取,也就是說(shuō)檢索到的文章數(shù)將減少,這樣檢索準(zhǔn)確性就得到了提高。

4    查詢?nèi)罩緳z索技術(shù)

        傳統(tǒng)的信息檢索系統(tǒng)利用文集、文件以及查詢統(tǒng)計(jì)來(lái)確定比較符合用戶問(wèn)題的答案,但是這種查詢可以在查詢?nèi)罩局胁东@,提供額外的相關(guān)資料來(lái)源。近幾年,專家們把相當(dāng)多的目光投向了對(duì)查詢?nèi)罩竞腿藗儽磉_(dá)信息需求方式的研究上,開(kāi)發(fā)出了許多商業(yè)搜索引擎的查詢?nèi)罩救纾牛悖椋簦宓龋硗獠樵內(nèi)罩驹谛畔z索領(lǐng)域如查詢拓展、文本檢索和圖像檢索中也得到了應(yīng)用。

4.1    利用查詢?nèi)罩窘ⅲ疲粒褭z索系統(tǒng)

        為了提高檢索性能,先前的FAQ檢索系統(tǒng)利用了高水平的知識(shí)基準(zhǔn)和手工控制,但是當(dāng)應(yīng)用領(lǐng)域有所變化時(shí),構(gòu)建這樣的知識(shí)基準(zhǔn)和規(guī)則是一項(xiàng)費(fèi)時(shí)費(fèi)力的工作。為了解決這個(gè)問(wèn)題,韓國(guó)的研究人員提出了一個(gè)利用查詢?nèi)罩咀鳛橹R(shí)來(lái)源的高性能FAQ檢索系統(tǒng)[5]。該系統(tǒng)全稱為FaqRetrieval?。粒睿洹。茫欤酰螅簦澹颍椋睿纭。裕澹悖瑁睿椋瘢酰澹ǎ疲遥粒茫裕藘蓚€(gè)子系統(tǒng):一個(gè)查詢?nèi)罩揪垲愊到y(tǒng)和一個(gè)基于聚類的檢索

3    圖像檢索技術(shù)

        為了有效地利用數(shù)字圖書館中存儲(chǔ)的信息,圖像標(biāo)引和檢索技術(shù)是十分重要的。早期的圖像檢索系統(tǒng)使用傳統(tǒng)數(shù)據(jù)庫(kù)管理的方式來(lái)標(biāo)引檢索圖像,以簡(jiǎn)單的性質(zhì)如圖像數(shù)量和文本描述等為檢索基礎(chǔ),這些檢索方式具有一定的

?93?

,

系統(tǒng)。聚類系統(tǒng)定期收集和精煉用戶的查詢?nèi)罩?,然后將每個(gè)FAQ作為獨(dú)立的類別,并通過(guò)語(yǔ)義空間中向量相似度測(cè)量把查詢?nèi)罩痉值礁鱾€(gè)FAQ類別里去。 在分類的基礎(chǔ)上,查詢?nèi)罩揪垲愊到y(tǒng)將查詢?nèi)罩具M(jìn)行聚類并計(jì)算每個(gè)查詢?nèi)罩敬氐馁|(zhì)心。當(dāng)用戶輸入查詢時(shí),基于聚類的檢索系統(tǒng)通過(guò)查詢?nèi)罩敬貋?lái)計(jì)算查詢和FAQ之間的相似性,根據(jù)計(jì)算出的相似性,檢索系統(tǒng)將有關(guān)的FAQ進(jìn)行排列并返回一個(gè)列表。在標(biāo)引的時(shí)候,該系統(tǒng)通過(guò)潛在的語(yǔ)義分析,利用分類技術(shù)有效地聚類用戶查詢?nèi)罩?;在檢索時(shí),該系統(tǒng)利用查詢?nèi)罩敬厥沟茫疲粒巡樵兏禹槙?。研究人員還將這個(gè)系統(tǒng)應(yīng)用到實(shí)際中進(jìn)行了試驗(yàn), 通過(guò)不同的實(shí)驗(yàn),他們發(fā)現(xiàn)該系統(tǒng)可以減少短文章檢索中的詞匯爭(zhēng)論問(wèn)題,在FAQ檢索方面,該系統(tǒng)的性能也優(yōu)于其他傳統(tǒng)信息檢索系統(tǒng),此外,由于僅僅采用數(shù)據(jù)驅(qū)動(dòng)的方法而不用高層次知識(shí)源,該系統(tǒng)要比早先的FAQ檢索系統(tǒng)更加實(shí)際和可靠。

統(tǒng)性能和服務(wù)質(zhì)量。此外,該方法可以利用動(dòng)態(tài)匯聚網(wǎng)絡(luò)環(huán)境, 通過(guò)監(jiān)視和適合變換的網(wǎng)絡(luò)條件來(lái)不斷調(diào)整移動(dòng)代理的路線。利用移動(dòng)代理構(gòu)建的檢索系統(tǒng)結(jié)構(gòu)如圖2。

圖?。病   〈硐到y(tǒng)結(jié)構(gòu)[7]

        該結(jié)構(gòu)由3個(gè)層次構(gòu)成,應(yīng)用層:移動(dòng)代理在該層運(yùn)行,每個(gè)代理被分配了一個(gè)用戶的目標(biāo),并且按照自己的路線在網(wǎng)絡(luò)中移動(dòng);靜態(tài)層:該層可以給移動(dòng)代理提供計(jì)算或數(shù)據(jù)資源來(lái)完成它們的檢索任務(wù);服務(wù)層:該層包括目錄、計(jì)劃、遷移、交流和安全等服務(wù)。

  模擬研究表明,利用運(yùn)算法則的系統(tǒng)能要比利用網(wǎng)絡(luò)中與節(jié)點(diǎn)數(shù)一樣多的代理的系統(tǒng)整體性能好得多。該方法利用動(dòng)態(tài)代理,大大增強(qiáng)了動(dòng)態(tài)會(huì)聚網(wǎng)絡(luò)中分布信息檢索系統(tǒng)的性能,同時(shí)為了更好地適應(yīng)實(shí)際網(wǎng)絡(luò)環(huán)境,研究人員還提供了一個(gè)安全容錯(cuò)機(jī)制。

4.2    分布式信息檢索

        為了改進(jìn)分布式信息檢索系統(tǒng),澳大利亞皇家墨爾本理工在學(xué)(RMIT)的學(xué)者們提出了利用查詢?nèi)罩驹诜植际叫畔z索環(huán)境中建立詞表的最新檢索技術(shù),構(gòu)建了基于查詢?nèi)罩镜膬煞N新的檢索技術(shù)應(yīng)用[6]。 第一種是在不合作的環(huán)境中為分布式資源提供新的取樣方法,該方法利用搜索引擎查詢?nèi)罩局锌捎玫男g(shù)語(yǔ)來(lái)聚焦取樣過(guò)程。實(shí)驗(yàn)證明,這種方法并不比先前的基于查詢的取樣方法耗費(fèi)大,而且生產(chǎn)出的樣本使得檢索更加有效。第二種應(yīng)用是,查詢?nèi)罩究梢杂脕?lái)聚焦面向?qū)τ脩糁匾臈l件的索引修整策略。該索引修剪策略可以保持系統(tǒng)的效力,與全文索引相比,可以減少22%-28%的索引。將該策略應(yīng)用到多種網(wǎng)絡(luò)檢索任務(wù)中,通過(guò)評(píng)估發(fā)現(xiàn),盡管許多主題包含詞表以外的術(shù)語(yǔ),但是修剪過(guò)的索引檢索到的相關(guān)答案與原始索引檢索到的一樣有效。研究者的實(shí)驗(yàn)表明,利用查詢?nèi)罩驹O(shè)計(jì)檢索系統(tǒng)既減少了索引的數(shù)量又沒(méi)有改變檢索的效率, 因此在分布式信息檢索環(huán)境中,利用查詢?nèi)罩臼且粋€(gè)重要的并且有效的機(jī)制。

5.2    奧德賽搜索引擎(Odyssey Search?。牛睿纾椋睿?,?。希樱牛?/p>

        巴西聯(lián)邦大學(xué)的研究人員開(kāi)發(fā)了一個(gè)多代理系統(tǒng)來(lái)進(jìn)行成分信息檢索,該系統(tǒng)被稱為Odyssey?。樱澹幔颍悖琛。牛睿纾椋睿澹ǎ希樱牛郏福?。OSE是一個(gè)提供分布式獲取或存儲(chǔ)域成分信息的搜索和檢索系統(tǒng),利用它可以提高目前成分信息的發(fā)現(xiàn)和檢索。在OSE結(jié)構(gòu)中,通過(guò)過(guò)濾代理層對(duì)與成分有關(guān)的域信息進(jìn)行過(guò)濾,在過(guò)濾層中用戶的喜好、過(guò)去的檢索、導(dǎo)航的路經(jīng)以及常用的關(guān)鍵字都被用來(lái)提高和精確檢索。該過(guò)濾代理主要依靠用戶在域中的喜好和檢索經(jīng)歷提供成分信息的挑選,在導(dǎo)航的過(guò)程中,機(jī)器學(xué)習(xí)技術(shù)被用來(lái)觀察和了解用戶的行為;OSE還有一個(gè)特點(diǎn)就是可以利用調(diào)解層和域本體從一些域中檢索異質(zhì)的分布式信息。調(diào)解層為組織在域本體中的可用成分信息提供了統(tǒng)一的格式,域本體通過(guò)領(lǐng)域語(yǔ)義概念的表述來(lái)搜索可再次利用的成分信息,因此這個(gè)調(diào)解層促進(jìn)了域信息的綜合,提供了通過(guò)本體翻譯成分信息的機(jī)制。實(shí)驗(yàn)證明這個(gè)OSE系統(tǒng)是有效的,目前該系統(tǒng)是第一個(gè)與域模型結(jié)合進(jìn)行成分信息檢索的系統(tǒng)。

5    基于代理的信息檢索技術(shù)5.1    時(shí)控的移動(dòng)代理檢索(TMAP)

        對(duì)于分布式信息檢索中的移動(dòng)代理計(jì)劃來(lái)說(shuō),移動(dòng)代理數(shù)目和總的執(zhí)行時(shí)間是描述上層系統(tǒng)的兩個(gè)因素。 此外,為了提高信息檢索的質(zhì)量,信息倉(cāng)儲(chǔ)節(jié)點(diǎn)的時(shí)間約束也要考慮在內(nèi)。在過(guò)去的研究中,移動(dòng)代理計(jì)劃(Mobile AgentPlanning,?。停粒校┓椒](méi)有考慮到動(dòng)態(tài)匯聚網(wǎng)絡(luò)的條件,如Peer?。簦铩。校澹澹颉。ǎ校簦铮校?duì)等計(jì)算中可變的網(wǎng)絡(luò)帶寬和斷開(kāi),為了更好地進(jìn)行檢索, 對(duì)網(wǎng)絡(luò)條件具有敏感性的移動(dòng)代理亟待開(kāi)發(fā)。韓國(guó)首爾國(guó)立大學(xué)的學(xué)者們提出了一個(gè)新的MAP方法,被稱為Timed Mobile?。粒纾澹睿簟。校欤幔睿睿椋睿纾郏罚?。這種方法試圖減少移動(dòng)代理的數(shù)量和總的執(zhí)行時(shí)間,為的是實(shí)現(xiàn)更好的系

6    多媒體信息檢索技術(shù)6.1    視頻檢索

        與文本、聲音和圖像相比,視頻是一個(gè)承載信息豐富的媒體,現(xiàn)代技術(shù)使得對(duì)視頻的捕獲、壓縮、存儲(chǔ)和轉(zhuǎn)移

?94?

,

變得十分簡(jiǎn)單,導(dǎo)致大量視頻信息的產(chǎn)生,因此如何從大量視頻信息中進(jìn)行檢索越來(lái)越受到研究人員的關(guān)注。都柏林城市大學(xué)的兩位學(xué)者創(chuàng)建了一個(gè)支持多種特征檢索的系統(tǒng),該系統(tǒng)包含通過(guò)口頭對(duì)話的文本檢索、依靠關(guān)鍵幀的圖像匹配和依靠分割視頻對(duì)象的目標(biāo)匹配。其中最后一部分即自動(dòng)分割和追蹤視頻對(duì)象是一個(gè)過(guò)分要求計(jì)算的問(wèn)題,并且對(duì)于普通的視頻資料該問(wèn)題尚未解決[9]?!⊙芯咳藛T通過(guò)在一個(gè)卡通片的封閉域里的實(shí)驗(yàn)完成了目標(biāo)分割,在中等尺寸的視頻資源中進(jìn)行了用戶交互性實(shí)驗(yàn),并且測(cè)量了用戶對(duì)視頻文件的使用情況和在多重反復(fù)搜索中的檢索模式。該實(shí)驗(yàn)的目的是測(cè)量基于目標(biāo)的檢索是否比文本檢索和關(guān)鍵幀匹配更加有用,實(shí)驗(yàn)是由15名用戶在一個(gè)受控的標(biāo)準(zhǔn)環(huán)境中每人完成12個(gè)不同的檢索任務(wù),從實(shí)驗(yàn)結(jié)果可以看出用戶在檢索中使用視頻對(duì)象或者對(duì)象的成分作為查詢的一部分,因此目前以對(duì)象為基礎(chǔ)的檢索是視頻檢索的主要技術(shù)。

優(yōu)勢(shì)進(jìn)一步擴(kuò)大,將劣勢(shì)逐漸地縮小,從而產(chǎn)生對(duì)信息檢索最有效的技術(shù),為用戶提供更好的服務(wù)。本文通過(guò)對(duì)國(guó)外主要信息檢索技術(shù)及其應(yīng)用的介紹,旨在為我國(guó)信息檢索技術(shù)的發(fā)展提供指導(dǎo)和借鑒。

圖?。场   ∠到y(tǒng)流程圖[10]

6.2    對(duì)話查詢語(yǔ)音界面

        早先的自動(dòng)語(yǔ)言識(shí)別系統(tǒng)存在著許多局限性,如識(shí)別過(guò)程產(chǎn)生的失誤、口語(yǔ)表達(dá)的冗余和用戶查詢的含糊等,在傳統(tǒng)的數(shù)據(jù)庫(kù)查詢?nèi)蝿?wù)中,通過(guò)以語(yǔ)義為基礎(chǔ)提煉和確認(rèn)關(guān)鍵詞就可以很容易地解決這些問(wèn)題,但是將語(yǔ)言識(shí)別應(yīng)用到普通的文本檢索系統(tǒng)中就不那么容易了?!榱耸刮谋緳z索系統(tǒng)更加有效地解決這些問(wèn)題,日本學(xué)者為帶有語(yǔ)音界面的檢索系統(tǒng)設(shè)計(jì)了一個(gè)對(duì)話策略來(lái)闡明和約束查詢。他

[10]

參考文獻(xiàn)?。海郏保荩龋澹颍颍澹颍帷。牵。停澹簦幔樱澹幔颍悖瑁椋睿纭。幔睿洹。拢澹铮睿洌骸。桑恚穑欤澹恚澹睿簦幔簦椋铮睢。牛穑澹颍椋澹睿悖澹?/p>

and Advice?。妫颍铮怼。幔睢。粒悖幔洌澹恚椋恪。蹋椋猓颍幔颍郏剩荩。桑睿妫铮颍恚幔簦椋铮睢。裕澹悖瑁睿铮欤铮纾幔睿洹。蹋椋猓颍幔颍椋幔睿?,?。玻埃埃罚ǎ叮?/p>

[2]Medina-Ramirz RC.?。樱澹恚幔睿簦椋恪。桑睿妫铮颍恚幔簦椋铮睢。遥澹簦颍椋澹觯幔欤骸。帷。遥澹簦酰颍睢。铮?/p>

Experience[J].EngineeringLetters,2007(11).

[3]Moreda P, Navarro?。拢。校幔欤铮恚幔颉。停。茫铮颍穑酰螅猓幔螅澹洹。樱澹恚幔睿簦椋恪。遥铮欤?/p>

Approach?。椋睢。桑睿妫铮颍恚幔簦椋铮睢。遥澹簦颍椋澹觯幔欤郏剩荩。模幔簦帷。幔睿洹。耍睿铮鳎欤澹洌纾澹牛睿纾椋睿澹澹颍椋睿?,2007(61):467-483.

[4]Teng SW,?。蹋酢。牵酰铮辏酰睿。桑恚幔纾濉。桑睿洌澹椋睿纭。幔睿洹。遥澹簦颍椋澹觯幔臁。拢幔螅澹洹。铮睢。郑澹悖簦铮?/p>

Quantization[J]. Pattern?。遥澹悖铮纾睿椋簦椋铮?,2007(40):3299-3316.[5]Kim?。?,?。蹋澹濉。?, Seo?。剩。痢。遥澹欤椋幔猓欤濉。疲粒选。遥澹簦颍椋澹觯幔臁。樱螅簦澹怼。眨螅椋睿纭。帷。眩酰澹颍?/p>

Log?。茫欤幔螅螅椋妫椋悖幔簦椋铮睢。裕澹悖瑁睿椋瘢酰濉。拢幔螅澹洹。铮睢。蹋幔簦澹睿簟。樱澹恚幔睿簦椋恪。粒睿幔欤螅椋螅郏剩荩桑睿妫铮颍恚幔簦椋铮睢。校颍铮悖澹螅螅椋睿纭。幔睿洹。停幔睿幔纾澹恚澹睿?,?。玻埃埃罚ǎ矗常海矗玻埃矗常埃郏叮荩樱瑁铮耄铮酰瑁椤。?,?。冢铮猓澹臁。剩。裕幔瑁幔纾瑁铮纾瑁椤。?, etc.?。眨螅椋睿纭。眩酰澹颍。蹋铮纾蟆。簦铩。牛螅簦幔猓欤椋螅?/p>

Vocabularies?。椋睢。模椋螅簦颍椋猓酰簦澹洹。桑睿妫铮颍恚幔簦椋铮睢。遥澹簦颍椋澹觯幔欤郏剩荩。桑睿妫铮颍恚幔簦椋铮睿校颍铮悖澹螅螅椋睿纭。幔睿洹。停幔睿幔纾澹恚澹睿簦。玻埃埃罚ǎ矗常海保叮梗保福埃?/p>

[7]Baek?。剩?, Yeom?。龋伲。痢。裕椋恚澹洹。停铮猓椋欤濉。粒纾澹睿簟。校欤幔睿睿椋睿纭。粒穑穑颍铮幔悖琛。妫铮?/p>

Distributed?。桑睿妫铮颍恚幔簦椋铮睢。遥澹簦颍椋澹觯幔臁。椋睢。模睿幔恚椋恪。危澹簦鳎铮颍搿。牛睿觯椋颍铮睿恚澹睿簦螅郏剩荩。桑睿妫铮颍恚幔簦椋铮睢。樱悖椋澹睿悖?,?。玻埃埃叮ǎ保罚叮海常常矗罚常常罚福?/p>

[8]Braga?。遥停停。祝澹颍睿澹颉。茫停?, Mattoso?。停。希洌螅螅澹樱澹幔颍悖瑁骸。痢。停酰欤簦椋?/p>

agent?。樱螅簦澹怼。妫铮颉。茫铮恚穑铮睿澹睿簟。桑睿妫铮颍恚幔簦椋铮睢。樱澹幔颍悖琛。幔睿洹。遥澹簦颍椋澹觯幔欤郏剩荩裕瑁澹剩铮酰颍睿幔臁。铮妗。樱螅簦澹恚蟆。幔睿洹。樱铮妫簦鳎幔颍?, 2006(79):204-215.

[9]Smeaton?。粒疲。拢颍铮鳎睿濉。校。痢。眨螅幔纾濉。樱簦酰洌。铮妗。遥澹簦颍椋澹觯幔臁。停铮洌幔欤椋簦椋澹蟆。妫铮?/p>

Video?。樱瑁铮簟。遥澹簦颍椋澹觯幔欤郏剩荩。桑睿妫铮颍恚幔簦椋铮睢。校颍铮悖澹螅螅椋睿纭。幔睿洹。停幔睿幔纾澹恚澹睿?,2006(42):1330-1344.

[10]Misu?。?, Kawahara?。裕。模椋幔欤铮纾酰濉。樱簦颍幔簦澹纾。簦铩。茫欤幔颍椋妫。眨螅澹颍В蟆。眩酰澹颍椋澹蟆。妫铮?/p>

Document Retrieval?。樱螅簦澹怼。鳎椋簦琛。樱穑澹澹悖琛。桑睿簦澹颍妫幔悖澹郏剩荩。樱穑澹澹悖瑁茫铮恚恚酰睿椋悖幔簦椋铮?,?。玻埃埃叮ǎ矗福海保保常罚保保担埃?/p>

們?yōu)榇_定臨界部分提出了兩個(gè)統(tǒng)計(jì)量,Relevance Score(RS)代表了與文件集的匹配度,Significance?。樱悖铮颍澹ǎ樱樱┯脕?lái)探測(cè)影響檢索結(jié)果的因素。通過(guò)這些測(cè)量,系統(tǒng)在檢索前后可以分別處理語(yǔ)音識(shí)別的失誤。然后系統(tǒng)會(huì)產(chǎn)生問(wèn)題來(lái)闡明用戶的查詢,減少檢索到的文件數(shù)量。該對(duì)話策略可以減少檢索的條目,特別是當(dāng)由于模糊輸入的查詢產(chǎn)生的許多匹配時(shí),這種減少是必要的。系統(tǒng)的工作流程如圖3?! ∮脩舻膯?wèn)題可以在知識(shí)庫(kù)(Knowledge Base,?。耍拢ⅲ耍略獢?shù)據(jù)和人類知識(shí)的結(jié)構(gòu)分析下被提煉,在獲得信息的基礎(chǔ)上,系統(tǒng)會(huì)選擇最佳的澄清問(wèn)題反饋給用戶,查詢的語(yǔ)句會(huì)在用戶回復(fù)之后得到更新。實(shí)驗(yàn)表明,這種方法比原始的語(yǔ)音識(shí)別技術(shù)更加有效地明確了用戶的查詢目的,提高了檢索的成功率。但是該技術(shù)只適合應(yīng)用在有限的域中,在開(kāi)放域信息檢索如網(wǎng)絡(luò)檢索中并不適用。

7    結(jié)    語(yǔ)

        國(guó)外學(xué)界和業(yè)界對(duì)信息檢索技術(shù)的研究已經(jīng)不僅僅局限在理論探討上,而是開(kāi)展了大量的實(shí)驗(yàn)和項(xiàng)目。學(xué)者們將信息檢索新技術(shù)應(yīng)用到實(shí)踐中,觀察它們的效果,并對(duì)項(xiàng)目或?qū)嶒?yàn)結(jié)果進(jìn)行評(píng)估,可以使他們清楚認(rèn)識(shí)到這些技術(shù)存在的不足之處。以上我們所提到的各種信息檢索新技術(shù)也都存在著優(yōu)勢(shì)和劣勢(shì),只有不斷地摸索實(shí)驗(yàn),才能將

[作者簡(jiǎn)介]

姜曉曦  女,1984年生,中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心碩士生,發(fā)表論文2篇。

[收稿日期:2008-02-22]

?95?

標(biāo)簽: