基于鏈接分析的學術(shù)性核心網(wǎng)站評價
第22卷第9期 2004年9月 情 報 科 學 V o l 122, N o 19 Septem ber, 2004基于鏈接分析的學術(shù)性核心網(wǎng)站評價田紅梅 李 強(解放軍理工大學氣象學院圖書館, 南京
第22卷第9期
2004年9月
情 報 科 學
V o l 122, N o 19 Sep
tem ber, 2004
基于鏈接分析的學術(shù)性核心網(wǎng)站評價
田紅梅 李 強
(解放軍理工大學氣象學院圖書館, 南京211101)
摘 要 學術(shù)性核心網(wǎng)站的評價對網(wǎng)站建設與發(fā)展起著非常重要的作用。文章從“核心網(wǎng)站”概念的提出,
分析了確立“核心網(wǎng)站”的意義; 根據(jù)鏈接分析方法研究的主要內(nèi)容, 探討了對學術(shù)性核心網(wǎng)站評價的基本內(nèi)容、原則和基于WWW 鏈接分析的評價方法。
關(guān)鍵詞 核心網(wǎng)站 網(wǎng)絡信息資源 評價 鏈接分析
中圖分類號 G 203 文獻標識碼 A 文章編號 100727634(2004) 0921078203
L i nd -ba sed Quan tita tive Eva lua tion M ethod for T ian Hongm ei L (L ibrary of M eteo ro logy Co llege , PLA U T N anjing 211101)
Abstract T he idea of “the m aen content of link -based analysis ,
, studies the content and the p rinci per and the m ethods co w ”of co re w .
Co re w ebside N etw o rd info r m ati om resources Evaluati on L ind analysis
1 核心網(wǎng)站的提出
“文獻集中與離散規(guī)律”揭示了核心期刊的存
在。布拉德福從期刊相關(guān)載文率出發(fā), 對獨立學科的期刊等級排列, 發(fā)現(xiàn)科學論文在相關(guān)期刊中并非均勻分布, 而是呈現(xiàn)出明顯的集中—分散現(xiàn)象, 從而可以得到期刊的核心區(qū)及其相繼區(qū); 加菲爾德利用期刊引用分析法, 把核心期刊推廣到多學科文獻, 他利用美國科技情報所的《科學引文索引》數(shù)據(jù)庫進行的統(tǒng)計表明, 所有引文量的75來自不到1000種期刊, 有70的引文僅來自500種期刊, 從而又從另一個角度證實了文獻離散規(guī)律的存在, 揭示了文獻情報流的內(nèi)在規(guī)律, 反映了社會發(fā)展和文獻活動的規(guī)律性。因特網(wǎng)作為一個開放性的全球分布式的信息網(wǎng)絡, 它在給人們帶來無限信息空間的同時, 也帶來了巨大的信息污染, 網(wǎng)上信息資源質(zhì)量隱患在很大程度上影響了人們對因特網(wǎng)資源的充分利用, 因此, 如何從眾多網(wǎng)上資源中篩選出符合需要的有用信息或知識, 如何評價網(wǎng)絡信息資源的質(zhì)量等越來越受到人們的關(guān)注。由于網(wǎng)絡信息資源與以書本為載體的文獻資源存在著一定的共性, 因此, 越來越多的人開始探討和嘗試將文獻計量學應用到網(wǎng)絡信息資源的研究上, 網(wǎng)上信息資源的分布同樣遵循布拉德福定律, 呈現(xiàn)集中—分散現(xiàn)象。為此, 人
收稿日期:2003-09-03
們借鑒核心期刊的相關(guān)理論提山了“核心網(wǎng)站”的概念。
2 確立核心網(wǎng)站的意義
因特網(wǎng)是開放性的全球分布式網(wǎng)絡, 是一個極具價值的信息網(wǎng)絡。但由于其開放性、分布性、自由性、共享性等特征, 使得因特網(wǎng)信息來源極為廣泛, 信息發(fā)布帶有很大的隨意性, 在它為用戶提供浩如煙海信息的同時, 也造成了信息過載和信息污染。面對源源不斷涌來的信息, 用戶面臨著如何加以選擇和利用的問題。盡管用戶通過網(wǎng)址(U RL ) 中的頂級域名區(qū)分各類信息, 卻不能對信息的準確性、可靠性等方面作出評判。因此, 網(wǎng)上信息的可靠性、有效性、相關(guān)性以及真實性便成為人們關(guān)注的重要方面, 并由此引發(fā)了對網(wǎng)絡質(zhì)量的評估問題。
然而, 對網(wǎng)絡信息資源評估實質(zhì)上是對網(wǎng)絡信息資源的信息質(zhì)量進行合理的網(wǎng)站評價標準和方法, 越來越受到人們的關(guān)注。核心網(wǎng)站的確立, 不僅是開展信息服務和滿足用戶網(wǎng)絡信息需求的需要, 同時也是擴大網(wǎng)站的知名度、促進網(wǎng)站自身建設和提高網(wǎng)絡信息服務效率的需要。
(1) 有助于節(jié)省網(wǎng)絡信息檢索的時間, 提高科研效率。核心網(wǎng)站集中了大量有價值的信息, 使用戶用最少的時間就可以獲得最大的信息量, 從而盡
,9期 基于鏈接分析的學術(shù)性核心網(wǎng)站評價1079
快地完成科研任務。
(2) 有助于人們了解某學科領(lǐng)域的發(fā)展方向和最新研究成果。核心網(wǎng)站的信息不僅價值相對較高, 而且能反映學術(shù)研究的最新成果和動態(tài), 便于研究人員了解和跟蹤某一科研課題。
(3) 有利于促進網(wǎng)站建設。核心網(wǎng)站的形成同樣是符合“成功導致成功”即“馬太效應”的, 也就是說由于核心網(wǎng)站的信息價值和可信度等都較其他網(wǎng)站高, 所以它的訪問者多、人氣較旺, 容易吸引稿源和相關(guān)作者加入討論, 形成“累積優(yōu)勢”(Cum u lative advan tage distribu ti on ) , 從而保持網(wǎng)站的良性循環(huán), 進一步促進網(wǎng)站的建設和發(fā)展。
“核心網(wǎng)站”的確立和相對認可, 站的知名度, 4 核心網(wǎng)站的評價
411 評價的基本內(nèi)容
(1) 網(wǎng)站總體設計。主題明確、重點突出, 頁
面設計美觀、布局合理, 所要展示的內(nèi)容條理清晰、排列得當, 各網(wǎng)頁之間風格統(tǒng)一, 有整體感。
(2) 網(wǎng)站信息質(zhì)量。包括內(nèi)容的權(quán)威性、準確性、新穎性、特色性、。這是評價網(wǎng)、(, 、便于檢索, 提。
(4) 網(wǎng)站信息結(jié)構(gòu)。包括信息是否符合邏輯, 鏈接是否合理并與內(nèi)容相符、符合瀏覽規(guī)律, 鏈接是否正確穩(wěn)定。
(5) 網(wǎng)站易用程度。包括資源的利用是否方便有效、用戶界面是否友好、檢索功能是否齊全, 頁面的交互性、兼容性和連接響應速度等。這是使用網(wǎng)絡信息所需要的最基本的客觀條件?! ?12 評價的原則
(1) 用戶第一原則。網(wǎng)站是一個單位或機構(gòu)在
3因特網(wǎng)的基本成分是網(wǎng)頁, 網(wǎng)頁與網(wǎng)頁之間由鏈關(guān)系相互連接, 鏈是網(wǎng)頁之間相互關(guān)聯(lián)的紐帶, 它反映了網(wǎng)頁之間的各種內(nèi)在聯(lián)系。通過對鏈的數(shù)量進行統(tǒng)計和分析, 可以了解網(wǎng)頁乃至網(wǎng)站的情況。
鏈接分析的內(nèi)容主要包括:鏈接和被鏈接量, 鏈接網(wǎng)頁的類型, 鏈接的頻次和變化, 鏈接網(wǎng)頁之間的關(guān)系。
(1) 鏈接和被鏈接量。許多搜索引擎都能檢索某一網(wǎng)頁被鏈次數(shù), 可直接用于檢索鏈接關(guān)系, 用搜索引擎檢索出的某一網(wǎng)站的鏈接數(shù)能反映該網(wǎng)站被利用的情況。
(2) 鏈接網(wǎng)頁的類型。在“利用鏈接關(guān)系評價網(wǎng)絡信息的可行性研究”一文中作者認為新浪網(wǎng)的站外鏈接有以下幾種:推薦鏈接、合作鏈接、相關(guān)鏈接、資源鏈接、通訊鏈接和廣告鏈接等, 其中與主頁及頻道建立的鏈接價值更高。如推薦鏈接直接對被推薦網(wǎng)頁質(zhì)量做了肯定, 在評價網(wǎng)絡信息上是極為有效的。
(3) 鏈接的頻次和變化。有價值的站點終究會滿足人們的需求并被人們利用。一個網(wǎng)頁被鏈接次數(shù)越多, 從一個側(cè)面證明該網(wǎng)頁質(zhì)量越高, 可利用被鏈的次數(shù)和變化對該網(wǎng)頁(網(wǎng)站) 信息質(zhì)量進行評價。
(4) 鏈接網(wǎng)頁之間的關(guān)系。如果站點A 與站點網(wǎng)站的B 相互引用較多, 則它們之間的關(guān)系較緊密。內(nèi)容是以網(wǎng)頁為單位的, 同樣, 網(wǎng)頁之間相互引用
較多則說明它們之間的關(guān)系較緊密。
網(wǎng)絡世界中的代表。建立網(wǎng)站的目的, 一是宣傳自己, 二是為用戶服務。而后者更為重要, 只有在為用戶服務當中網(wǎng)站才能實現(xiàn)自身價值。因此用戶第一的思想是否貫穿于網(wǎng)站設計的全過程, 是我們評價網(wǎng)站時應堅持的一個原則。
(2) 整體性原則。評價一個網(wǎng)站應看其在網(wǎng)站建設的整體設計構(gòu)思上是否對所提供的信息內(nèi)容(表現(xiàn)形式) 進行全面規(guī)劃, 確立清晰可行、有持續(xù)發(fā)展能力的信息資源建設思路。
(3) 特色性原則。有特色才有生命力, 特色的信息與服務是一個網(wǎng)站區(qū)別于其它網(wǎng)站的特征, 是其能否吸引用戶的關(guān)鍵, 是其能否迅速發(fā)展的決定性因素。
(4) 動態(tài)發(fā)展原則。網(wǎng)站建設是一項不斷改進、不斷完善的工作, 網(wǎng)站信息服務的質(zhì)量與水平(內(nèi)容和形式) 只有不斷完善與提高, 才能保證網(wǎng)站有旺盛的生命力和競爭力, 否則, 其位置很快會被競爭者取代。因此, 評價網(wǎng)站要看其是不斷發(fā)展還是停滯不前。
,1080情 報 科 學 22卷
數(shù)量、鏈接數(shù)量、統(tǒng)計網(wǎng)頁和鏈接結(jié)果的特點, 所以它可有效地用于網(wǎng)絡計量研究。許多搜索引擎象A lta V ista 、Fast Search 、Ho tbo t 、Excite 、L yco s 等都能檢索某一網(wǎng)頁的被鏈次數(shù)。如在Fast Search 中輸入檢索式sina 1com 可檢索到Fast Search 收錄的網(wǎng)頁中有多少頁面是“sina 1com ”, 也就是Sina 站點“被引”了多少次。這樣就可以比較各站點或頁面的“被引”次數(shù), 進而了解站點或頁面的影響力。一般情況下, “被引”次數(shù)越多, 站點或頁面信息水平和可信度越高, , 從 413 評價的基本方法
確定或評價核心網(wǎng)站的方法主要有定性和定量評價方法。定性評價法包括用戶評價法、專家評價法、評估工具評價法和指標體系評價法等, 但我們這里主要討論定量評價法, 亦即基于鏈接分析的評價方法。
引文分析法是評價期刊質(zhì)量的經(jīng)典工具, 是對文獻進行定量評價最為有效的方法之一。它的主要依據(jù)和研究內(nèi)容是科學文獻之間的引證與被引證關(guān)系?;ヂ?lián)網(wǎng)存在著一種與傳統(tǒng)文獻引證與被引證關(guān)系十分相似的情況, 就是站點之間的鏈接與被鏈接的關(guān)系。W eb 出版物中的引文, 比, :一, 二是因為該網(wǎng)頁質(zhì)量高而被推薦。這兩種原因都說明一個網(wǎng)頁被鏈接與其質(zhì)量存在著正向的關(guān)系, 鏈接分析法符合引文分析法的基本假設。一個網(wǎng)站被鏈接次數(shù)越多, 從一個側(cè)面證明該網(wǎng)站質(zhì)量越高, 說明它的影響力就越大。如果對同一類站點按被其它站點鏈接次數(shù)從大到小的順序排列, 就可以看出各站點之間影響力的差異。如果取一個合適的值作為閾值, 大于閾值的站點即為核心站點。
(1) 影響因子評價法。影響因子是一個國際上通行的期刊評價指標, 是加菲爾德于1972年提出的。由于它是一個相對統(tǒng)計量, 所以可以較公平地評價和處理各類期刊。1996年中國科學院文獻情報中心應中國科協(xié)和中國科學院的要求, 為48種期刊提供了影響因子指標, 從中可以看出, 影響因子的大小與期刊質(zhì)量的高低存在著一定的內(nèi)在聯(lián)系。借鑒期刊影響因子分析的思路與方法, 1998年, Ingw ersen 提出可以把文獻計量學的期刊影響因子應用到網(wǎng)頁的評價中去。網(wǎng)頁的影響因子(W eb i m p act gacto r , W IF ) 是指某一類型的域名或網(wǎng)頁被
5(1) 核心網(wǎng)站是一個動態(tài)的概念, 因此對它的
評價并不是一成不變的, 所以應經(jīng)常關(guān)注網(wǎng)站的信息在內(nèi)容質(zhì)量方面的變化, 以作出適時調(diào)整。
(2) 由于不同類型的網(wǎng)站提供的內(nèi)容和服務是不同的, 因此被鏈接的機會也不相同, 在利用鏈接次數(shù)評價網(wǎng)站時, 應選擇好比較對象, 即同類型網(wǎng)站相比, 使其具有可比性。
(3) 在互聯(lián)網(wǎng)上, 作為鏈接分析法研究對象的網(wǎng)站, 其網(wǎng)頁“被引”所產(chǎn)生的動機遠比印刷型文獻中的引文復雜, 除引證目的外, 還包括隨意性和不相關(guān)的鏈接等。因此, 研究人員指出, 在將引文分析方法完全應用于網(wǎng)絡信息資源評價之前, 還必須深入了解網(wǎng)絡鏈接產(chǎn)生的機理、鏈接行為模式和合適的鏈接統(tǒng)計工具。
參考文獻
1 楊海平, 陸寶益, 張?zhí)炜? 核心網(wǎng)站論, 圖書情報工作,
2001(12) :68~70
2 劉雁書, 方 平. 利用鏈接關(guān)系評價網(wǎng)絡信息的可行性研
究. 情報學報, 2002(4) :401~406
3 黃 奇, 李 偉. 基于鏈接分析的學術(shù)性WWW 網(wǎng)絡資
源評價與分類方法. 情報學報, 2001(2) :186~192
4 劉君玉. 引文分析的評價. 情報理論與實踐, 1998(2) :
87~89
5 蔣 穎. 因特網(wǎng)學術(shù)資源評價:標準和方法. 圖書情報工
鏈接之和與有關(guān)域名或網(wǎng)頁之和的比例。網(wǎng)頁影響
因子可以用來分析在一定的時期內(nèi)相對關(guān)注的網(wǎng)頁情況。通常, 影響因子越大, 網(wǎng)站的學術(shù)影響力就越大, 質(zhì)量就越高。因此, 影響因子從信息的利用角度, 體現(xiàn)了信息資源在信息交流中被人們所重視的程度。
(2) 搜索引擎評價法。因為搜索引擎具有能夠從所搜索的網(wǎng)頁及其鏈接的大型數(shù)據(jù)庫中識別網(wǎng)頁
作, 1998(11) :27~31
6 邱均平, 黃曉斌. WWW 網(wǎng)頁的鏈接分析及其意義. 中
國圖書館學報, 2221(6) :44~47
7 李長忠.
網(wǎng)絡計量學理論與實證研究. 圖書情報工作,
圖書情報工作, 2002
2001(10) :21~23, 328 張 詠. 網(wǎng)絡信息資源評價方法.
(10) :41~47, 61
(責任編輯:徐 波)