在線上公共目錄檢索系統信息檢索

在線上公共目錄檢索系統信息檢索

在線上公共目錄檢索系統(Online Public Access Catalogues,簡稱OPAC)是70年代末由美國一些大學圖書館和公共圖書館共同開發的。最初的OPAC信息檢索僅僅是傳統卡片目錄的計算機化,即用機讀目錄代替卡片目錄,利用終端在線上檢索,其收錄內容和檢索途徑都與卡片目錄基本相同。經過10多年的發展,經歷了第一、第二、第三代產品的演變,它的內容衝出了“目錄”的局限,擴展到統計資料、圖像、錄音、全文信息,用戶可直接從中檢索到所需的信息;網路化使它的服務對象從單一的館內讀者擴展到館外,乃至全球的網路用戶;它的用戶界面相當容易掌握和操作,近年來又現出了觸控螢幕、多媒體語音等多種新型界面,顯示出了它的優越性。

基本介紹

  • 中文名:在線上公共目錄檢索系統信息檢索
  • 外文名:Online Public Access Catalogues information retrieval
  • 起源時間:20世紀70年代
  • 學科:圖書情報與數字圖書館
  • 起源地點:美國
  • 發展趨勢:面向用戶與集成
發展,開發趨勢,常用分類,檢索現狀,檢索技巧,

發展

概況
圖書館自動化最初主要包括數據建設自動化和信息檢索自動化兩個方面。
雖然有關建立自動化目錄以提供館藏檢索可能性的文章早在60年代中期便已出現,但直到70年代中期,在線上公共目錄檢索系統(online public access catalogue,簡稱OPAC)才出現在美國的一些圖書館中。出現伊始,它便受到人們的歡迎,“因為用戶再也用不著花很多時間從沉重的目錄抽屜里翻檢排列緊密的陳舊卡片了”。至80年代中期,隨著AACR2、ISBD等編目規範的普及和OPAC系統技術的逐漸成熟,歐美許多圖書館都著手建立機讀目錄資料庫。一些較早的OPAC系統擴展了服務範圍,由只向本地讀者(local users)擴大到也對遠程用戶(remote users)服務,這使得OPAC本身及圖書館在社會中的作用得以強化。
當前,OPAC系統已發展到第三代。各具特色的OPAC運行在從PC到大型機的各種機型上,甚至還有專為兒童和盲人設計的特殊系統。“在所有信息檢索系統中,OPAC可能擁有最多的使用者”。從發表文章的數量和角度可以看出,目前對OPAC的理論研究方興未艾——從用戶檢索心理、檢索行為到OPAC對圖書館工作流程的影響;從一館的OPAC到OPAC網路,再到網際網路上的OPAC,有單個的,也有群體的,有巨觀的,也有微觀的。
第一代OPAC
早期,OPAC的潛在設計思想是“把一個已經存在的手工目錄體系電子化”。因此,它所提供的內容和檢索點都和卡片目錄基本一致。其主要檢索功能有兩種:“首字母組合檢索和短語檢索”以及對“用戶的檢索入口和記錄的訪問入口進行逐字元的匹配”。當用戶需要檢索多個系統時,面對命令式的界面往往束手無策。另外,系統硬體也存在諸多缺陷,如存儲容量小、網路數據傳輸率低、終端數量少等。
第一代OPAC的“設計思想簡單且缺乏特色”,它比較適合圖書館工作人員和那些有豐富OPAC操作經驗的用戶,而不太適合初級用戶,也不利於主題檢索(subject search),因此它對圖書館信息檢索效率的提高並未帶來根本性的改變。它的界面多是命令式和選單式的。前者,用戶必須了解、記憶大量命令,而後者雖然減輕了用戶的記憶負擔,但其檢索邏輯是先組的、線性的,並且用戶會經常“迷航”。
第二代OPAC
20世紀90年代,它在國內外圖書館中占據主導位置。較之第一代,它在資料庫的內容和質量、系統檢索功能及用戶界面(user interface)三個方面都有較大的發展。
1、資料庫
對信息實體主題內容的深度揭示,是圖書館目錄體系的一個欠缺。一些OPAC系統通過在記錄中加入目次、索引、內容注釋(content notes)、文摘、圖書評價甚至機讀百科全書等途徑來豐富其內容。卡耐基·梅隆大學已將Grolier Academic American Encyclopedia和American Encyclopedia Dictionary裝入其OPAC。檢索時,機讀百科全書為用戶提供特定主題的條目式背景知識。多媒體資料庫、全文庫、CD-ROM資料庫也紛紛出現,這一切都使用戶的檢索更加容易,所獲得的信息也更加豐富。
隨著地區性圖書館的聯合,出現了一些大型的聯合書目資料庫。利用聯合書目庫能實現“一地多檢”,大大方便了用戶。數據生產、存在、檢索網路化和大型聯合書目資料庫的出現都使數據維護的重要性愈來愈明顯。如何減少、避免庫中的重複記錄,如何提高各成員館編目的質量,特別是如何進行在線上規範控制(authority control),成為當時很多學者所討論的焦點。
高質量的數據有利於網路特性的發揮。鑒於此,西方圖書館界在“聯合——共享編目”的基礎上,提出了“聯合——共享維護”的思想,其意義在於:分散維護任務,共享維護成果。
80年代,OCLC及其成員館的資料庫查重工作,伊利諾州、WLN成功的在線上數據規範控制工作都顯示:不同系統、不同規模的圖書館可以合作,在局部工作上形成統一認識和工作流程,而且也只有基於“聯合——共享”的思想,各圖書館才能解決網路環境中的問題。
2、檢索功能
第二代OPAC的檢索能力獲得了一些發展,比如檢索點增多,每個欄位(field)都可成為檢索點;一些系統的容錯能力增強;匹配方式增多,出現了截詞檢索、相鄰度檢索、關鍵字檢索和布爾邏輯檢索等手段。“但總的說來,不管是檢索點還是匹配途徑都未有突破性進展,不能讓人十分滿意”。用戶使用時仍有較大的認知壓力(cognitive burden),如不同系統檢索命令不統一;檢索結果不能按相關性大小排序;關鍵字檢索雖然在檢索策略的擬定上自由度較大,但檢索結果往往有大量不相關或相關性較小的文獻,讀者需花時間篩選甄別;布爾邏輯檢索,其優點在於能利用邏輯組配檢索複雜主題,然而對於較多用戶,他們不熟悉“OR”、“AND”、“NOR”的作用與用法,所以使用者不多。
大量文獻表明,加強主題檢索是第二代OPAC檢索的一個熱點。
用戶調查顯示,主題檢索是用戶使用最多但同時也是出錯最多的一種方式。它較之已知款目檢索(known-item search)開放度大,並且更符合用戶掌握信息的實際情況。但是,它要求用戶將需求明確概念化,“表達用戶需求的語詞必須與系統的訪問入口一致”,這使用戶檢索時認知壓力大,並由於不熟悉詞表和標引的不規範,使檢索成功率小“OPAC主題檢索的立意大為降低”。為此,研究開發者們想了很多辦法來加強主題檢索,如加強規範文檔的建立;加強標引規範化,提高記錄主題標目與規範詞表的一致性;實行分類主題檢索一體化等。
還有一些系統試圖通過將自然語言檢索(如關鍵字檢索)與受控詞檢索結合起來提高效率。有的系統同時提供兩種檢索途徑供用戶選擇;有的則當主題檢索失敗後,在經用戶同意後或直接就進行關鍵字如標題詞、文摘、附註的檢索,這樣無疑增加了匹配的機會。
3、用戶界面
第二代OPAC的界面設計者在技術選擇上有了更大餘地。命令式界面不再成為主流,一些系統能夠編輯用戶的輸入使系統容錯能力增強,單純由於用戶輸入錯誤導致檢索失敗的情況有所緩解;瀏覽(browsing)功能是第二代OPAC的一個重要特點,當用戶檢索目標不明確或一時難以表達時,系統可以根據用戶的“暫定詞”向其提供一段相關的主題詞表或分類表,用戶可選擇適當入口詞(search item)擴大選擇餘地,因為選擇畢竟易於創造。另外,有一些機構認為應該設計一系列界面標準,比如統一的檢索命令結構、統一的幫助信息格式及索引選項。
圖形用戶界面(grafic user interface,GUI)是這一代界面的佼佼者,其設計更注重藝術性和易用性。它採用了面向對象的設計思想,“引進了心理學和美學的知識與概念”,力圖通過對文字、色調、線條、圖形甚至聲音等多種因素的合理搭配布局,使螢幕更賞心悅目,也使最終用戶(end-user)學會檢索;GUI集下拉、彈出選單界面於一體,在一定時間和空間儘可能多地容納和提供信息,但又不失其簡潔性;另外,它允許用戶通過點擊視窗、圖框、按鈕等圖形標識來選擇、表明意向;用戶還可同時打開多個視窗並行處理多項任務。GUI使得用戶與系統的交流變得更為密切。
在線上幫助、提示功能的增強也是這一代界面的特點。系統往往會通過簡明的提示告知目前系統的行為,用戶可以通過這些提示控制檢索進程。
第三代OPAC
第三代OPAC系統最大特點是使整個檢索過程呈現一種智慧型化,整個系統更具親和性和易用性。從這裡,用戶的檢索結果不再是“信息的信息(information of information)”,而是信息本身,但是它的發展並不完善。
PACE(public access catalogue extention)是一種極具第三代OPAC特色的用戶界面。其優點在於:當用戶輸入檢索意向後,呈現在他面前的將不再是呆板、枯燥的字元反饋,而是形象地排列於“架”上的一本本“圖書”(每本“書的大小,是根據MARC記錄載體形態項的數據按比例縮制而成)。用戶可以瀏覽每本書書脊上的信息,並可用滑鼠點擊感興趣的書,於是“封面”被“翻開”,“題名頁”向用戶顯示題名、責任者、出版者、分類號、文摘、甚至書評等。除此之外,用戶還可通過分類號選擇瀏覽“圖書館”中一排排的“書架”,……PACE採用虛擬仿真技術,讓圖書館於人們頭腦中的普遍印象出現在螢幕上,力圖在螢幕上創造一個現實世界,從而使用戶產生一種臨場感、沉浸感,有一WYSIWYG (所見即所得)的效果。
除了PACE外,第三代OPAC還將擁有很多令人興奮的特點,如自然語言檢索、語音識別界面、超文本檢索、多媒體資料庫和檢索結果相關性排序等功能。第二代OPAC的檢索只能進行形式上的查找而不能進行概念上的匹配。第三代OPAC將具有概念檢索的能力,它對用戶提問和“文獻中繁多的原文信息進行語義層次上的自然語言處理、匹配提供用戶直接能用的信息”。Z39.50協定能使“具有不同資料庫模型、數據存儲方法和檢索方法的系統相互理解、通信”,從而取消了不同系統、不同界面對用戶的檢索限制;“LC、OCLC等機構正在擴充MARC內容以反映近來發展的信息傳送。MARC856欄位包含了實物的統一資源定位標識(uniform resource locator,URL),URL所連線的就是實物的內容(全文文獻、靜態圖像、動畫或一段程式)。用戶通過點擊MARC記錄或欄位就可在終端上獲得存
儲在WWW伺服器上的記錄的真實內容”。WWW技術是網際網路上發展最快的服務方式,很多系統都通過WWW界面向全球範圍的用戶提供檢索服務,最大程度地實現了資源共享。網際網路上目前有很多優秀的信息搜尋引擎,如Yahoo!、GOYOYO等,它們就是網際網路上的OPAC。GOYOYO是一個高度智慧型化的搜尋引擎,已和全球2.4萬個中文網際網路頁相連,網址是http://www.goyoyo.com。這些搜尋引擎以驚人的速度尋找信息,並將其分類,提供檢索。
我們可以構想一位第三代OPAC用戶的檢索過程:他坐在計算機前,先“拉開”一個“抽屜”,找到了需要的檢索詞,又“拿”過一支“筆”,點擊輸入……,當他選定了一本書後,系統馬上顯示出圖書館平面圖並“告訴”他這本書的大概位置。而這時,旁邊的終端前正有一位盲人在與系統進行對話:“I want theinformation about……”。

開發趨勢

第一,應以用戶需求為中心,增強檢索功能,最大限度地滿足用戶快速、準確、全面地檢索所需文獻。OPAC 系統應充分借鑑國外系統的先進技術與經驗,通過增加檢索點、完善檢索策略、提供二次檢索以及提供各種輸出方式等多種途徑最大限度地滿足用戶檢索需求。
第二,未來的 OPAC 將是一個集成圖書館各種資源的目錄體系。用戶不僅可以檢索本館各類文獻資源,而且能夠方便地查尋其它圖書館的書目資源以及數位化資源。而要實現 OPAC 與館際各類資源的集成,最大範圍地實現資源共享,不僅需要有先進的技術,更需要圖書館之間真誠的合作與不懈的努力,才能真正實現圖書館資源面向社會開放。

常用分類

全國期刊聯合目錄
全國期刊聯合目錄是一個全國性、多學科、多文種的綜合性資料庫,創建於 1983年,是由中國科學院文獻情報中心牽頭研建、中科院長期支持的項目。它集成了400多家成員館的館藏期刊目錄,可通過刊名、刊名關鍵字、首字母縮寫、縮略識別刊名、ISSN號等途徑檢索。在檢索連續出版物時,會給出收藏單位收藏年卷期的詳細列表。該目錄是確定國內期刊館藏地的首選。
國家科技圖書文獻中心
國家科技圖書文獻中心是一個虛擬式的科技資源機構,向用戶有償提供期刊、學位論文、會議論文、科技報告、標準等多種文獻全文,同時支持文獻檢索、全文檢索、目次瀏覽等功能。用戶可以通過線上系統直接向文獻館藏單位發出申請。該檢索系統數據更新及時、用戶界面友好,並且免費提供檢出文獻文摘和館藏信息。
CALIS聯合目錄公共檢索系統
CALIS聯合目錄公共檢索系統可按照中、西、日、俄文四個資料庫進行檢索,記錄的輸出結果可以按照圖書、連續出版物、古籍三種文獻類型劃分。同時可對檢索結果分庫顯示,並且可以按照自己的喜好來排序。由於整合了全國眾多高校的資源信息,該檢索系統無疑是高校之間文獻傳遞的好幫手。
在線上計算機圖書館中心 (OCLC)
OCLC擁有世界上最大的館藏地點庫,目前112個國家和地區超過6萬個圖書館通過OCLC來實現資源共享。其中WorldCat是世界上最大的、由6萬多個成員館參加的聯合編目資料庫,它覆蓋了從公元前1000年到現在的資料,目前已達6200多萬條記錄,數據每天更新,可檢索世界範圍內的OCLC成員館館藏。用戶還可直接從檢索界面跳轉到館際互借界面,向館藏地發出文獻傳遞的請求。

檢索現狀

調查發現,在圖書館 OPAC 信息檢索中,無論是經驗老道的用戶還是毫無經驗的用戶都採用了更適合於 Google 而非圖書館目錄的搜尋策略。具體表現在以下幾個方面:
1、用戶首選的搜尋選項往往是任意關鍵字
習慣於網際網路搜尋引擎的用戶想當然地認為,只要在圖書館 OPAC 的對話框中輸入大範圍的關鍵字,系統便會
判斷他們的意圖並獲得理想的匹配結果,其思維模型是:給計算機的信息越多,得到的結果就越好。然而,圖書館目錄除了運用較為傳統的題名、作者、受控主題詞等檢索方式外,相當一部分系統不具備支持相關度關鍵字搜尋結果的選項,因此檢索結果的匹配率較低。這種搜尋策略在搜尋幾十億的網際網路網站時很奏效,但對於嚴格按受控主題詞匹配和布爾邏輯運行的圖書館目錄來說則效果不佳。
2、用戶極少使用布爾運算符
通常圖書館 OPAC 的設計目的是為了鼓勵大家進行高級搜尋,結合搜尋欄位使用多項搜尋框和下拉框來挑選
and、or、或 not 等關聯詞。然而普通用戶對布爾邏輯的運用不熟悉,加上檢索字元串要求精確無誤等原因,常常導致較高的檢索失敗率與信息漏檢率,因此多數用戶寧願將大量搜尋詞輸入一行,而不使用任何關聯的布爾運算符。先前的圖書館目錄和網際網路研究也做出了關於使用布爾的類似報告。如有學者在對使用 Excite 搜尋引擎的回顧中發現,在成千上萬的網路用戶中只有 8 名用戶使用了布爾檢索。另有學者觀察到多數目錄用戶未能完成主題搜尋項後尖銳地指出,現在是停止使用終端用戶布爾檢索系統的時間了,包括 OPAC,布爾檢索系統具有根本性的缺陷,這種設計模型不能代表用戶信息搜尋的行為習慣。
3、用戶不善於運用同義詞概念來修正搜尋
當檢索效果不理想時,用戶的第一個反應通常是改變搜尋類型,另外加一個字或是去掉一個術語以擴大搜尋范
圍,很少採用可能更為有效的同義詞來進行替換。而替換相關概念的能力對於多數線上圖書館目錄來說是至關重
要的,但這一技巧似乎連有經驗的用戶也不具備。同時研究也表明,在搜尋習慣上,無論是新用戶還是有經驗的老用戶也都表現出各自與網際網路搜尋習慣相類似的特徵。

檢索技巧

1、分析檢索內容。要想確切了解所要信息的具體情況,就必須了解該信息的信息檢索範圍(標題、中文、外文)、檢索時間(具體年份、近幾年、近幾周、近幾天、當天)等。
2、注意選擇資料庫,限定檢索範圍,提高檢索效率。
3、針對不同的文獻類型和目的需求選擇恰當的檢索途徑,如快速檢索、高級檢索等。
4、選擇合適的檢索詞。為了提高檢索的精度,應儘量選專指詞、特定概念或非常用詞,避免普通詞、泛指概念。
5、恰當處理檢索結果。當檢索結果為零或檢索結果太少時,就需要使用同義詞、近義詞或相關詞,布爾邏輯符OR連線關鍵字來擴大檢索範圍。當檢索結果太多時,可通過使用詞組檢索、使用大小寫檢索、使用特殊搜尋選項、使用邏輯符(AND和NOT)、改變關鍵字及書名號等方法縮小檢索範圍。當檢索不到結果時,首先檢查是否輸入關鍵字錯誤,如果還不能得到檢索結果,可以看相關搜尋的提示功能,也許能檢索到你想要的結果。

相關詞條

熱門詞條

聯絡我們