檢索測試集

基本概念

用於信息檢索評測的測試集一直推動著檢索系統的研究、設計與發展。研究者進行信息檢索評測的一般模式，是將需要查詢的問題形成查詢語句，輸入檢索系統，檢索系統在文檔集合內進行檢索，將可能符合要求的文檔提交給研究者，研究者再將得到的文檔和標準答案作對比，以此評價檢索系統的性能。因此，檢索測試集主要由文檔集、查詢集、相關判斷集三個部分構成。

研究現狀

國內外研究現狀

早期測試集最有影響的研究是Cleverdon在20世紀50年代末期開始進行Cranfield實驗，它開創了以測試集及評測指標來評測系統的模式。目前在信息檢索評測領域，國際上比較著名的是TREC(Text RE-trieval Conference)文本檢索會議，它提供了大型（超過百萬文檔）的英文測試集，同時TREC也構建了小型中文測試集，但僅提供給參賽評測單位使用。國外比較小型的測試集則有CACM，ISI等，文檔的語種類型多為英文。國內在構建測試集方面仍處於學習國外的階段，北京大學已經建立了基於Web檢索的大型中文測試集。

用於信息檢索評測的測試集一直推動著檢索系統的研究、設計與發展。由於系統檢索的過程高度依賴於文檔的語言類型，已有的比較成熟的測試集所包含文檔的語言類型多為英文，所以並不適合用以評測中文檢索系統。中文測試集的缺乏，制約了中文檢索系統的研究。目前已構建的大型測試集，都需要耗費大量的時間和人力，難以在短期內完成，並且檢索系統進行測試本身也要耗費大量的時問與精力。對於不願進行這樣大投資的研究者來說，一個可選的方案就是使用能在較短時間內建立和測試的小型測試集。由於小型測試集的規模比較小，它可以靈活地添加一些大型測試集所不具備的特徵，用於檢驗某些特定的搜尋技術。此外，若能運用同一標準測試集對不同中文檢索系統進行評測，則有利於評測結果的比較，其結果也將會更有意義。目前國內尚無建立起標準的可用於中文信息檢索評測的小型測試集。因此，有必要構建一種小型中文測試集，用於信息檢索研究的評測工作。

檢索測試集

基本介紹

基本概念

研究現狀

國內外研究現狀

相關判斷方法

檢索測試集的構建

文檔集的構建

查詢集的構建

相關判斷集的構建

熱門詞條