中文Web信息检索论坛(CWIRF)


讨论组 SEWM2010中文信息检索评测通知



    中文Web信息检索论坛(Chinese Web Information Retrieval Forum,简称CWIRF)是由北京大学网络实验室从2004年6月起建立并维护的以大规模中文Web信息为测试集的信息检索研究论坛,其目标是推动中文信息检索技术.

     在信息检索领域中,检索系统评估对于系统的研究、开发和应用一直有其显著的影响。目的是达到 TREC追求的4个主要目标。 1)以大规模测试集为基础,推动信息检索的研究; 2)经由开放式的论坛,使与会者能交流研究的成果与心得,以增进学术界、产业界与政府的交流互通; 3)经由对真实检索环境的模拟与重要改进,加速将实验室研究技术转化为商业产品; 4)发展适当且具应用性的评估技术,供各界遵循采用,包括开发更适用于现有系统的新的评估技术。

    Web的发展伴随着信息的急剧增长,信息检索技术成为研究的热点, Google在短短的几年里在全世界范围的成功,进一步印证了Web搜索是信息检索中的一个重要研究和应用方向。

    TREC从1992年开始,致力于信息检索评估工作,极大的推动了信息检索技术的发展。 从1999年开始,设立Web Track测试项目,提供英文Web测试集(http://es.csiro.au/TRECWeb/)。 NII提供日文Web测试集 (http://research.nii.ac.jp/ntcir/index-en.html)。 缺乏大规模的中文Web测试集是制约中文信息检索技术前进的障碍。 因此,我们希望在国内外各个研究小组的共同参与下建立并完善以中文为主的Web测试集 CWT(Chinese Web Test collection), 一起推动中文检索技术的发展。




©2010 北京大学网络实验室