SEWM2008中文信息检索评测通知

CWIRF home


2007年10月 - 2008年3月


承办单位:北京大学网络实验室

中文Web信息检索论坛(CWIRF)鼓励基于大规模测试集的中文信息检索研究和相关 应用,提供统一的评分程序,经由开放式的论坛,使参加者交流研究的成果与心得。 现举办第五届中文Web信息检索评测。 以解决支持中文WEB研究的基础设施建设和应用中的基本方法与关键技术目标。


任务描述如下。 测试集可以按照下面叙述的方法获得。


所有提交的检索结果将会公布在CWIRF网站上。 研讨会于2008年4月11日-13日在江西师范大学召开。


一、时间安排

1、报名办法
下载报名表, (pdf)/ (doc), 签字盖章后,邮寄或者传真给黄蕊.
报名以研究机构或公司为单位,不接收个人报名.
报名截止时间是2008年3月1日.
地址: 北京大学计算机系网络实验室, 100871
联系人: 黄蕊, 电话+86-10-62759632, 传真+86-10-62765813, Email:

2、2007年12月30日开始,
申请获得
CWT70th 数据
, 申请方法
报名后,可以免费获得参加评测任务的相关数据集,目前有口令保护。

3、2008年3月15日,参加评测队提交结果(estimated)


4、2008年3月31日(estimated)
参加研讨会的演讲人发送讲稿. 联系人: 闫宏飞, Email:

5、2008年4月11日-13日
SEWM2008中文Web信息检索评测研讨会在江西师范大学召开. 公布相关结果集, 参加评测单位的分数,学术交流.


二、任务描述

SEWM2008中文Web信息检索评测有三任务: 主题网页发现和网页内信息块发现,非网页数字资源分类和垃圾邮件过滤。 如有问题,可以直接发邮件给主办者。

主题型网页发现任务和网页内容信息块发现

网页主要由导航型和主题型两类构成,Web检索目的确定包含信息的主题网页,然后是找到该网页中包含的信息。
主办者:闫宏飞,Email:
何靖, Email:
任务主页: http://www.cwirf.org/Evaluation/CWT.html



非网页数字资源分类

随着互联网的发展,数字资源越来越成为网络上主要的信息找寻对象。但是网络上数字资源发布和管理是无序的,资源命名、传播、组织都具有较大随意性。如果说网页分类目录或历史库藏等应用形式,能够将网页按照某种方式组织起来便于人们查询访问,数字资源这种非网页类的内容同样需要有序组织,并具有很广泛的应用领域,例如数字图书馆、网络教学资源库藏、专题内容管理系统等。
主办者:闫宏飞,Email:
陈翀, Email:
任务主页: http://www.cwirf.org/Evaluation/CWT.html



垃圾邮件过滤

垃圾邮件过滤目的在于评测各种垃圾邮件过滤技术的有效性。
主办者:董守斌,Email:
方卫东, Email:
任务主页:http://www2.scut.edu.cn/antispam/



北京大学网络实验室
updated on 1/12/2008