聂再清的个人简介
聂再清,男,汉族,博士学位,2004年4月加入微软亚洲研究院互联网搜索与挖掘组,现任主管研究员。主要负责微软对象级别互联网搜索引擎的研发工作,包括对象级别的互联网数据抽取,集成和检索。
简介
聂再清博士于2004年4月加入微软亚洲研究院互联网搜索与挖掘组,现任主管研究员。主要负责微软对象级别互联网搜索引擎的研发工作,包括对象级别的互联网数据抽取,集成和检索。在对象级别搜索与挖掘方面申请国际专利十余项。人立方关系搜索和微软学术搜索是对象级别搜索技术的两个成功应用实例。还有多项对象搜索技术被用在微软必应搜索(Bing)中。
聂再清于1996和1998年在清华大学计算机系获学士和硕士学位,2004获美国亚利桑那州立大学计算机科学专业博士学位。他的研究方向是数据挖掘、机器学习和互联网信息检索。其论文发表于计算机领域一流学术会议和期刊,如WWW, SIGKDD, ICML, TKDE, JMLR等。多次担任WWW, ICML,SIGKDD, ICDM, CIKM, ACL,AAAI等一流国际会议程序委员会成员或领域主席(Area Chair),及互联网信息集成国际研讨会(IIWeb2012和IIWeb2007)程序委员会主席。
研究成果
聂再清是互联网信息集成和知识挖掘的知名专家。聂再清和他的团队提出一种全新的基于对象的互联网搜索技术。这个听起来有点学术化的技术其实并不难理解。当你使用这种搜索引擎时,它列出的结果将是最终对象的集合,而不是杂乱的网页列表。一切的一切都围绕着你所搜索的那个对象。 比如,当你搜索“多普达”时,系统列出的不是包含此信息的各种页面标题、内容检索,而是一个个多普达手机―除型号、图片等直观信息外,每个产品下还列出介绍、价格、用户评价等相关信息,就像我们在购物网站中看到的陈列页面一样,但内容要远比某个网站所陈列的丰富,因为是来自整个互联网。搜索引擎所列出的对象内容并不是通过人工来整理的,而是计算机通过自动抓取、自动分类而形成的“虚拟”页面。微软学术搜索和人立方是对象级别搜索技术的两个成功应用实例。
微软学术搜索
微软学术搜索是微软亚洲研究院开发的免费学术搜索引擎,它为研究员、学生、图书馆馆员和其他用户查找学术论文、国际会议、权威期刊、作者和研究领域等提供了一个更加智能、新颖的搜索平台,同时也是一个对象级别垂直搜索、命名实体的提取和消歧、数据可视化等许多研究思路的试验平台。
人立方关系搜索
微软人立方关系搜索,是由微软亚洲研究院研发的对象级别互联网搜索引擎,是一款新型的社会化搜索引擎,它能从超过十亿的中文网页中自动的抽取出人名、地名、机构名以及中文短语,并通过算法自动的计算出它们之间存在关系的可能性。人立方搜索的创建理念来自于“六度空间”,只要随便输入一个人物,人立方搜索将给出该人物的关系、网页、资讯、简介等众多内容。最新推出的人立方2.0加入交互式知识挖掘功能包括人立方关系百科和人立方读心机器人,希望聚集大众的力量,实现互联网知识的整理。
研究论文
●Statistical Entity Extraction from Web. Zaiqing Nie, Ji-Rong Wen, Wei-Ying Ma. To appear in the Proceedings of the IEEE, September, 2012.●BioSnowball: Automated Population of Wikis. Xiaojiang Liu, Zaiqing Nie, Nenghai Yu, Ji-Rong Wen. In the Proceedings of SIGKDD 2010.●Closing the Loop in Webpage Understanding. Chunyu Yang, Yong Cao, Zaiqing Nie, Jie Zhou, Ji-Rong Wen. In TKDE 2009.●StatSnowball: a Statistical Approach to Extracting Entity Relationships. Jun Zhu, Zaiqing Nie, Xiaojiang Liu, Bo Zhang, Ji-Rong Wen. To appear in WWW 2009.●Web Object Retrieval. Zaiqing Nie, Yunxiao Ma, Shuming Shi, Ji-Rong Wen, Wei-Ying Ma. In WWW 2007.●Object-Level Vertical Search. Zaiqing Nie, Ji-Rong Wen, Wei-Ying Ma. In CIDR 2007.●Web-Scale Entity Search (this paper is in Chinese: 对象级别的互联网垂直搜索). Zaiqing Nie, Ji-Rong Wen, Wei-Ying Ma. In Communications of China Computer Federation, 2007 (Invited Paper).●Simultaneous Record Detection and Attribute Labeling in Web Data Extraction. Jun Zhu, Zaiqing Nie, Ji-Rong Wen, Bo Zhang, Wei-Ying Ma. In SIGKDD 2006.●2D Conditional Random Fields for Web Information Extraction. Jun Zhu, Zaiqing Nie, Ji-Rong Wen, Bo Zhang, Wei-Ying Ma. In the 22nd International Conference on Machine Learning (ICML 2005).●Object-Level Ranking: Bringing Order to Web Objects. Zaiqing Nie, Yuanzhi Zhang, Ji-Rong Wen, and Wei-Ying Ma. In WWW 2005.