郭岩  高级工程师  

研究方向:从事网络信息获取、网络内容处理相关的研究

所属部门:数据智能系统研究中心

导师类别:

联系方式:

个人网页:

简       历:

2001.9-2004.7 中国科学院计算技术研究所 获博士学位

2000.8至今 中国科学院计算技术研究所 工作

主要论著:

代表性论文:

1) Yan Guo, Huifeng Tang, Linhai Song, Yu Wang, Guodong Ding. ECON: An Approach to Extract Content from Web News Page. 12th International Asia-Pacific Web Conference, 2010(APWEB 2010). Page(s):314-320.

2) Yan Guo, Yu Wang, Guodong Ding, Donglin Cao, Gang Zhang and Yi Lv. Juicer: Scalable Extraction for Thread Meta-information of Web Forum. Proceedings of Pacific Asia Workshop on Intelligence and Security Informatics (PAISI) 2009. Intelligence and Security Informatics, Lecture Notes in Computer Science (LNCS 5477) : 143-148.

3) Yan Guo, Kui Li, Kai Zhang, Gang Zhang. Board Forum Crawling: A Web Crawling Method for Web Forum. The 2006 IEEE/WIC/ACM International Conference on Web Intelligence (WI-06).

4) 郭岩,白硕,杨志峰,张凯. 网络日志规模分析和用户兴趣挖掘. 计算机学报,2005.Vol.28,No.9:1476-1482.

5) 郭岩,白硕. 因子分析在基于用户兴趣的Web文档聚类中的应用. 模式识别与人工智能,2005,Vol.18,No.1:81-88.

 

已授权专利:

1) 发明专利(已授权):一种网页的正文抽取方法,专利号:中国, ZL 2008 1 0223791.9,第一发明人

2) 发明专利(已授权):一种从论坛帖子列表页面中抽取帖子元数据的方法 , 专利号:中国, ZL 2008 10119238.0,第一发明人

3) 发明专利(已授权):一种利用网络用户访问特性的网络代理缓存替换实现方法,专利号:中国, ZL 2004 1 00475346,第一发明人

4) 发明专利(已授权):一种优化网站链接结构的方法, 专利号:中国, ZL 2005 1 0011212.0,第一发明人

科研项目:

作为课题组长、技术骨干参与30余个重大科研、工程项目。

获奖及荣誉: