楼主: 打了个飞的
123 0

[学习资料] 大规模网页模块识别与信息提取系统设计与实现毕业论文 [推广有奖]

  • 0关注
  • 25粉丝

已卖:7201份资源
好评率:99%
商家信誉:一般

院士

98%

还不是VIP/贵宾

-

威望
0
论坛币
3465 个
通用积分
4711.1929
学术水平
8 点
热心指数
9 点
信用等级
8 点
经验
18726 点
帖子
2182
精华
0
在线时间
1383 小时
注册时间
2024-5-25
最后登录
2025-12-20

楼主
打了个飞的 在职认证  发表于 2024-12-12 10:35:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本科生毕业论文题目:(中文)
大规模网页模块识别与信息提取系统设计与实现
(英文 )
Design and Implementation of Large Scale Web Template Detection and Information Extraction System
姓名:学号:院系:专业:指导教师:
摘要本文提出了一套基于语义的网页分块和主题内容信息提取算法,在天网搜索
引擎预处理模块中将其实现,并且在
SEWM 2008
会议中,以这套算法为框架, 组织了主题型网页识别和网页主题内容信息块提取两个中文
Web信息检索评测 项目。在这套算法的基础上,基于天网文件系统与
Map-Reduce
计算平台,实现 了分布式的网页块级别
QuarkRank
算法,改进了
PageRank
算法的效果。实际检
验表明,该套算法具有很好的适应性与可扩展性,并达到了很高的精度和召回率。
关键词:
网页分块 信息提取 评测
Map-Reduce PageRank
Abstract
This paper presents a semantic web-page blocking and i ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:系统设计 毕业论文 大规模 information Map-Reduce

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-20 10:56