企业网站建设网页去噪流程
日期 : 2021-01-03 16:46:11
网页去噪流程:
1) 节点分割。将网页映射为DOM树, 根据当前DOM节点的信息以及子节点信息进行节点分割, 完成信息块提取。
2) 检测分割条。首先利用网页的初始坐标和终止坐标作为初始化分隔条, 然后利用页面块与分割条之间的位置关系生成新的检测条。
3) 利用分隔条的权值重构语义块, 沿着分隔条从低到高的方向进行迭代合并, 这样最终将网页分割成主题相关性很高的块的集合。
1) 节点分割。将网页映射为DOM树, 根据当前DOM节点的信息以及子节点信息进行节点分割, 完成信息块提取。
2) 检测分割条。首先利用网页的初始坐标和终止坐标作为初始化分隔条, 然后利用页面块与分割条之间的位置关系生成新的检测条。
3) 利用分隔条的权值重构语义块, 沿着分隔条从低到高的方向进行迭代合并, 这样最终将网页分割成主题相关性很高的块的集合。
上一篇:企业网站建设模型加载器
下一篇:企业网站建设HTML5的表单新特性