网页解析器:从网页中提取有价值数据的工具 html网页字符串->网页解析器->价值数据和新url列表 有几种网页解析器 正则表达式html.parserbeautifulSouplxml 正则是模糊匹配,另外三种是结构化解析 结构化解析-DOM(Document Object Model)树