对html的解析是网页抓取的基础,分析抓取的结果找到自己想要的内容或标签以达到抓取的目的。
HTMLParser是python用来解析html的模块。它可以分析出html里面的标签、数据等等,是一种处理html的简便途径。 HTMLParser采用的是一种事件驱动的模式, 当HTMLParser找到一个特定的标记时,它会去调用一个用户定义的函数,以此来通知程序处理。 它主要的用户回调函数的命名都是以handler_开头的,都是HTMLParser的成员函数。当我们使用时,就从HTMLParser派生出新的类,然后重新定义这几个以handler_开头的函数即可。
代码如下:
执行结果:
Original: https://www.cnblogs.com/Before/p/5523903.html
Author: lzc_jack
Title: python学习(解析python官网会议安排)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/612146/
转载文章受原作者版权保护。转载请注明原作者出处!