博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python练习程序(得到HTML文件的title)
阅读量:7099 次
发布时间:2019-06-28

本文共 678 字,大约阅读时间需要 2 分钟。

from HTMLParser import HTMLParserimport sysclass TitleParser(HTMLParser):    def __init__(self):        self.title = ''        self.readingtitle=0        HTMLParser.__init__(self)    def handle_starttag(self, tag, attrs):        if tag == 'title':            self.readingtitle=1    def handle_data(self, data):        if self.readingtitle:            self.title +=data    def handle_endtag(self, tag):        if tag == 'title':            self.readingtitle=0    def gettitle(self):        return self.titlefd=open(sys.argv[1])tp=TitleParser()tp.feed(fd.read())print "Title is: ", tp.gettitle()

参考:Python网络编程基础。

转载于:https://www.cnblogs.com/tiandsp/archive/2012/06/14/2549147.html

你可能感兴趣的文章
对linux安全设置中需要注意和掌握的地方
查看>>
HDFS-Architecture剖析
查看>>
百花齐放,繁荣和瓶颈同在,2016年VR AR产业梳理
查看>>
Jira 6.3.6使用openldap进行认证——方法一
查看>>
项目经理成长日记(10)——百万大侠,能否推敲
查看>>
oracle之 SYSAUX表空间维护
查看>>
thinkphp-条件判断-范围判断-in与else
查看>>
搜狗智能联想输入法,背后的运维又是如何智能的?
查看>>
就绪IT平台 走进智能企业——智能化浪潮中的领军者大型系列报道
查看>>
Shader的函数公式以及使用的场景
查看>>
3Python全栈之路系列之D
查看>>
js self = this的解释
查看>>
用jekyll制作高大上的网站(一)——安装与配置
查看>>
linux基础--vim编辑器
查看>>
前端网络、JavaScript优化以及开发小技巧
查看>>
nbd网络块设备使用教程
查看>>
gbk与utf-8字符串无乱码截取
查看>>
Linux学习之CentOS(三)--初识linux的文件系统以及用户组等概念
查看>>
linux下varnish4安装
查看>>
聊聊php定时计划任务
查看>>