设本站为首页 | 添加到收藏夹

365bet官方

我要投稿

资源搜索：

| | | | | | | |

您当前的位置：365bet官方 -> 技术教程 -> 办公软件教程 -> 教程内容

[ 收藏本页教程 ]

用python来为自己办事-抓取网页内容用python来为自己办事-抓取网页内容

教程作者：佚名教程来源：不详教程栏目：办公软件教程收藏本页

每天早上都要听美国总统电台演说，都没有保存资料。昨天上班上的郁闷特写一个python脚本自动抓取并保存该资料,python真是强大。从学到整个东西写完只用了1个多小时，去掉页面上的大量广告，只留下所需信息，自动保存为html文件。程序很简单，就不错说了看代码

import sys,urllib
url="http://www.putclub.com/html/radio/VOA/presidentspeech/index.html"
wp = urllib.urlopen(url)
print "start download..."
content = wp.read()
print content.count("center_box")
index = content.find("center_box")
content=content[content.find("center_box")+1:]
content=content[content.find("href="/html/jishu515)+7:content.find(.html"target")-2]
filename = content
url ="http://www.putclub.com/"+content
print content
wp = urllib.urlopen(url)
print "start download..."
content = wp.read()
#print content
print content.count("<div class=\"content\"")
#content = content[content.find("<div class=\"content\""):]
content = content[content.find(""):]
content = content[:content.find("<div class=\"dede_pages\"")-1]
filename = filename[filename.find("presidentspeech")+len("presidentspeech/"):]
filename = filename.replace('/',"-",filename.count("/"))
fp = open(filename,"w+")
fp.write(content)
print content

发表于： 2009-12-18 ，修改于： 2009-12-18 16:44，已浏览67次，有评论0条推荐投诉

网友评论
发表评论
此博文原地址为：http://blog.chinaunix.net/u3/93893/showart_2125208.html

上一篇：在Word 2003中快速去掉页眉横线

下一篇：Word 2007使用“智能标记”的技巧

【加入收藏】【告诉好友】【大中小】【打印此文】【回到顶部】【关闭窗口】

数据库教程病毒防治教程网络安全教程服务器网络软件开发教程网站建设教程操作系统教程办公软件教程软件教程

· office办公软件_office办公软件教程

· office 办公软件教程

· 办公软件自学教程_办公软件教程

· 在Word2010表格中快速精确查找中文信息

· 在Word 2007中精确裁剪图片技巧

· 在Word 2007文档中为图片重新着色

· 在Word 2007文档中设置图片棱台效果

· 妙用Word分隔符轻松打印超宽图片

· 将Word正文中的注释批量转换为脚注

· 让Word 2007自动压缩图片保存减小文件

· 设置保护文档禁止未授权用户编辑Word

· Word视频教程：插入和播放Flash的技巧

· Word2007教程：在Word文档中编辑剪贴画

· Word2007技巧：教你全文替换半角引号的

· Word教程：教你用函数实现数据计算

本周热门教程

如何在word文档中加进参考文献的标注？

Word中繁体艺术字的两种制作方法

Word2007中怎么样完成多级自动编号？

office办公软件_office办公软件教程

在WPS Office中快速制作田字格

办公软件自学教程_办公软件教程

Excel操作技巧

office 办公软件教程

WORD中经常出现的小问题的解决方法

制作漂亮的Word组织结构图

妙用Word分隔符轻松打印超宽图片

一步搞定　EXCEL数据统计错误信息

教你手动制作Office 2007精简版

Word试卷瘦身记：有效缩减文件体积

Word宏命令巧妙应用一例

在WPS Office中快速制作田字格

用Excel宏命令快速处理学生成绩

制作漂亮的Word组织结构图

如何在word文档中加进参考文献的标注？

办公软件自学教程_办公软件教程

巧用Excel：利用身份证号码提取个人信息

使用Web查询同步更新Excel数据

Word中繁体艺术字的两种制作方法

Word2007中怎么样完成多级自动编号？

用Excel制作自动记录的考勤表

回归毛笔时代--在Word中设计个性字帖DIY

用python来为自己办事-抓取网页内容用pytho

合用Word XP与Excel XP批量打印信封

office 办公软件教程

在Word中制作试卷密封线

我要投稿 - 广告合作 - 关于本站 - 友情连接 - 网站地图 - 联系我们 - 版权声明 - 设为首页 - 加入收藏 - 网站留言

Copyright © 2009 - 20012 www.www.ct131.com All Rights Reserved.365bet官方版权所有