当前位置: 首页 > news >正文

电力建设监理招聘网站网站销售怎么推广

电力建设监理招聘网站,网站销售怎么推广,网站中滚动条怎么做,免费的招聘平台有哪些目录 一.urllib导入 二.urllib爬取网页 三.Headers属性 1.使用build_opener()修改报头 2.使用add_header()添加报头 四.超时设置 五.get和post请求 1.get请求 2.post请求 urllib库和request库作用差不多,但比较起来request库更加容易上手,但该了…

目录

一.urllib导入

二.urllib爬取网页

三.Headers属性

 1.使用build_opener()修改报头

2.使用add_header()添加报头

四.超时设置

五.get和post请求

1.get请求

2.post请求


urllib库和request库作用差不多,但比较起来request库更加容易上手,但该了解的还是要了解了解

一.urllib导入

        urllib库的安装不用多说,终端命令:pip install urllib,导入方法如下:

import urllib.request

二.urllib爬取网页

        urllib提供了一个打开访问网页的函数urlopen(),然后我们在本地创建一个保持该网页的文档,将该网页写入文档中,就实现了简简单单的网页源码的保存,例如保存百度的网页源码:

 

注意:保存文件可以用上面的方式,也可以用

urllib.request.urlretrieve(url,filename)

三.Headers属性

        网页为了防止被恶意采集进行了一些反爬虫设置,设置了headers就利用模拟浏览器去正常访问,多的我们就不赘叙,设置headers属性有两个方法:

 1.使用build_opener()修改报头

        自己浏览器headers不会看的先自己了解,不多说,看码

import urllib.request#访问网页的header,每个人的不一样,这个是我的
header={'User_Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.41'
}
#修改header
opner=urllib.request.build_opener()
opner.addheaders=[header]
#打开百度网页
urllib=urllib.request.urlopen('https://www.baidu.com').read()#‘wb’以二进制格式打开文件
file=open('baidu.html','wb')
file.write(urllib)
#关闭文件
file.close()

2.使用add_header()添加报头

        add_header简单多了,例如上面的代码可以改成如下:

import urllib.requesturl="https://www.baidu.com"
req=urllib.request.Request(url)
#添加报头
req.add_header( 'User_Agent','Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.41')#打开百度网页
urllib=urllib.request.urlopen(url).read()#‘wb’以二进制格式打开文件
file=open('baidu.html','wb')
file.write(urllib)
#关闭文件
file.close()

四.超时设置

        如果访问一个网页,且长时间没有得到反应,这个时候超时设置就会自动断开对网页的访问,函数timeout()

#超时设置10秒
file=urllib.request.urlopen("https://www.baidu.com/",timeout=10)

五.get和post请求

        HTTP请求协议有6种:GET  ,POST  ,PUT  ,DELETE  ,HEAD  ,OPTIONS, 这里不解释其他四种请求了

1.get请求

        GET请求:get请求会通过URL网址传递信息,可以直接在URL中写上要传递的信息,也可以由表单进行传递

在urllib中个get请求这样:注意请求的参数

urllib.request.Request("https://www.baidu.com/s?wd=value")

2.post请求

post请求:向服务器提交数据

        对与post请求常常用在表单的提交,实现的思路是在get请求中添加要post的参数,所有要构建表单并用urllib.parse.urlencode对数据进行编码处理

例如:post登录界面部分代码:

#编码数据
postdata=urllib.parse.urlencode({"username":"myun","pass":"******"
})
#将数据传入get请求
urllib.request.Request(url,postdata)

注意:再随便提提异常处理urllib.error.URLError和urllib.error.HTTPError,前者是后者的父类

urllib.error.URLError产生的原因:

1.连接不上服务器        2.远程URL不存在        3.无网络        4.触发了HTTPError

HTTPError产生主要是没有模拟浏览器访问或某些网址反爬虫技术高超

http://www.hotlads.com/news/6452.html

相关文章:

  • 海口网站建设方案报价南宁seo网络优化公司
  • 怎么仿网站链接集合竞价口诀背熟6句
  • 国际交友网站怎么建设seo网站页面优化包含
  • 网站办公室ks刷粉网站推广马上刷
  • 网站盈利模式google seo是什么啊
  • 团购网站自个做广东深圳疫情最新
  • 动态网站 seo营销策划公司是干什么的
  • 如何做淘宝商城网站百度网站排名
  • 安徽省工程建设网站高权重友情链接
  • 怎样做网站文件验证网站排名软件推荐
  • 网站收录怎么弄广告营销平台
  • 网站开发项目管理短视频推广app
  • 网站改版不换域名怎么做万能bt搜索引擎网站
  • 网站本地化怎么做合肥网络优化公司有几家
  • 智慧团建手机版登录注册入口西安分类信息seo公司
  • 做男鞋的网站好企业网站的在线推广方法有
  • 重庆住房城乡建设厅网站首页app推广软件
  • 网站首页被k怎么办谷歌浏览器下载手机版安卓
  • 求职网站建设方案google网站推广
  • 住房与城乡建设部网站职责seo推广公司招商
  • 贵阳企业建站系统模板痘痘怎么去除有效果
  • 诸城网站制作关键词优化seo公司
  • wap网站开发流程精准引流的网络推广方法
  • 网站建设工作自查报告自媒体引流推广
  • wordpress备份数据北京网站优化经理
  • 酒泉网站建设有限公司如何在百度发广告
  • 关于网站建设的报告广告推广平台网站
  • 在黄石做政府网站关键词上首页的有效方法
  • 网站搭建培训学校佛山网站建设解决方案
  • 深圳 网站建设爱站网工具