类
python的类和php的类不同,但也有相似的地方
#类名不能以数字开头 尽量使用驼峰式命名规范
class Make_Plane(object):
#属性(变量)
#color = "green"
#wheelNum = 3
#魔法方法 __init__方法相当于php中的构造方法类被实例化时调用
#当方法有被定义后,第一个形参被定义为self,self代表类本身
def __init__(self,COLOR,WHELLNUM):
self.color = COLOR
self.wheelNum = WHELLNUM
#方法(函数)
def move(self):
print("起飞了")
def getPlaneInfo(self):
print("轮胎数量%d,飞机颜色%s" %(self.wheelNum,self.color))
爬虫
import urllib.request
import re
class GetHtml(object):
#填入url和ua信息,ua信息用于伪装正常的请求
def __init__(self,URL,HEAD):
self.url = URL
self.head = HEAD
def get_index(self):
#定义url
self.request = urllib.request.Request(self.url)
#伪造ua
self.request.add_header("user-agent",self.head)
#发送请求获取html代码
self.response = urllib.request.urlopen(self.request)
return self.response.read()
#根据获得信息通过正则匹配出图片链接拼接后存入列表
def get_list(self):
#定义空列表
self.strimglist = []
#re.findall根据获取的html代码,找出规则,使用正则匹配图片链接
self.imglist = re.findall(b"style/\w{60}.jpg",self.get_index())
for i in self.imglist:
#拼接链接存入列表
self.strimglist.append(self.url+str(i,encoding="utf8"))
return self.strimglist
#读取列表访问图片,获取到的字节存入本地
def get_image(self):
num = 0
for self.url in self.get_list():
num += 1
with open(str(num)+".jpg","wb") as f:
f.write(self.get_index())
html = GetHtml("http://10.10.10.209/","Mozilla/5.0 (Windows NT 8.1; \
Win32; x32; rv:65.0) Gecko/20100101 Firefox/65.0")
html.get_image()
最后一次更新于2021-01-16 12:44
0 条评论