新岁佳节新气象,文书档案更新继续~

往列表里寄放数据先进后出(左进)

道理当然是那样的以为不妨可写的,因为网络那东西生机勃勃搜一大把,但是爬虫毕竟是python的一个大亮点,不说说认为对不起那玩意儿
基本功点来讲,python2写爬虫着重须求七个模块,urllib和urllib2,其实还只怕有re
先介绍下模块的局地常用功用
urllib.urlopen(”)
#开荒八个网站,只是打开,和open差不离
urllib2.Request(url)
#分析网站,这么些能够轻易,具体不是很懂,一些作用,比方加head头什么的也急需接纳那一个
urllib.urlretrieve(url,filename)
#下载用,把url提供的东西down下来,并用filename保存
举个蜂鸟爬图片的事例,上边上伪代码:

生机勃勃、什么是运算符?

lpush  names  A  B C D E

1、url解析
2、打开url
3、读取url,就是read()
4、使用re.findall找到所有和图片有关系的地址,这里只jpg
5、循环下载

前边我们有定义过变量,变量是用来积攒数据的,存款和储蓄的数据是为了运算,运算就能够利用到运算符

 

图片 1

举个简易的例证 4 +5 = 9 
例子中,4 和 5 被称为操作数,”+” 称为运算符。

往列表里存放数据后进先出(右进卡塔尔

看图上,图片链接格式是src=”
剖判之后前面包车型客车事就好办了,上面上代码

 

rpush names  G P H K

import urllib
import urllib2
import re

#处理地址,并获取页面全部的图片地址
def get_image_url(url):
  #url_format = urllib2.Request(url) #1
  url_open = urllib.urlopen(url) #2
  url_read = url_open.read() #3
  re_value = re.compile('(?<=src\=\").*?\.jpg')
  image_url_list = re.findall(re_value,url_read) #4
  return image_url_list

#这个函数专门用来下载,前面两行是将图片连接中/前面的内容全部删除,留下后面的文件名用来保存文件的,try不说了,不清楚请翻回去看容错
def down_image(image_url):
  rev = '^.*/'
  file_name = re.sub(rev,'',image_url)
  try:
    urllib.urlretrieve(image_url,file_name)
  except:
    print 'download %s fail' %image_url
  else:
    print 'download %s successed' %image_url

if __name__ == '__main__':
  url = 'http://bbs.fengniao.com/forum/10384633.html'
  image_url_list = get_image_url(url)
  for image_url in image_url_list:
    down_image(image_url) #5

Python语言补助以下种类的运算符:

 

困死,睡觉去。。。。。有的时候间再说说翻页什么的,就能够爬网址了

  • 算术运算符
  • 比较(关系)运算符
  • 赋值运算符
  • 逻辑运算符
  • 位运算符
  • 成员运算符
  • 地点运算符
  • 运算符优先级

查看列表里面包车型客车多少:

 

接下去让大家三个个来学习Python的运算符。

lrange names 0(从0开始)  -1

 

切片:

二、Python算术运算符

lrange names  start  end(start end 代表开端和得了地点)

以下假设变量a为10,变量b为21:

 

图片 2

插入:

示例1:

linsert names  BEFORE/AFTETucson  D(标杆正是插到哪个地方)  TEST

print(100+200)

修改:

print(100-200)

lset names 3 xiaopang

print(100*200)

删除:

print(10/3)  #除法直接除是取小数的.javac#一向除是取整数

lrem name 3 xiaopang

print(round(10/3,2))  #透过round函数实现

 

print(“%.2f”% (10/3))  #基本格式化输出

从列表侧边移除:

print(“{:.2f}”.format(10/3))  #format格式化输出

lpop names

print(10//3)  #取整数

 

print(10%3)

除下标1-2其余数据都移除:

print(3**4)  #结果是3\3*3*3*

LT路虎极光IM names 1 2(下标地点卡塔尔国

 

 

演示:

names最后叁个数量,插入到names2的首先个岗位:

图片 3

RPOPLPUSH  names  names2

 

 

 

去除列表数据:

示例2:

BLPOP  names
4(未有数据就等4秒,有数量就能够突显,等待的时候能够三番两遍往里放多少卡塔 尔(阿拉伯语:قطر‎

输入一个几人数,然后输出每种岗位的数字, 举例:719,显示如下:

 

百位数字:7十二位数字:1个位数字:9

 把names里的最后二个数量,放到names2的率先个地方:

 

BRPOPLPUSH names names2 40

#方法01:

num = int(input(“请输入二个二个人数:”))

hundreds = num // 100

tens = num % 100 // 10

ones= num % 10

print(“四人数{0}的百位数{1},拾个人数{2},个位数{3}”.format(num,
hundreds, tens, ones))

 

#方法02:

num = input(“请输入一个三人数:”)

print(“叁人数{0}的百位数{1},11个人数{2},个位数{3}”.format(num,
num[0], num[1], num[2]))

 

 

扩充示例:

a=10

b=20

if(a andb):

发表评论

电子邮件地址不会被公开。 必填项已用*标注