【应对网页图片懒加载】
原文: http://blog.gqylpy.com/gqy/358 " 图片懒加载概念 图片懒加载是一种网页优化技术。图片作为一种网络资源,在被请求时也与普通静态资源一样,将占用网络资源,而一次性将整个页面的所有图片加载完,将会大大增加页面的首屏加载时间。为了解决这个问题,通过前后端配合,使图片仅在浏览器当前视窗内出现时才加载该图片,达到减少首屏请求数的技术就被成为“图片懒加载”。 网站一般如何实现图片懒加载技术呢? 在网页源码中,在img标签中首先会使用一个“伪属性”(通常使用src2,original...)来存放真正的图片链接,而并非存放在src属性中。当图片出现到页面的可视化区域中时,会动态将伪属性替换成src属性,完成图片的加载。 实例:Python爬虫抓取站长素材网中的图片 import os import requests from lxml import etree import urllib.request from fake_useragent import UserAgent as ua from concurrent.futures import ThreadPoolExecutor # 站长素材网 url = 'http://sc.chinaz.com/tupian/gudianmeinvtupian.html' headers = { 'User