Scrapy+Selenium 获取iframe下的document
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 需求 :获取iframe h3 下的标题, img 的源,及 a 标签的落地页 需要先熟悉Selenium的同学: 点击学习 使用xpath获取iframe下的内容为空,如图 <iframe data-v-5a33f2b6="" id="preview-iframe-18769" class="idea-preview-iframe" style="height: 259.817px;" frameborder="0"></iframe> 可采用 execute_script 运行js获取,获取iframe下的document使用 [iframe标签].contentWindow.document # 当前iframe有多个,而且id是动态的。首先找到id temp_iframe_id = box.xpath('.//td[3]/div/div/div/iframe/@id').extract()[0] # 广告落地页 重试三次 因为是动态渲染,可能存在未渲染结束问题 for i in range(0, 3): try: item['landing_page'] = self.browser.execute_script( 'return document.getElementById("' + temp