药物不良反应数据库信息的下载
需求:如图,我想把不良反应数据库中的每个药品的不良反应相关信息给获取到 点击详细信息之后 分析页面请求,发现是ajax请求, 第一步,我们需要获取详细页面的url,也就是药品ID 第二步,拿到详细页面的url,下载页面 第三步,提取页面中的适应症和不良反应,并将数据写入文件 代码 # -*- coding: utf-8 -*- """ @Datetime: 2019/1/11 @Author: Zhang Yafei """ import json import numpy import os from gevent import monkey monkey.patch_all() import gevent from urllib.parse import urljoin import pandas as pd import requests from concurrent.futures import ThreadPoolExecutor from lxml.etree import HTML url_list = [] drug_list = [] def task(page): origin_url = 'http://pharm.ncmi.cn/dataContent/dataSearch.do?did=6' headers = {'User-Agent':