pymysql

Python3 爬虫之 Scrapy 核心功能实现(二)

做~自己de王妃 提交于 2020-04-26 07:31:37
博客地址: http://www.moonxy.com 基于 Python 3.6.2 的 Scrapy 爬虫框架使用,Scrapy 的搭建过程请参照本人的另一篇博客: Python3 爬虫之 Scrapy 框架安装配置(一) 1. 爬虫项目创建 在抓取之前,需要新建一个 Scrapy 工程。进入一个你想用来保存代码的目录,比如 G:\projects 然后执行: scrapy startproject SinanewsSpider 这个命令会在当前目录下创建一个新目录 SinanewsSpider,这就是此爬虫的项目名称,后面会使用到。 成功创建爬虫项目文件结构后,使用:tree /f 查看文件层级的结构关系 这些文件主要是: scrapy.cfg: 项目配置文件 SinanewsSpider/: 项目python模块, 代码将从这里导入 SinanewsSpider/items.py: 项目items文件 SinanewsSpider/pipelines.py: 项目管道文件 SinanewsSpider/settings.py: 项目配置文件 SinanewsSpider/spiders: 放置spider的目录 2. 定义item 编辑 items.py 文件,items 是将要装载抓取的数据的容器,它工作方式像 python 里面的字典,但它提供更多的保护

Python连接MySQL数据库之pymysql模块使用

心已入冬 提交于 2020-04-25 15:18:59
Python3连接MySQL 本文介绍Python3连接MySQL的第三方库--PyMySQL的基本使用。 PyMySQL介绍 PyMySQL 是在 Python3.x 版本中用于连接 MySQL 服务器的一个库,Python2中则使用mysqldb。 Django中也可以使用PyMySQL连接MySQL数据库。 PyMySQL安装 #终端中安装pymysql pip install pymysql python3.6 使用 pymysql 连接 Mysql 数据库及 简单的增删改查操作 折腾好半天的数据库连接,由于之前未安装 pip ,而且自己用的python 版本为3.6. 只能用 pymysql 来连接数据库,(如果有和我一样未安装 pip 的朋友请 点这里http://blog.csdn.net/qq_37176126/article/details/72824404 ),下边 简单介绍一下 连接的过程,以及简单的增删改查操作。 1.通过 pip 安装 pymysql 进入 cmd 输入 pip install pymysql 回车等待安装完成; 安装完成后出现如图相关信息,表示安装成功。 连接数据库 MySQL 连接 使用mysql二进制方式连接 您可以使用MySQL二进制方式进入到mysql命令提示符下来连接MySQL数据库。 实例

pymysql:Mysql拒绝从远程访问的解决办法

对着背影说爱祢 提交于 2020-04-25 15:18:40
pymysql:Mysql拒绝从远程访问的解决办法 pymysql连接数据库 # 导入pymysql模块 import pymysql # 连接database conn = pymysql.connect( host="192.168.1.1", user="root", password="password", db ="test", charset ="utf8") # 得到一个可以执行SQL语句的光标对象 cursor = conn.cursor() # 执行完毕返回的结果集默认以元组显示 # 得到一个可以执行SQL语句并且将结果作为字典返回的游标 # cursor = conn.cursor(cursor=pymysql.cursors.DictCursor) # 定义要执行的SQL语句 sql = "select * from account" # 执行SQL语句 cursor.execute(sql) # 关闭光标对象 cursor.close() # 关闭数据库连接 conn.close()    报错内容 Traceback (most recent call last): File "C:/Pycham/Mysql/test.py", line 10, in <module> charset ="utf8") File "C:\Pycham\venv\lib

pymysql_mysql密码重置方法,连接局域网数据库的解决办法

纵饮孤独 提交于 2020-04-25 14:32:45
https://blog.csdn.net/qq_37176126/article/details/72824106 pymysql模块的操作 https://blog.csdn.net/skh2015java/article/details/80156278 ubuntu系统下mysql重置密码和修改密码操作 一、允许root用户在任何地方进行远程登录,并具有所有库任何操作权限, 具体操作如下: 在本机先使用root用户登录mysql: mysql -u root -p " youpassword " 进行授权操作: mysql >GRANT ALL PRIVILEGES ON *.* TO ' root ' @ ' % ' IDENTIFIED BY ' youpassword ' WITH GRANT OPTION; 重载授权表: FLUSH PRIVILEGES; 退出mysql数据库: exit 二、允许root用户在一个特定的IP进行远程登录,并具有所有库任何操作权限,具体操作如下:   在本机先使用root用户登录mysql: mysql -u root -p " youpassword " 进行授权操作: GRANT ALL PRIVILEGES ON *.* TO root@ " 172.16.16.152 " IDENTIFIED BY "

mysql 练习 和链接 pymysql 练习题

你离开我真会死。 提交于 2020-04-24 17:44:53
python操作数据库 1. 查询student表的所有记录 2. 查询student表的第2条到第4条记录 3. 查询所有学生的学号(id)、姓名(name)和报读课程(department)的信息 4. 删除305班年龄最小的学生 5. 修改id为66的学员的姓名为男 SQL语句编写 1. 查询Django课程和Django项目的所有学生的信息[学号,姓名,年龄,成绩] 2. 查询id=5的老师的所有学生信息[学号、姓名、年龄] 3. 查询306班、307、308班中成绩及格的学生 4. 查询python成绩及格的所有学生信息[学号、姓名、年龄、班级] 5. 查出所有女生的平均成绩和报读课程。 6. 查询出女生人数最多的5个课程。 7. 查询出报读flask课程的学生中女生的数量 8. 查询出 赵华 报读的课程信息[ 上课老师名字,课程分数,平均分 ] 最后的平均分还不知道怎么解决.. 9.查出 401 班所有学生的 平均分和总分[分组查询]。 10.查出报读了flask、django课程中年龄在21到23岁之间的所有男生的成绩 11.查处总分在200分以上的所有学生的姓名、班级 来源: oschina 链接: https://my.oschina.net/u/4397620/blog/3619336

刨根问底,完美解决Django2版本连接MySQL报错的问题

ぃ、小莉子 提交于 2020-04-23 03:28:14
引子 关于Django2版本连接MySQL发生的问题以及修改源码的解决方法参考下面这篇文章: Django与MySQL的交互 但是,上面这种修改源码的方法在生产环境中使用的话会有很多问题。 本文为大家详细讲解如何在不修改Django源码的情况下解决这个问题。 Django中的源码解析 我们来看一下我们使用的Python解释器(可以是全局的也可以是虚拟环境的)中django包有关MySQL配置的源码。 源码位置是: (你的Python解释器安装目录或者虚拟环境目录)\django21\Lib\site-packages\django\ db\backends\mysql\ base .py 这个base.py文件中的内容有点多,我们把最关键的部分挑出来解释一下: """ MySQL database backend for Django. Requires mysqlclient: https://pypi.org/project/mysqlclient/ # 之前没安装的话得从pypi中下载mysqlclient包 """ import re from django.core.exceptions import ImproperlyConfigured from django.db import utils from django.db.backends import utils

你不会Python这几个库,不要说你会爬虫

老子叫甜甜 提交于 2020-04-22 00:58:50
很多朋友不知道Python爬虫怎么入门,怎么学习,到底要学习哪些内容。今天我来给大家说说学习爬虫,我们必须掌握的一些第三方库。 废话不多说,直接上干货。 这里要注意:不管你是为了Python就业还是兴趣爱好,记住:项目开发经验永远是核心,如果你没有2020最新python入门到高级实战视频教程,可以去小编的Python交流.裙 :七衣衣九七七巴而五(数字的谐音)转换下可以找到了,里面很多新python教程项目,还可以跟老司机交流讨教! 请求库 1. requests GitHub:https://github.com/psf/requests requests库应该是现在做爬虫最火最实用的库了,非常的人性化。有关于它的使用我之前也写过一篇文章 一起看看Python之Requests库 ,大家可以去看一下。 有关于requests最详细的使用方法,大家可以参考官方文档:https://requests.readthedocs.io/en/master/ 小案例 >>> import requests >>> r = requests.get( 'https://api.github.com/user', auth=( 'user', 'pass')) >>> r.status_code 200 >>> r.headers[ 'content-type'] 'application

【趣味案例】Python命令行实现—查全国7天天气

杀马特。学长 韩版系。学妹 提交于 2020-04-21 18:30:51
为什么要爬天气呢?1.可以练练手2.利用itchat库实现自动回复功能后,把查天气的功能集成起来,实现微信自助查天气功能! 首先,还是相似的套路,我们看看能不能在官网上直接抓包(XHR)来获取一个通用API。然后直接用API查询就OK?在百度搜关键词【天气】或者【南京天气】会跳出对应的网页: http://www.weather.com.cn/weather/101190101.shtml.点进去,可以看到相应城市下一周的天气情况: 再换一个城市上海,我们发现,浏览器地址变为: http://www.weather.com.cn/weather/101020100.shtml。原来101020100这串数字对应着相应城市的代码。我们来分析下页面上XHR请求,看看有没有直接抓包的可能 ? 经过谷歌浏览器——检查-Networt-XHR-刷新,发现并没有XHR请求,看来我们需要的天气内容和城市代码,可能是包含在页面中经过JS和服务器处理后呈现的.....好吧,尝试失败! 再看一下JS请求,发现太多了,无力去逐一查看!所幸网上有人早已记录下了所有城市对应的城市代码。我把拷贝了一下,存到了本地mysql,数据在百度云上,需要的可以自行下载下,执行SQL即可直接把SQL表和数据一并建好。 https://pan.baidu.com/s/1kXaN2Aj 密码是:8y6n。 好了

Python全栈 MySQL 数据库 (简述 、安装、基本命令)

邮差的信 提交于 2020-04-21 04:02:38
ParisGabriel 每天坚持手写 一天一篇 决定坚持几年 为了梦想为了信仰   开局一张图 一个月的python已经结束了 下面就是数据库了 先说MySQL 这个数据库应该差不多是用户量最多的了 MySQL概述: 1.什么是数据库:      存储数据的厂库 2.有哪些公司在用数据库    金融 机构、 游戏 网站、 购物 网站、 论坛 网站... 3.提供 数据库 服务的 软件 :     1.软件的分类:        MySQL、Oracle、SQL_Server、DB2、MongoDB、MariaDB     2.生产环境中,如何 选择 使用哪些 数据库 软件:        1.是否开源         1.开源软件:MySQL、Mariadb、MongoDB         2.商业软件:Oracle、DB2、SQL_Server        2.是否跨平台         1.不过平台:SQL_Server         2.跨平台:......         3.公司的类型:      商业软件 :政府部门、金融机构      开源软件 :游戏网站、购物网站、论坛网址站 4.MySQL的特点:    1.关系型数据库     1.关系型数据库的特点       1.数据是 以行和列 ( 表格 )的形式 存储的       2.表格到的每 一行是一条记录

制作CVPR 热词云(并爬取pdf地址 名称)

淺唱寂寞╮ 提交于 2020-04-18 12:16:12
任务目标: 1.结对开发 2.完成论文的题目、摘要、关键词、原文链接四项内容爬取; 3.存储到本地数据库中 4.按照题目、关键词分类统计得到最热的十个领域方向 (完成的任务和目标有出入) 爬取的python 代码: # !/usr/bin/python #这里是解释器位置和python版本 # -*- coding: utf-8 -*- #编码格式 """ @author: CuiXingYu @contact: a15931829662@163.com @software: PyCharm @file: CVPR.py @time: 2020/4/17 19:36 """ import re import requests import pymysql def get_context(url): """ params: url: link return: web_context """ web_context = requests.get(url) return web_context.text def get_conn(): """ 建立数据库连接 :return: """ conn = pymysql.connect( # 本机IP地址 host= ' 127.0.0.1 ' , # 数据库用户名 user= ' root ' , # 密码 password= '