sqlserver

Python-Scrapy抓取百度数据并分析

梦想与她 提交于 2021-01-03 15:47:22
抓取智联招聘和百度搜索的数据并进行分析,使用visual studio编写代码mongodb和SQLServer存储数据。使用scrapy框架结合 selenium爬取百度搜索数据,并进行简要的数据的分析!! 爬取前的页面分析: 打开百度搜索页面,并查看网页源代码,问题便出现,无法查看到页面源代码,如下,只是返回一个状态说明,这时可以确定页面数据是动态生成,常规的爬取行不通。 在浏览器中进行调试分析,可以发现需要定位使用的html元素,通过这一步至少可以将以下两个元素的XPATH或CSS Selector的表达式求解出来。 制定爬取方案 既然搜索页面的内容是动态生成,常规的http请求后无法获取数据,针对这种问题的解决方法: l 通过抓包工具,进行对http请求进行分析,找到实际数据请求的js代码后进行模拟请求获取数据,这种方法耗时耗力,且是无法适应页面更改的情况。 l 通过浏览器框架请求,并编写程序和浏览器通信获取数据分析,对于这种方法的选择有很多,如在windows上可以使用IE Browser控件,其他的可以使用其他内核的浏览器,这种方法的缺点是速度较慢。 l 这里选取的方法是使用 Selenium + Phantomjs的方法,这个结合scrapy也算是较为经典的一种方法。并且 Selenium + Phantomjs 也是作为Web应用程序进行自动化测试的一套方案。 l

PageHelper 分页插件

混江龙づ霸主 提交于 2021-01-02 12:02:40
< dependency > < groupId > com.github.pagehelper </ groupId > < artifactId > pagehelper </ artifactId > < version > 5.1.8 </ version > </ dependency > < dependency > < groupId > com.github.pagehelper </ groupId > < artifactId > pagehelper-spring-boot-autoconfigure </ artifactId > < version > 1.2.10 </ version > </ dependency > < dependency > < groupId > com.github.pagehelper </ groupId > < artifactId > pagehelper-spring-boot-starter </ artifactId > < version > 1.2.10 </ version > </ dependency > mybatis分页需要引入的依赖 最近看到分页插件pageHelper 会有效率问题 大多数人跟我一样,最开始接触PageHelper的时候,都被 超级方便的分页操作 吸引 有多方便? public

在Windows Server 2008服务器上安装SQL Server 2008 R2 .

主宰稳场 提交于 2021-01-01 01:57:18
准备服务器 阿里云服务器配置 登录服务器 使用远程桌面登录 Windows Server 2008 安装前的准备工作 下载 SQL Server安装程序 下载Microsoft SQL Server2008 R2 RTM - Express with Management Tools http://www.microsoft.com/en-us/download/details.aspx?id=23650 选择x64版本 安装SQL Server 2008 R2 1 、 双击运行下载的 SQL Server 安装程序 SQLEXPRWT_x64_CHS .exe 。 2 、弹出如下对话框,点击“确定”。 3 、打开SQLServer安装中心,在右边选择“全新安装或向现有安装添加功能”。 4 、SQL Server开始安装准备。 5 、在“许可条款”中选择“我接受许可条款”,然后“下一步”。 6 、安装程序支持文件。在下面的界面中点击“安装”来安装程序的支持文件。 7 、安装程序支持规则进行检查,对于没有通过的项进行修改,以符合支持规则。全部通过后点击“下一步”。 8 、进行功能选择。根据需要选择功能,然后点击“下一步”。 9 、安装程序开始进行安装规则检查。通过后点击“下一步”。 10 、在“实例配置”中指定实例的名称和实例安装的位置。 11 、安装程序开始检查磁盘空间是否满足要求

百万级数据库优化方案

老子叫甜甜 提交于 2020-12-31 09:11:07
网上关于SQL优化的教程很多,但是比较杂乱。近日有空整理了一下,写出来跟大家分享一下,其中有错误和不足的地方,还请大家纠正补充。 这篇文章我花费了大量的时间查找资料、修改、排版,希望大家阅读之后,感觉好的话推荐给更多的人,让更多的人看到、纠正以及补充。 1.对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null 最好不要给数据库留NULL,尽可能的使用 NOT NULL填充数据库. 备注、描述、评论之类的可以设置为 NULL,其他的,最好不要使用NULL。 不要以为 NULL 不需要空间,比如:char(100) 型,在字段建立时,空间就固定了, 不管是否插入值(NULL也包含在内),都是占用 100个字符的空间的,如果是varchar这样的变长字段, null 不占用空间。 可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: select id from t where num = 0 3.应尽量避免在 where 子句中使用 != 或 <> 操作符,否则将引擎放弃使用索引而进行全表扫描。 4.应尽量避免在 where

【程序源代码】Activiti6+java+oa开发框架系统

北战南征 提交于 2020-12-29 07:34:40
关键字:基于Springboot后台,前台vue.js跨域前端,Activiti6工作流的开发框架;是一个非常不错的工作流程开发框架;比较适合做中小型OA项目。 ----------------------------------------------------------- 工作流模块 1. 模型管理 :web在线流程设计器、预览流程xml、导出xml、部署流程 2. 流程管理 :导入导出流程资源文件、查看流程图、根据流程实例反射出流程模型、激活挂起 3. 运行中流程 :查看流程信息、当前任务节点、当前流程图、作废暂停流程、指派待办人 4. 历史的流程 :查看流程信息、流程用时、流程状态、查看任务发起人信息 5. 待办任务 :查看本人个人任务以及本角色下的任务、办理、驳回、作废、指派一下代理人 6. 已办任务 :查看自己办理过的任务以及流程信息、流程图、流程状态(作废 驳回 正常完成) ----------------------------------------------------------- 系统模块 1 . 权限管理 :点开二级菜单进入三级菜单显示 角色(基础权限)和按钮权限 角色(基础权限): 分角色组和角色,独立分配菜单权限和增删改查权限。 按钮权限: 给角色分配按钮权限。 2 . 按钮管理 :自定义按钮管理,维护按钮shiro权限标识等 3 . 菜单管理

中琅条码软件如何连接MySQL批量生成PDF417码

自闭症网瘾萝莉.ら 提交于 2020-12-26 13:00:05
中琅条码软件不仅可以生成各种类型的条形码二维码,还可以连接数据库批量生成各种条形码二维码,如TXT、Excel、Access、MySQL、SQLServer等常用数据库。下面就以MySQL数据库为例,看看条码软件如何连接MySQL数据库批量生成PDF417二维码。如下图,MySQL中的数据库“yu”,表“Sheet1”中的数据作为二维码数据。 在中琅条码软件中新建一个空白标签,打开数据库设置,添加一个MySQL数据源,数据库导入MySQL表中的数据。 在弹出的窗口中配置MySQL数据库连接(输入MySQL数据库服务器名称,端口,数据库名称,账号密码),编码方式修改为“UTF-8”(和数据库的编码方式保持一致),测试连接后添加数据库。 利用中琅条码软件中的“绘制二维码”工具,在空白标签上添加一个二维码,二维码的默认类型是QR,当双击二维码打开“图形属性”-“条码”选项中修改二维码类型为“PDF417”。 在二维码的数据源中修改PDF417码的数据,数据对象类型选择“数据库导入”,导入MySQL数据库表中的产品编号字段。保存修改后,拖动PDF417码可以把外观设置成长方形。 预览查看批量生成的PDF417码,MySQL数据库表中有多少条数据就可以批量生成多少个PDF417二维码。 综上所述就是中琅条码软件连接MySQL数据库批量生成PDF417二维码的操作方法

EF Core 快速入门教程

余生颓废 提交于 2020-12-24 23:32:07
EF Core 基础概念 概念 EF Core 全称是Entity Framework Core,可使用 EF Core 开发面向 .NET Core 的应用,EF Core 同时支持在 Visual StudioVisual Studio for Mac 或 Visual Studio Code 等环境下开发。虽然EF CORO 同样支持在Xamarin和.Net Native 上实现运行,但是存在运行限制,可能会影响EF Core处理的效率,暂不推荐使用。 技术大纲 Entity Framework (EF) Core 是轻量化、可扩展、开源和跨平台版的常用 Entity Framework 数据访问技术。 EF Core 可用作对象关系映射程序 (O/RM),这可以实现以下两点: 使 .NET 开发人员能够使用 .NET 对象处理数据库。 无需再像通常那样编写大部分数据访问代码。 EF Core 支持多个数据库引擎。 获取 Entity Framework Core 运行时 举例:安装或更新 EF Core SQL Server 的途径 三种途径 NET Core CLI (控制台命令行操作页面可执行) 执行“dotnet add package Microsoft.EntityFrameworkCore.SqlServer”该指令 可以使用 -v 修饰符在 dotnet

oracle导入sqlserver数据库时 大小写简单处理

妖精的绣舞 提交于 2020-12-24 07:28:15
原文地址: oracle导入sqlserver数据库时 大小写简单处理 作者: 飘落纸飞机 问题: Sql Server 企业管理器下的导入导出功能很强大,可以在很多数据库之间互导数据。不过在把Sql Server数据库导入到Oracle数据库时,表名和列名会出现一些大小写的问题。 如: Sql Server数据库下有一表"T_abcd",包含字段"id"、"name",这样导入到Oracle数据库时,会执行大致如下的DDL语句 create table "T_abcd" ( "id" number, "name" varchar2(50) ); 导入完成后,在Oracle数据库中执行sql查询语句 select id, name from t_abcd t; 会出现ORA-00942:表或视图不存在的错误 原因: 在Oracle数据库下,表名和列名默认是不区分大小写的,当需要区分大小写时,可以使用双引号(")把名称引起来,上面的查询语句改为下面的形式,则不会出错 select "id", "name" from "T_abcdE"; 但是每次拼接这些标识符,很麻烦,尤其是在高级语言(java、C#)中做这些拼接工作,工作的任务量会直线上升的。 Oracle数据库在默认情况下,大概是这样处理sql语句的,先把sql语句中的字符串全部转换成大写

ODS与EDW的区别

心已入冬 提交于 2020-12-24 04:40:04
http://blog.csdn.net/bitcarmanlee/article/details/51013474 根据自己的理解与实际项目经验,说说ODS与EDW的异同。如果有不对的地方,欢迎大家批评指正。 维基百科对于ODS的定义为”An operational data store (or “ODS”) is a database designed to integrate data from multiple sources for additional operations on the data. Unlike a master data store, the data is not passed back to operational systems. It may be passed for further operations and to the data warehouse for reporting.” 翻译过来”ODS是一种数据架构或数据库设计的概念,出现原因是来自于当需要集成来自多个系统的数据,结果又要给一或多个系统使用时。” ODS全称为Operational Data Store,按照字面意思理解为操作型数据存储, 是“面向主题的、集成的、可变的、反映当前数据值的和详细的数据的集合,用来满足企业综合的、集成的以及操作型的处理需求”(Bill

NoSQL笔记——简介

寵の児 提交于 2020-12-21 14:27:52
目录 一.NoSQL的诞生 二.分布式数据管理 三.ACID/BASE 四.NoSQL数据库的分类 一. NoSQL的诞生 (1)什么是数据库? 数据库(Database)是按 照一定的 数据模型 来组织、存储和管理数据的仓库。 (2) 什么是数据模型 ? 把现实世界中的人、物、活动、概念等用 【数据模型】 来抽象、表示 成计算机能识别和处理的数字。 数据模型是DB系统的核心和基础。 (3) 传统数据库数据模型的类型 层次型、网状型和 关系型 发展历程: (4)什么是 关系数据模型? 关系模型有严格的数学基础,抽象级别比较高,而且简单清晰,便于 理解。很快工业界就参与进来研发关系数据库系统以及SQL。 代表产品有Oracle、IBM公司的DB2、微软公司的SQLServer 以及开 源的MySQL。 (5)关系型数据库的特点(优点)? 容易理解 :用二维表表示 使用方便 :通用的SQL语言。 易于维护 :丰富的完整性约束大大减低了数据冗余和数据不一 致的可能性。 (6)在大数据时代关系型数据库的不足 在大数据时代中, 数据量大,价值密度低,需要便宜的设备承载。 数据量达到了PB级别。 需要数据库拥有, 处理速度快,需要高并发支持及快速扩容能力。 1. 无法适应多变的数据结构 现代网络中存在大量的半结构化、非结构化数据,针对结构化数据而设计的关系 型数据库系统来说