网站源码

Java学习建议

≡放荡痞女 提交于 2019-11-27 19:03:31
对于Java程序猿学习的建议      这一部分其实也算是今天的重点,这一部分用来回答很多群里的朋友所问过的问题,那就是LZ你是如何学习Java的,能不能给点建议?   今天LZ是打算来点干货,因此咱们就不说一些学习方法和技巧了,直接来谈每个阶段要学习的内容甚至是一些书籍。这一部分的内容,同样适用于一些希望转行到Java的同学。   在大家看之前,LZ要先声明两点。   1、由于LZ本人是Java后端开发出身,因此所推荐的学习内容是Java Web和Java后端开发的路线,非Java Web和Java后端开发的同学请适当参考其学习思想即可,切勿照搬。   2、下面对于【第一部分】的推荐内容,目的是让你尽快成为一个可以参加工作的Java开发者,更适用于处于待业状态,准备转行Java的同学。如果你是在校学生,务必要在学好基础(比如计算机系统、算法、编译原理等等)的前提下,再考虑去进行下面的学习。      第一部分:对于尚未做过Java工作的同学,包括一些在校生以及刚准备转行Java的同学。   一、Java基础   首先去找一个Java的基础教程学一下,这里可以推荐一个地址,或者你也可以参照这个地址上去找相应的视频,地址为 http://www.runoob.com/java/java-tutorial.html 。   学习Java基础的时候,应该尽量多动手,很多时候

python-flask-请求源码流程

江枫思渺然 提交于 2019-11-27 14:53:52
启动先执行manage.py 中的 app.run() class Flask(_PackageBoundObject):   def run(self, host=None, port=None, debug=None, **options):   from werkzeug.serving import run_simple   try:   #run_simple 是werkzeug 提供的方法,会执行第三个参数 self()   run_simple(host, port, self, **options) 执行app(),对象()表示调用对象的__call__方法 class Flask(_PackageBoundObject):   def __call__(self, environ, start_response): return self.wsgi_app(environ, start_response) 又调用了app.wsgi_app方法 class Flask(_PackageBoundObject):   def wsgi_app(self, environ, start_response): #1.     ctx = self.request_context(environ)     #self.request_context #2. ctx.push

MATLAB爬虫爬取股票数据

一笑奈何 提交于 2019-11-27 13:12:32
近年来,大数据盛行,有关爬虫的教程层次不穷。那么,爬虫到底是什么呢? 什么是爬虫? 百度百科是这样定义的: 网络爬虫(又被称为网页 蜘蛛 ,网络机器人,在 FOAF 社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取 万维网 信息的程序或者脚本。另外一些不常使用的名字还有 蚂蚁 、自动索引、模拟程序或者 蠕虫 。 更多解释 就我个人理解,所谓的爬虫,就是代替人工复制粘贴去获取网络资源。平常我们需要批量下载图片、下载表格数据时,在没有爬虫的帮助下,只能借助CTRL+C 、CTRL+V 了,非常的繁琐,还容易出错。但是,你会发现,这些资源呈现出来,都是经过整理的。图片的链接是有规律的字符串,数据的网页源码是有规律的标签包住的(比如用的是同一个Class,同一种标签。)。这些都是可以程序化的东西。我们通过编程,将这些有规律的东西,用 正则表达式 来表达出来,然后交给代码去提取内容,这样就是爬虫爬取数据的具体表现了。 MATLAB爬取股票数据 相信大家听的比较多的应该是用 Python 来爬取网页数据了,但其实,Matlab 也是可以的,这里我们来具体实现一下。场景是这样的: 链接: http://vip.stock.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/000001/type/S.phtml

flask_session_源码剖析

回眸只為那壹抹淺笑 提交于 2019-11-27 10:46:46
开始文件(部分): from flask import Flask,request,session app = Flask(__name__) app.secret_key = 'sdfsdfsd' from flask.sessions import SessionInterface,SessionMixin import uuid import json from flask.sessions import SessionInterface from flask.sessions import SessionMixin from itsdangerous import Signer, BadSignature, want_bytes class MySession(dict, SessionMixin): def __init__(self, initial=None, sid=None): self.sid = sid self.initial = initial super(MySession, self).__init__(initial or ()) def __setitem__(self, key, value): super(MySession, self).__setitem__(key, value) def __getitem__(self, item):

第12章 Spark Streaming项目实战

十年热恋 提交于 2019-11-27 07:45:47
12-1 -课程目录 项目实战 需求说明 互联网访问日志概述 功能开发及本地运行 生产环境运行 12-2 -需求说明 今天到现在为止实战课程的访问量 今天到现在为止从搜索引擎过来的实战课程的访问量 12-3 -用户行为日志介绍 为什么要记录用户的访问行为日志 网站页面的访问量 网站的粘性 推荐 用户行为日志分析的意义 网站的眼睛 网站的神经 网站的大脑 12-4 -Python日志产生器开发之产生访问url和ip信息 12-5 -Python日志产生器开发之产生referer和状态码信息 12-6 -Python日志产生器开发之产生日志访问时间 12-7 -Python日志产生器服务器测试并将日志写入到文件中 12-8 -通过定时调度工具每一分钟产生一批数据 linux crontab https://tool.lu/crontab 每分钟执行一次crontab表达式:*/1 * * * * crontab -e */1 * * * */home/hadoop/data/project/log_generator.sh 12-9 -使用Flume实时收集日志信息 打通flume&kafka&spark streaming线路 对接Python日志产生器输出的日志到flume streaming_project.conf 选型:access.log==>控制台输出 exec

asp.net mvc 生命周期

☆樱花仙子☆ 提交于 2019-11-27 07:40:27
 首先我们知道http是一种无状态的请求,他的生命周期就是从客户端浏览器发出请求开始,到得到响应结束。那么MVC应用程序从发出请求到获得响应,都做了些什么呢? 本文我们会详细讨论MVC应用程序一个请求的生命周期,从一个控件到另一个控件是怎样被处理的。我们还会详细介绍一下整个请求的生命周期中,用到的相关组件。因为在平常的开发过程中,我们可能知道怎样去使用MVC框架来处理相关的请求,大部分的时候我们只是在controller和action方法之间做相关的处理,对于真正内在的运行机制可能不是很了解。其实当我们对内在机制有了一定的了解以后,会发现微软的MVC框架的扩展性很强,到处都留有扩展接口,让我们通过扩展能够自己定义自己所需要的处理机制,这也正是为什么MVC框架如此出名的原因。   当我最开始学习使用mvc的时候,困扰我的一个问题就是,一个请求的流程控制是怎样的呢?从view到controller再到action之间经历了什么?那个时候我还不清楚HTTP module和HTTP handler在处理一个请求中扮演什么样的角色,起什么样的作用呢。毕竟MVC是一个web开发框架,在整个请求处理过程中,肯定包含了http module和http handler。其实还有很多相关的组件包含在一个完整的mvc应用程序请求生命周期里,在整个请求过程中他们都扮演者非常重要的角色

动态调整线程数的python爬虫代码分享

萝らか妹 提交于 2019-11-27 06:27:27
  这几天在忙一个爬虫程序,一直在改进他,从一开始的单线程,好几秒一张图片(网络不好),,,到现在每秒钟十几张图片,,, 四个小时586万条数据,,,简直不要太爽 先上图      最终写出来的程序,线程数已经可以动态调整了,贼暴力。。。峰值能稳定在50个线程,具体思路可以继续看   这里终于用到了操作系统的知识,就是生产者和消费者的模型。。。(参考源码忘记记录了,抱歉   先简单说一下目标网站的情况,目标网站是一个图片网站,有一个列表页,点进列表页之后,可以看到很多图片,这只爬虫的目的是收集这些图片链接(有了链接当然也能下载了...   简单分析之后发现,在列表页,会向后台请求一个json格式的数据文件,然后js动态的把里面的id组合成一个链接,最终组成如下样式的链接      http://www.xxxxxx.com/photo/json?page=1977   显而易见,page参数就是指定页数的,那么,这里就可以先生成一个列表,用for循环把所有列表页的url加进去,接下来只需要遍历这个链接列表就好了。    #首先构造产品队列 for i in range(1,11613): url_list.append("http://www.xxxxxx.com/photo/json?page="+str(i)); print('产生链接完成');   接下来,就是启动生产者线程

pikachu-xss源码分析及修复

|▌冷眼眸甩不掉的悲伤 提交于 2019-11-27 05:45:36
xss源码分析 反射型主要在查询的地方,存储型主要在留言、评论的地方,dom型是特殊的反射型。pikachu的xss没有做很多过滤,重点展示的是原理,在实际情况中肯定会有很多过滤和转义的。要多积累一些。 1.反射型xss(get) 测试随便输入,发现会把用户输入的输出到下面的who is后面,测试一下<script>alert(‘xss’)</srcipt>,弹出xss。(记得把maxlength属性改大一点) 代码分析: $html变量直接拼接了{$_GET[‘message’]},后面代码又直接echo,没做任何过滤,转义。echo出的代码变成了 < p > who is < script > alert ( 'xss' ) < / script > , i don't care ! < / p > 2.反射型xss(post) 和1一样,只不过1是get提交,2是post提交,代码都是一样的。 3.存储型xss 测试一下,随便输入,发现会输出在留言列表里,刷新页面也一直在,输入<script>alert(document.cookie)</script>测试,alert出了cookie。每次点击这个页面都会alert出cookie,说明是存储型的,已经存在数据库了。 代码分析: 原因仍然是对输入的内容没有做任何过滤和转义,直接往数据库里插入了用户输入的内容

Log4Net 日志配置[附带源码]

偶尔善良 提交于 2019-11-27 03:12:27
前述   园子里有许多人对log4net这款开源的日志记录控件有很多介绍。在这里个人再做一次总结,希望对以后有所帮助,需要的时候可以直接使用,减少查阅资料的时间。利用log4net可以方便地将日志信息记录到文件、控制台、Windows事件日志和数据库,并且我们还可以记载控制要记载的日志级别,可以记载的日志类别包括:FATAL(致命错误)、ERROR(一般错误)、WARN(警告)、INFO(一般信息)、DEBUG(调试信息)。 log4net 有四种主要的组件,分别是 Logger(记录器) , Repository(库) , Appender(附着器)以及 Layout(布局) . 准备工作: 1.下载log4net.dll 下载地址[http://logging.apache.org/log4net/download_log4net.cgi] 下载文件:log4net-1.2.13-bin-newkey.zip。 解压选择对应的net版本找到log4net.dll。 2.在项目中引用log4net.dll。 实例代码 准备工作完成后我们来看下实例代码 ,首先 在项目中创建一个文件夹LogConfig 。把有关log4net的一些配置文件和类都放在这个文件夹里面。 WEB网站为例,在项目LogConfig文件夹中创建Log4Net.config配置文件。 <?xml version

源码安装mysql

為{幸葍}努か 提交于 2019-11-27 02:48:36
mySQL (关系型数据库管理系统) 编辑 MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件之一。 MySQL是一种关系数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。 MySQL所使用的 SQL 语言是用于访问数据库的最常用标准化语言。MySQL 软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择 MySQL 作为网站数据库。 由于其社区版的性能卓越,搭配 PHP 和 Apache 可组成良好的开发环境。 源码安装 wget http://dev.mysql.com/get/Downloads/MySQL-5.6/mysql-5.6.22.tar.gz 安装依赖包 yum -y install cmake bison git ncurses-devel gcc gcc-c++ groupadd mysql :如果没有mysql用户那就创建一个如果有那就忽略 useradd