optional

python网络爬虫笔记(一)

情到浓时终转凉″ 提交于 2020-05-06 10:48:56
一、查询数据字典型数据 1、先说说dictionary查找和插入的速度极快,不会随着key的增加减慢速度,但是占用的内存大 2、list查找和插入的时间随着元素的增加而增加,但还是占用的空间小,内存浪费少 index modules | next | previous | Python » English French Japanese dev (3.8) pre (3.7) 3.6.4 3.5 2.7 Documentation » The Python Standard Library » | 2. Built-in Functions The Python interpreter has a number of functions and types built into it that are always available. They are listed here in alphabetical order. Built-in Functions abs() dict() help() min() setattr() all() dir() hex() next() slice() any() divmod() id() object() sorted() ascii() enumerate() input() oct() staticmethod() bin()

基于sklearn进行文本向量化

女生的网名这么多〃 提交于 2020-05-06 01:47:39
sklearn中,计数向量化用 CountVectorizer ,tfidf向量化用 TfidfVectorizer : import pickle from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer def test(vectorizer, word_bag, test_data): test_matrix = vectorizer.transform(test_data) print (test_matrix.shape) array = test_matrix.toarray() for rid in range(len(array)): print (test_data[rid], " \t " , "" .join([ " (%s, %.5f) " % (word_bag[cid], array[rid][cid]) for cid in range(len(word_bag))])) def vectorize(): train_data = [ " 我 来到 北京 清华大学 " , " 他 来到 了 网易 杭研 大厦 " , " 小明 硕士 毕业 与 中国 科学院 " , " 我 爱 北京 天安门 " ] # vectorizer = CountVectorizer

【Maven】---坐标与依赖

空扰寡人 提交于 2020-05-05 20:53:11
Maven坐标与依赖 最近想深度学习下maven,找到一本书叫《Maven实战》,这本书讲的确实很好,唯一遗憾的是当时maven教学版本是3.0.0的,而目前已经到了3.5.4了,版本存在差距, 没关系,如果有时间和精力我也会阅读官方文档,看看到底有哪些变换。 一、坐标详解 1、何为Maven坐标 maven定义了这样一组规则:世界上任何一个构件都可以使用maven坐标唯一标识,坐标元素包括: groupId、artifactId、version、packaging、classifier 。只要提供正确 的坐标就能从仓库中找到相应的构件供我们使用。maven从哪里下载构件呢?答:maven内置了一个中央仓库的地址,该中央仓库包含了世界上大部分流行的开源构件。 2、坐标详解 任何构件都必须明确定义自己的坐标,而一组maven坐标是通过一些元素定义的,他们是:groupId、artifactId、version、packaging、classifier。先看一组坐标定义如下 < groupId > org.sonatype.nexus </ groupId > < artifactId > nexus-indexer </ artifactId > < version > 2.0.0 </ version > < packaging > jar </ packaging >

cubic spline interpolation 概念解释和实现

元气小坏坏 提交于 2020-05-05 14:36:53
博客参考: https://blog.csdn.net/flyingleo1981/article/details/53008931 样条插值是一种工业设计中常用的、得到平滑曲线的一种插值方法,三次样条又是其中用的较为广泛的一种。本篇介绍力求用容易理解的方式,介绍一下三次样条插值的原理,并附C语言的实现代码。 1. 三次样条曲线原理 假设有以下节点 1.1 定义 条曲线 是一个分段定义的公式。给定n+1个数据点,共有n个区间,三次样条方程满足以下条件: 在每个分段区间 (i = 0, 1, …, n-1,x递增), 都是一个三次多项式 满足 (i = 0, 1, …, n ) ,导数 ,二阶导数 在[a, b]区间都是连续的,即 曲线是光滑的。 所以n个三次多项式分段可以写作: ,i = 0, 1, …, n-1 其中ai, bi, ci, di代表4n个未知系数。 1.2 求解 已知条件 n+1个数据点[xi, yi], i = 0, 1, …, n 每一分段都是三次多项式函数曲线 节点达到二阶连续 左右两端点处特性(自然边界,固定边界,非节点边界) 根据定点,求出每段样条曲线方程中的系数,即可得到每段曲线的具体表达式。 插值和连续性: , 其中 i = 0, 1, …, n-1 微分连续性: , 其中 i = 0, 1, …, n-2 样条曲线的微分式: 将步长

C :uthash

我怕爱的太早我们不能终老 提交于 2020-05-05 13:14:22
参考: [1] uthash | 学步园 [2] 源码 [3] 官方文档 [4] [5] 一、哈希表的概念及作用 在一般的线性表或者树中,我们所储存的值写它的存储位置的关系是随机的。因此,在查找过程中,需要一系列的与关键字的比较。 算法的时间复杂度与比较的次数有关。 线性表查找的时间复杂度为O(n) 而 平衡二叉树的查找的时间复杂度为O(log(n)) 。无论是采用线程表或是树进行存储,都面临面随着数据量的增大,查找速度将不同程度变慢的问题。而 哈希表 正好解决了这个问题。它的主要思想是通过将值与其存储位置相关联,来实现快速的随机存储。 二、uthash的基本用法 由于C语言中,并没有对hash表这类的高级数据结构进行支持,即使在目前通用的C++中,也只支持栈、队列等几个数据结构,对于map,其实是以树结构来实现的,而不是以hash表实现。 uthash是一个C语言的hash表实现。它 以宏定义的方式实现hash表 ,不仅加快了运行的速度,而且与关键类型无关的优点。 uthash使用起来十分方便,只要将头文件 uthash.h 包含进去就可以使用。 目前,uthash的最新版本(1.9)支持如下平台: Linux Mac OS X Windows using vs2008 and vs 2010 Solaris OpenBSD 通常这足够通用了。唯一的不足是在windows下

cocos creator实战-(二)跳一跳

微笑、不失礼 提交于 2020-05-05 12:17:38
一、游戏的分析(之前没有接触过小游戏,制作的思维还停留在大型ARPG游戏大家共同协作的想法里,但是小游戏讲究小而全,大部分时间是一个人独立开发,所以需要迫使自己养成看到小游戏先拆分细化的思想) 二、一些必要的参数 台阶参数 1: 设置分辨率: 720x1280 2: 台阶的原点: 3: 配置好4个中心点,如果跳到就到4个中心点,否则就失败; 4: 编写代码获得中心点的位置,来初始化Player; 5: 斜率: 0.5560472, 与平行四边形相当; 6: 块开始的世界坐标的位置: (180, 350) 参数 1: 监听事件,开启蓄积能量, 2秒缩放到0.5; 2: 0.5秒内,scale变形到1; 3: 0.5秒内, 旋转一周; 4: 0.5秒内,跳跃到目的地; 5: 能量蓄积: 加速度: power: 600, 初始化: 150; this.speed += dt * this.power; this.jumpDistance += this.speed * dt; 6:带上拖尾: MotionStreak组件: 配置好图片;(引擎bug,父节点移动,带有拖尾的子节点显示效果就会有问题,待解决) 7: ancher_offset: 100 8: 生成地图: 200, 400的距离随机 9: 地图滚动参数: y, 随着玩家滚动, x 取最左值和最右值(180, 580); 10

typescript接口(学习笔记非干货)

那年仲夏 提交于 2020-05-04 10:22:41
typescript的核心原则之一就是对所具有的shape类型检查结构性子类型化 One of the core principles of typescript is to check structural subtyping of shape types 在typescript中,接口的作用就是为这些类型命名和为你的代码或第三方代码定义契约 In typescript, the function of an interface is to name these types and define contracts for your code or third-party code. function printLable(labelledObj:{label:string}){ console.log(labelledObj.label); } let myObj={size:10,label:"Size 10 Object"}; printLable(myObj); 我们分析代码可以知道,一个对象有label对象,它的值类型是string类型 If we analyze the code, we can see that an object has a label object whose value type is string type. 使用接口重写上面的例子

【万字长文】别再报班了,一篇文章带你入门Python

大兔子大兔子 提交于 2020-05-04 09:31:14
【万字长文】别再报班了,一篇文章带你入门Python 最近有许多小伙伴后台联系我,说目前想要学习Python,但是没有一份很好的资料入门。一方面的确现在市面上Python的资料过多,导致新手会不知如何选择,另一个问题很多资料内容也很杂,从1+1到深度学习都包括,纯粹关注Python本身语法的优质教材并不太多。 刚好我最近看到一份不错的英文Python入门资料,我将它做了一些整理和翻译写下了本文。这份资料非常纯粹,只有Python的基础语法,专门针对想要学习Python的小白。 注释 Python中用#表示单行注释,#之后的同行的内容都会被注释掉。 Python中单行注释用#表示,#之后同行字符全部认为被注释。 使用三个连续的双引号表示多行注释,两个多行注释标识之间内容会被视作是注释。 """ 与之对应的是多行注释 用三个双引号表示,这两段双引号当中的内容都会被视作是注释 """ 基础变量类型与操作符 Python当中的数字定义和其他语言一样: 获得一个整数 3 获得一个浮点数 10.0 我们分别使用+, -, *, /表示加减乘除四则运算符。 1 + 1 # => 2 8 - 1 # => 7 10 * 2 # => 20 35 / 5 # => 7.0 这里要注意的是,在Python2当中,10/3这个操作会得到3,而不是3.33333。因为除数和被除数都是整数

Web API(五):Web API跨域问题

寵の児 提交于 2020-05-04 01:58:49
一、什么是跨域问题 跨域:指的是浏览器不能执行其他网站的脚本。是由浏览器的同源策略造成的,是浏览器施加的安全限制。(服务端可以正常接收浏览器发生的请求,也可以正常返回,但是由于浏览器的安全策略,浏览器不能处理服务端的返回)。 那么什么是同源策略呢? 同源策略/SOP(Same origin policy)是一种约定,由Netscape公司1995年引入浏览器,它是浏览器最核心也最基本的安全功能,如果缺少了同源策略,浏览器很容易受到XSS、CSFR等攻击。所谓同源是指"协议+域名+端口"三者相同,即便两个不同的域名指向同一个ip地址,也非同源。 正是由于这个原因,如果是在不同的项目之间进行调用(这里说的调用指的是浏览器调用后端,如果是后端直接调用就不会存在跨域问题)就会被浏览器阻止。WebApi中常见的场景:Web Api作为单独的数据服务层,提供接口供前端界面调用,MVC项目作为显示层,这种情况下如果在MVC的前端界面里面通过ajax调用WebApi的接口,就会存在跨域问题。 二、如何解决跨域问题 网上有很多跨域问题的解决方案,这里就不在一一列举了,下面主要讲解一下在WebApi中如何使用CORS解决跨域问题。CORS全称Cross-Origin Resource Sharing,中文全称是跨域资源共享

dotnetcore配置框架简介

青春壹個敷衍的年華 提交于 2020-05-03 16:45:17
一、前言 配置的本质就是字符串的键值对,微软的一系列接口其实就是对这些键值对字符串的抽象。 二、基本类型 2.1、Nuget包 Microsoft.Extensions.Configuration.Abstractions Microsoft.Extensions.Configuration 2.2、抽象接口 IConfiguration 提供了查询、设置配置项、监控变化等方法 IConfigurationRoot 在IConfiguration接口基础上,增加了 Reload 方法强制从provider中重新加载配置值 IConfigurationSection 对配置节点的抽象 IConfigurationBuilder 根据提供的数据源注册并构建IConfiguration IConfigurationSource 对数据源的抽象,例如Json、xml、环境变量、内存变量等 IConfigurationProvider 规定了配置项的获取、设置、重载等统一的行为 三、基本配置 注:各种配置方式的目的是在控制台中输出以下内容,如下图: 3.1、加载内存中的配置 需要引入包:Microsoft.Extensions.Configuration 主要方法:builder.AddInMemoryCollection() static void Main( string [] args