文件目录

常用模块(一)

点点圈 提交于 2020-03-25 05:23:07
什么是模块? 常见的场景:一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀。 但其实import加载的模块分为四个通用类别: 使用python编写的代码(.py文件) 已经被编译为共享库或DLL的C或C++扩展 包好一组模块的包 使用C编写并链接到python解释器的内置模块 为何要使用模块? 如果你退出python解释器然后重新进入,那么你之前定义的函数或者变量都将丢失,因此我们通常将程序写到文件中以便永久保存下来,需要时就通过python test.py方式去执行,此时test.py被称为脚本script。 随着程序的发展,功能越来越多,为了方便管理,我们通常将程序分成一个个的文件,这样做程序的结构更加清晰,方便管理,这时候我们不仅仅可以把这些文件当作脚本去执行,还可以把它们当作模块来导入到其他的模块中,实现了功能的重复利用。 模块的导入和使用 模块的导入应该在程序最开始的地方。 常用模块 collections模块 在内置数据类型(dict,list,set,tuple)的基础上,collections模块还提供了几个额外的数据类型:counter,deque,defaultdict,namedtuple,OrderedDict等 namedtuple: 生成可以使用名字来访问元素内容的tuple deque: 双端队列

[工具] Git版本管理(一)(基本操作)

五迷三道 提交于 2020-03-25 04:11:34
一、版本控制的发展 1.用文件来做版本控制 我们在写论文、做方案等的时候,一般都会同时在文件夹中存在很多版本的文件。 例如: 这种方式很常用,在很多领域都是用这种方式来进行版本控制的。 2.本地版本控制 实用一个本地软件,对所有的文件版本做管理,只提供给我们看到一个版本的文件。 然后可以通过命令等方式来切换版本。 3.集中式版本控制 代表: SVN 实用一个服务器来进行版本控制,充当中心仓库。所有的开发者在自己电脑上进行开发,并提交给中心仓库。 缺点:当断网或服务器宕机的时候,无法提交。 4.分布式版本控制 代表: git 结构和SVN很像,不同的是除了在服务器上维护所有的版本,还在用户的本地计算机也维护一套所有的版本。 这样,用户可以在自己的本地进行版本控制,然后在合适的时机同步给中心服务器即可。 二、安装git软件 下载地址: https://git-scm.com/download/win windows上安装git软件,只需一直下一步即可。 在Linux上(CentOS)安装git,只需使用命令: yum install git -y Windows下安装完毕后,点击鼠标右键: 只要看到Git GUI Here 以及Git Bash Here就说明git安装好了。 三、初次使用git 1.使用流程 1)首先创建工作目录 我们首先要创建一个工作目录,例如D盘下的leo目录。

Docker入门及实战演练(一)

一曲冷凌霜 提交于 2020-03-25 03:59:46
一.简介 Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的 Linux 机器上,也可以实现虚拟化。容器是完全使用沙箱机制,相互之间不会有任何接口。几乎没有性能开销,可以很容易地在机器和数据中心中运行。 二.Docker基本组成 1.镜像(Image) 镜像,就是面向对象中的类,相当于一个模板。从本质上来说,镜像相当于一个文件系统。Docker 镜像是一个特殊的文件系统,除了提供容器运行时所需的程序、库、资源、配置等文件外,还包含了一些为运行时准备的一些配置参数(如匿名卷、环境变量、用户等)。镜像不包含任何动态数据,其内容在构建之后也不会被改变。 2.容器(Container) 容器,就是类创建的实例,就是依据镜像这个模板创建出来的实体。容器的实质是进程,但与直接在宿主执行的进程不同,容器进程运行于属于自己的独立的命名空间。因此容器可以拥有自己的root 文件系统、自己的网络配置、自己的进程空间,甚至自己的用户ID 空间。容器内的进程是运行在一个隔离的环境里,使用起来,就好像是在一个独立于宿主的系统下操作一样。这种特性使得容器封装的应用比直接在宿主运行更加安全。 3.仓库(Repository) 仓库,从认识上来说,就好像软件包上传下载站,有各种软件的不同版本被上传供用户下载。镜像构建完成后

Linux 常用命令总结(一)

我们两清 提交于 2020-03-25 01:15:36
一、基本概念 1、为什么学习命令操作而不用界面操作?   Linux 作为服务器,使用图形界面会占用更多的系统资源,且影响稳定性、安全性。而且一个服务器连个显示屏都没有,图形界面毫无作用,所以命令行操作是 Linux 的必备技能。 常用命令手册:   https://www.runoob.com/linux/linux-command-manual.html 2、命令格式 【格式:】 [root@localhost ~]# 命令 [选项] [参数] 注: [root@localhost ~]# 是登录系统后看到的内容。 其中 []、@ 没有特殊含义,作为分隔符号。 root 表示当前登录的用户,切换成普通用户,会显示普通用户名。 localhost 表示当前主机名。 ~ 表示当前所在的目录,初始登录时显示 ~,表示为家目录(主目录)。 root 用户家目录在 /root,普通用户家目录在 /home/用户名。 # 表示当前登录用户为管理员,若为普通用户,则显示为 $。 命令 [选项] [参数] 其中 选项,为可选项,用于调整命令的功能。 参数,为可选项,用于调整命令的操作对象。 3、文件类型   Linux 内部一切皆文件,不同的类型的文件代表不同的意义。 【类型:】 - 表示常规文件,如 文本文件、压缩文件、二进制文件。 d 表示目录文件(directory) b 表示块设备文件

Hadoop Streaming详解

陌路散爱 提交于 2020-03-24 22:46:08
一: Hadoop Streaming详解 1、Streaming的作用 Hadoop Streaming框架,最大的好处是, 让任何语言编写的 map, reduce 程序能够在hadoop 集群上运行 ;map/reduce程序只要遵循从标准输入stdin读,写出到标准输出stdout即可 其次,容易进行单机调试,通过管道前后相接的方式就可以模拟streaming, 在本地完成map/reduce程序的调试 # cat inputfile | mapper | sort | reducer > output 最后,streaming框架还 提供了作业提交时的丰富参数控制 ,直接通过streaming参数,而不需要使用java语言修改;很多mapreduce的高阶功能,都可以通过steaming参数的调整来完成 2、Streaming的局限 Streaming 默认只能处理文本数据Textfile ,对于二进制数据,比较好的方法是将二进制的key, value进行base64编码,转化为文本 Mapper和reducer的前后都要进行标准输入和标准输出的转化 ,涉及数据拷贝和解析,带来了一定的开销 3、Streaming命令的相关参数 (普通选项、streaming选项) Streaming命令的形式如下: # /usr/local/src/hadoop-1.2.1/bin

Kafka集群搭建

允我心安 提交于 2020-03-24 19:16:05
Kafka【第一篇】Kafka集群搭建 Kafka初识 1、Kafka使用背景 在我们大量使用分布式数据库、分布式计算集群的时候,是否会遇到这样的一些问题: 我们想分析下用户行为(pageviews),以便我们设计出更好的广告位 我想对用户的搜索关键词进行统计,分析出当前的流行趋势 有些数据,存储数据库浪费,直接存储硬盘效率又低 这些场景都有一个共同点: 数据是由上游模块产生,上游模块,使用上游模块的数据计算、统计、分析,这个时候就可以使用消息系统,尤其是分布式消息系统! 2、Kafka的定义 What is Kafka:它是一个分布式消息系统,由linkedin使用scala编写,用作LinkedIn的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础。具有高水平扩展和高吞吐量。 3、Kafka和其他主流分布式消息系统的对比 定义解释: 1、Java 和 scala都是运行在JVM上的语言。 2、erlang和最近比较火的和go语言一样是从代码级别就支持高并发的一种语言,所以RabbitMQ天生就有很高的并发性能,但是 有RabbitMQ严格按照AMQP进行实现,受到了很多限制。kafka的设计目标是高吞吐量,所以kafka自己设计了一套高性能但是不通用的协议,他也是仿照AMQP( Advanced Message Queuing

Linux文件常用命令

折月煮酒 提交于 2020-03-24 16:41:40
文件系统常用命令 1 pwd 显示当前所在的路径 解释:pwd = print working directory 显示当前所在的目录 [root@localhost run]# pwd /run [root@localhost network-scripts]# pwd /etc/sysconfig/network-scripts 2 cd 切换目录结构 解释: cd ---> change directory 改变目录信息 ##注意点 /目录 表示绝对路径 ; 目录 表示相对路径 #绝对路径的方式 [root@localhost run]# cd /etc/sysconfig/network-scripts/ [root@localhost network-scripts]# pwd /etc/sysconfig/network-scripts [root@localhost etc]# cd /home [root@localhost home]# pwd /home #相对路径的方式 [root@localhost home]# cd /etc [root@localhost etc]# cd sysconfig/ # 在etc中找syscofig [root@localhost sysconfig]# pwd /etc/sysconfig # 快速回到进入自己的家目录

git服务总结

不羁岁月 提交于 2020-03-24 14:36:54
3 月,跳不动了?>>> 工作原理 Git 在本地磁盘上就保存着所有当前项目的历史更新,所以处理起来速度飞快 。 对于任何一个文件,在 Git 内都只有三种状态:已提交(committed),已修改(modified)和已暂存(staged)。已提交表示该文件已经被安全地保存在本地数据库中了;已修改表示修改了某个文件,但还没有提交保存;已暂存表示把已修改的文件放在下次提交时要保存的清单中。 由此我们看到 Git 管理项目时,文件流转的三个工作区域:Git 的工作目录,暂存区域,以及本地仓库。 每个项目都有一个 Git 目录(如果 git clone 出来的话,就是其中 .git 的目录;如果 git clone --bare 的话,新建的目录本身就是 Git 目录。),它是 Git 用来保存元数据和对象数据库的地方。该目录非常重要,每次克隆镜像仓库的时候,实际拷贝的就是这个目录里面的数据。 从项目中取出某个版本的所有文件和目录,用以开始后续工作的叫做工作目录。这些文件实际上都是从 Git 目录中的压缩对象数据库中提取出来的,接下来就可以在工作目录中对这些文件进行编辑。 所谓的暂存区域只不过是个简单的文件,一般都放在 Git 目录中。有时候人们会把这个文件叫做索引文件,不过标准说法还是叫暂存区域。 基本的 Git 工作流程如下: 1. 在工作目录中修改某些文件。 2.

如何用 cookiecutter-django 进行 Django 项目布局

喜夏-厌秋 提交于 2020-03-24 14:31:55
以下介绍的是 cookiecutter-django 项目布局模板。 其它类似的项目模板可以到 这里 找到。 Django 1.8 默认生成的布局 生成命令: $ django-admin.py startproject mysite $ cd mysite $ django-admin.py startapp my_app 生成的布局: mysite/ manage.py my_app/ __init__.py admin.py models.py tests.py views.py mysite/ __init__.py settings.py urls.py wsgi.py cookiecutter-django 的项目布局 <repository_root>/ <django_project_root>/ <configuration_root>/ 最顶层:仓库根目录 <repository_root> <repository_root> 是项目所有文件的根目录,里面除了放置 <django_project_root> 以外,还放置其它的一些关键内容,如 README.rst , docs/ 目录, .gitignore , requirements.txt 文件及其它一些部署相关的文件等。 应该在该目录下运行 django-admin.py startproject

无法访问g文件或目录损坏

 ̄綄美尐妖づ 提交于 2020-03-24 13:18:37
问题描述: 磁盘打不开文件或目录损坏且无法读取,是因为这个I盘的文件系统内部结构损坏导致的。要恢复里面的数据就必须要注意,这个盘不能格式化,否则数据会进一步损坏。具体的恢复方法看正文 工具/软件:极限数据恢复软件 步骤1:先百度搜索并下载软件打开后,选中需要恢复的盘,然后点《开始恢复》按钮 步骤2:程序找到文件后,会放到与要恢复盘同名的目录中 步骤3:打钩所有需要恢复的文件,接着点右上角的《另存为》按钮,将打钩的文件COPY出来。 步骤4:最后一步只需要坐等软件将文件COPY完成就好了 。 注意事项1:文件或目录损坏且无法读取恢复出来的数据需要暂时保存到其它盘里。 注意事项2:想要恢复硬盘文件或目录损坏且无法读取需要注意,一定要先恢复数据再格式化。 来源: 51CTO 作者: amxjek 链接: https://blog.51cto.com/13458114/2476482