博客

如果简单的记录,就可以为这个世界创造更多的财富,那么还有什么理由不去写博客呢? — 读<<黑客与画

江枫思渺然 提交于 2020-05-03 21:48:23
上一次博文发文时间是2016.1.15,7个月已经过去了.最近读了一本<<黑客与画家>>的书,对我触动挺大的!里面有关于技术趋势的探讨,也有关于人生和财富的思考! 开始更新iOS122的文章的初衷是,聚合整理一些iOS第三方库的开发资源,放到网上,其实更多的方便自己随时随地翻阅.不管是,翻译也好,原创也好,他们都有个共同的属性是: 自己不久的工作中能用到. 后来,自己关注的点,开始往ReactNative方向发张,这半年,几乎新需求都是基于ReactNative开发的.所以,关于 iOS 开发本身,事实是真的没有什么好"随手分享的",而我又不是那种为了写文章而写文章的人. 关于React本身,我觉得也是有许多值得分享的东西的,从ReactNative本身与Native的混编,到更深入的react-redux等衍生辅助技术栈;那些东西,也真的很有价值,事实上,也真的确实提高了编码效率和体验;但我总觉得 这个技术栈本身,或许不适合发表于 iOS122 本身的分类下;又或者说,我觉得自己半路出家搞ReactNative偏H5的技术栈,多少总会给人一种板门弄斧的感觉. 所以说,问题的关键是: 我没法总是在一个技术点或技术领域保持长久的兴趣,但是我又不想从头再维护一个 ReactNative 相关的博客;所以,我选择什么都不说,安安静静地看书,打游戏;有问题

使用Github Pages建独立博客

╄→尐↘猪︶ㄣ 提交于 2020-04-22 08:17:41
Github 很好的将代码和社区联系在了一起,于是发生了很多有趣的事情,世界也因为他美好了一点点。Github作为现在最流行的代码仓库,已经得到很多大公司和项目的青睐,比如 jQuery 、 Twitter 等。为使项目更方便的被人理解,介绍页面少不了,甚至会需要完整的文档站,Github替你想到了这一点,他提供了 Github Pages 的服务,不仅可以方便的为项目建立介绍站点,也可以用来建立个人博客。 Github Pages有以下几个优点: 轻量级的博客系统,没有麻烦的配置 使用标记语言,比如 Markdown 无需自己搭建服务器 根据Github的限制,对应的每个站有300MB空间 可以绑定自己的域名 当然他也有缺点: 使用 Jekyll 模板系统,相当于静态页发布,适合博客,文档介绍等。 动态程序的部分相当局限,比如没有评论,不过还好我们有解决方案。 基于Git,很多东西需要动手,不像Wordpress有强大的后台 大致介绍到此,作为个人博客来说,简洁清爽的表达自己的工作、心得,就已达目标,所以Github Pages是我认为此需求最完美的解决方案了。 购买、绑定独立域名 虽说 Godaddy 曾支持过SOPA,并且首页放着极其不专业的大胸美女,但是作为域名服务商他做的还不赖,选择它最重要的原因是他支持支付宝,没有信用卡有时真的很难过。 域名的购买不用多讲,注册、选域名

利用robots.txt对wordpress博客进行优化

寵の児 提交于 2020-03-21 03:26:46
3 月,跳不动了?>>> 本站的配置很简单,因为刚建成哈。 User-agent: * Disallow: /wp- 一、先来普及下robots.txt的概念:   robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件,它通常告诉网络搜索引擎的漫游器(又称网络蜘蛛),此网站中的哪些内容是不能被搜索引擎的漫游器获取的,哪些是可以被(漫游器)获取的。这个文件用于指定spider在您网站上的抓取范围,一定程度上保护站点的安全和隐私。同时也是网站优化利器,例如屏蔽捉取站点的重复内容页面。   robots.txt目前并不是一种标准,只是一种协议!所以现在很多搜索引擎对robots.txt里的指令参数都有不同的看待。   二、使用robots.txt需要注意的几点地方:a   1、指令区分大小写,忽略未知指令,下图是本博客的robots.txt文件在Google管理员工具里的测试结果;   2、每一行代表一个指令,空白和隔行会被忽略;   3、“#”号后的字符参数会被忽略;   4、有独立User-agent的规则,会排除在通配“*”User agent的规则之外;   5、可以写入sitemap文件的链接,方便搜索引擎蜘蛛爬行整站内容。   6、尽量少用Allow指令,因为不同的搜索引擎对不同位置的Allow指令会有不同看待。   三

博客中添加超过200k的.gif文件以及其它图片文件的方法介绍

£可爱£侵袭症+ 提交于 2020-03-01 03:39:03
首先我们解决的是如何获得.gif文件的问题, 这个问题很简单, 网上的录屏软件层出不穷, 例如camtasia studio可以解决这项工作, 但我强力推荐大家使用fatstone capture+迅雷影音播放器 , 首先选用faststone的原因是他很轻量级, 我们只需要录制简单的屏幕影像,并不需要像 camtasia studio 太强大的视频处理软件, 而且faststone主要是有截屏功能, 合二为一,很不错, 大家可以直接 下载 , 然后再网上搜一个注册码填好就可以使用了, 使用方法可以看看 百度经验 , 这样就录制好了一段wmv格式的视频, 那么我们接下来要处理的就是如何将wmv文件转换为.gif帧格式图片, 我们不需要用到什么格式工厂之类的转码的工具,直接使用迅雷影音播放器就行了, 用迅雷播放器截取.gif图片, 具体的使用方法参看 百度经验介绍 , 很简单我们就获得了.gif文件, 但是在大部分的网站博客当中一般都是不允许上传超过200k的图片文件的, 那么我们就只能利用图床, 将我们的图片文件传到网上, 然后在博客中利用在线的图片, 这样就可以绕过一定的大小限制了, 现在很多图床网站, 但是我推荐用新浪微博作为我们的图床, 不仅免费, 还相当靠谱, 前提得有个微博账号+~+, 将我们的.gif文件上传到我们微博的相册, 这里的方法就不做介绍了,

近几个月博客阅读整理

拥有回忆 提交于 2020-02-29 12:27:37
####java Java finally语句到底是在return之前还是之后执行? 白话JVM-深入虚拟机字节码执行引擎 详细分析Java中断机制 TOMCAT源码分析 Flink内存管理源码解读之基础数据结构 Flink内存管理源码解读之内存管理器 Java 理论与实践: 处理 InterruptedException JVM性能调优入门 并发环境下HashMap引起full gc排查 JavaMelody应用监控使用指南 java.lang.instrument 学习 ####并发 2016,我想跟协程谈谈 并发同步知多少 ####大数据 秒级处理海量数据,浙江移动大数据平台是怎么做到的? 大数据技能图谱 Flume日志收集 小米HBase服务化实践 当当推荐团队的机器学习实践 ####分布式 Raft 为什么是更易理解的分布式一致性算法 ####系统架构 -公司实战 定时器在大型web项目中的应用和实现 抓住六个点,谈唯品会的峰值系统应对实践 1号店订单系统水平分库的实践之路以及关键步骤 一号店迎战11.11 三大方案详解 大众点评订单分库分表实践之路 -通信架构 漫谈IM通信架构 一套简洁的即时通信(IM)系统 -缓存涉及 缓存系列文章 缓存架构设计细节二三事 ####其他好文 动态规划:从新手到专家 如何减少接口响应时间 淘宝内部分享:怎么跳出MySQL的10个大坑

markdown开源博客Gitblogv2.1版本发布更新

北城以北 提交于 2019-12-07 09:28:35
Gitblogv2.1版本发布更新 Gitblog官网 Gitblog文档 Gitblog官方QQ群: 84692078 2.1版本更新特性 优化了博客属性的提取,采用正则 支持wordpress导入 自定义404页面 自动提取博客title,summary,images属性 新增三个主题line,beach,cube 博客添加images,head属性 author配置增加avatar属性 删除一些多余的css代码 进一步优化了缓存机制 简介 GitBlog是一个简单易用的Markdown博客系统,它不需要数据库,没有管理后台功能,更新博客只需要添加你写好的Markdown文件即可。它摆脱了在线编辑器排版困难,无法实时预览的缺点,一切都交给Markdown来完成,一篇博客就是一个Markdown文件。同时也支持评论,代码高亮,数学公式,页面PV统计等常用功能。GitBlog提供了不同的主题样式,你可以根据自己的喜好配置,如果你想自己制作博客主题,也是非常容易的。GitBlog还支持整站静态导出,你完全可以导出整站静态网页部署到Github Pages。 功能特点 使用Markdown 评论框 代码高亮 PV统计 Latex数学公式 自制主题 响应式 全站静态导出 良好的SEO 优势 无需数据库,系统更轻量,移植更方便 使用Markdown编写,摆脱后台编辑排版困难

Gitblog官方网站发布上线

不羁岁月 提交于 2019-12-06 17:22:08
Gitblog官方网站发布上线 一. 简介 Gitblog是一个简单易用的Markdown博客系统,它不需要数据库,没有管理后台功能,更新博客只需要添加你写好的Markdown文件即可。它摆脱了在线编辑器排版困难,无法实时预览的缺点,一切都交给Markdown来完成,一篇博客就是一个Markdown文件。同时也支持评论,代码高亮,数学公式,页面PV统计等常用功能。Gitblog提供了不同的主题样式,你可以根据自己的喜好配置,如果你想自己制作博客主题,也是非常容易的。Gitblog还支持整站静态导出,你完全可以导出整站静态网页部署到Github Pages。 二. 功能特点 使用Markdown 评论框 代码高亮 PV统计 Latex数学公式 自制主题 响应式 全站静态导出 良好的SEO 三. GitBlog优势 无需数据库,系统更轻量,移植更方便 使用Markdown编写,摆脱后台编辑排版困难,无法实时预览的缺点 可全站静态导出 配置灵活,可自由开关某些功能 多主题支持,可自制主题 博客,分类,标签,归档 Gitblog官网 Gitblog官方QQ群:84692078 来源: oschina 链接: https://my.oschina.net/u/946034/blog/486989

simhash简介

自作多情 提交于 2019-12-06 13:56:25
先贴一张网上的图片: 解释一下图片:这里feature可以指一篇文档分词后的某个词,即将文档中的某个词作为一个特征。weight是这个词的权重,这里可以是这个词在这个句子中出现的次数。 这里的hash算法就是传统的hash算法,通过调用一个hash函数实现的。 simhash是为了计算一篇文档之间的相似度存在的,通过simhash算法可以计算出文档的simhash值,通过各个文档计算出的二进制值来计算文档之间的汉明距离,然后根据汉明距离来比较文档之间的相似度。汉明距离是指两个相同长度的字符串相同位置上不同的字符的个数。 simhash算法分为5个步骤:分词、hash、加权、合并、降维,具体过程如下所述: 分词 给定一段语句,进行分词,得到有效的特征向量,然后为每一个特征向量设置1-5等5个级别的权重(如果是给定一个文本,那么特征向量可以是文本中 的词,其权重可以是这个词出现的次数)。例如给定一段语句:“CSDN博客结构之法算法之道的作者July”,分词后为:“CSDN 博客 结构 之 法 算法 之 道 的 作者 July”,然后为每个特征向量赋予权值:CSDN(4) 博客(5) 结构(3) 之(1) 法(2) 算法(3) 之(1) 道(2) 的(1) 作者(5) July(5),其中括号里的数字代表这个单词在整条语句中的重要程度,数字越大代表越重要。 hash

海量数据处理---simhash算法

放肆的年华 提交于 2019-12-06 13:55:31
方法介绍 背景 如果某一天,面试官问你如何设计一个比较两篇文章相似度的算法?可能你会回答几个比较传统点的思路: 一种方案是先将两篇文章分别进行分词,得到一系列特征向量,然后计算特征向量之间的距离(可以计算它们之间的欧氏距离、海明距离或者夹角余弦等等),从而通过距离的大小来判断两篇文章的相似度。 另外一种方案是传统hash,我们考虑为每一个web文档通过hash的方式生成一个指纹(finger print)。 下面,我们来分析下这两种方法。 采取第一种方法,若是只比较两篇文章的相似性还好,但如果是海量数据呢,有着数以百万甚至亿万的网页,要求你计算这些网页的相似度。你还会去计算任意两个网页之间的距离或夹角余弦么?想必你不会了。 而第二种方案中所说的传统加密方式md5,其设计的目的是为了让整个分布尽可能地均匀,但如果输入内容一旦出现哪怕轻微的变化,hash值就会发生很大的变化。 举个例子,我们假设有以下三段文本: the cat sat on the mat the cat sat on a mat we all scream for ice cream 使用传统hash可能会得到如下的结果: irb(main):006:0> p1 = 'the cat sat on the mat' irb(main):007:0> p1.hash => 415542861 irb(main):005

SimHash算法原理

我与影子孤独终老i 提交于 2019-12-06 13:53:00
刚到公司项目中用到了simhash,但没有详细的了解,后来被问到原理,结果就狗带了。。 下面是自己查资料和自己的一些理解,不愧是google出品,比较符合google的风格,简单实用。 先贴一张网上的图片: 解释一下图片:这里feature可以指一篇文档分词后的某个词,即将文档中的某个词作为一个特征。weight是这个词的权重,这里可以是这个词在这个句子中出现的次数。 这里的hash算法就是传统的hash算法,通过调用一个hash函数实现的。 simhash是为了计算一篇文档之间的相似度存在的,通过simhash算法可以计算出文档的simhash值,通过各个文档计算出的二进制值来计算文档之间的汉明距离,然后根据汉明距离来比较文档之间的相似度。汉明距离是指两个相同长度的字符串相同位置上不同的字符的个数。 simhash算法分为5个步骤:分词、hash、加权、合并、降维,具体过程如下所述: 分词 给定一段语句,进行分词,得到有效的特征向量,然后为每一个特征向量设置1-5等5个级别的权重(如果是给定一个文本,那么特征向量可以是文本中 的词,其权重可以是这个词出现的次数)。例如给定一段语句:“CSDN博客结构之法算法之道的作者July”,分词后为:“CSDN 博客 结构 之 法 算法 之 道 的 作者 July”,然后为每个特征向量赋予权值:CSDN(4) 博客(5) 结构(3) 之(1)