科普 | 易学教程

Beautifulsoup-基础知识

阅读更多关于 Beautifulsoup-基础知识

soup = BeautifulSoup(html_doc,features= ‘ lxml ‘ ) tag1 = soup.find(name=‘a‘) #找到第一个a标签，返回一soup对象 tag2 = soup.find_all(name=‘a‘) #找到所有a标签，返回一列表，列表中所有元素为soup对象 tag3 = soup.select(‘#link2‘) #找到id=link2的标签 name = tag3.name #获取标签名 attrs = tag3.attrs #获取属性，返回字典类型 tag3.attrs = {‘href‘=‘www.baidu.com‘} #修改或添加标签属性 del tag3.attrs[‘href‘] #删除标签属性 #判断是标签对象还是文本： from bs4.elementimport Tag tags = soup.find(‘body‘).children for tag in tags: 　　if type(tag) == Tag: 　　　　print(tag) 　　else: 　　　　print(‘文本。。。‘) children #body中所有儿子标签 descendants #body中所有子子孙孙标签 body = soup.find(‘body‘) v = body.descendants clear

ensemble和ucsc的一些区别

阅读更多关于 ensemble和ucsc的一些区别

原文来源：x2yline在生信进化树上的评论，http://www.biotrainee.com/thread-626-1-1.html ensembl.org 网站是常用真核生物参考基因组来源֮һ Ensembl是一项生物信息学研究计划，旨在开发种能够对真核生物基因组进行自动注释(automatic annotation)并加以维护的软件系统。该计划由英国Sanger研究所Wellcome基金会及欧洲分子生物学实验室所属分部欧洲生物信息学研究所共同协作运营。 Ensembl与NCBI的NCBI Map Viewer和UCSC是最为常用基因组检索数据库。 Ensembl 与NCBI Map Viewer和UCSC最大区别表现在以下5点： a.Ensembl的基因数据集是依据mRNA和蛋内序列的数据信息白动注释的。数据来源为新的基因组数据，UniProt/SwissProt和UniProt/TrEMBL的蛋白序列，NCBI的RefSeq里的DNA和蛋白序列和EMBL的cDNA序列。 b.Ensembl是一个开源（Perl API ）的全自动的基因注释软件系统，很多网站都采用Ensembl这套软件系统。 d.与其它数据库相整合，比如DAS。 e.基因组间的比较分析。基因注释机构目前从事基因注释的机构组织有很多，这里列出的只是较为常用的几个。 1. Ensembl

周总结4

阅读更多关于周总结4

1. 2Xu Zhang, Yujie Wang, Chang Liu, Zonghai Chen.A novel approach of battery pack state of health estimation using artificial intelligence optimization algorithm,Journal of Power Sources,376,pp.191-199,2018. 这篇文献题目：一种新的基于人工智能优化算法的电池组健康状态估计方法。这篇文献将SOH被定义为反映电池放电/充电过程中不同性能引起的电池最大能量存储变化以及电池组工作状态下电池不一致性的变化。为了确保电池状态估计的高精度，粒子群遗传算法（PSO-GA）方法用于电池组模型参数识别。粒子滤波（PF）SOC和OCV估计，递归最小二乘法（RLS）方法用于电池的容量更新。 2. 3天读完一篇英文文献：Pierre Kubiak, Zhaohui Cen, Carmen M. López, Ilias Belharouak,Calendar aging of a 250 kW/500 kWh Li-ion battery deployed for the grid storage application,J. Power Sources 372 (2017) 16-23. 250

从视网膜到视皮层――视觉系统知多少

阅读更多关于从视网膜到视皮层――视觉系统知多少

转自： http://www.sibs.cas.cn/kp/kptw/201606/t20160620_4623663.html 　　 ――《假如给我三天光明》美国　　如果说几十亿年前生命的诞生是地球上迄今为止最美的奇迹，那么生物体的神经系统堪称这个奇迹中最耀眼的巅峰之作。重量约为 1.3 千克，体积约为 1200 立方厘米，包含大约 860 亿个神经元（即神经细胞，是神经系统的结构与功能单位）以及同样数量的非神经元细胞（例如对神经元提供支撑和保护作用的胶质细胞，运输氧气和养料的血管组织等），人类大脑的复杂程度与奥妙之处被很多神经科学家认为并不亚于广袤无垠充满未知的浩瀚宇宙。图1 大鼠脑部（左）和人脑（右）的结构示意图　　　图2 大脑皮层左半球侧面视角的主要脑区和结构　　神经系统的功能，概括来说就是根据生物个体的需要以及外部环境的变化来控制或调节自身的行为以及内环境的稳态。这个过程抽象下来实际就是获取信息、处理信息以及输出信息。就像我们在使用计算机时，通过键盘鼠标将信息输入，在计算机进行相应的运算之后通过显示器来输出结果。我们生活在一个丰富多彩的世界里，而即便是从最基本的生存层面来看，每一个生物个体都需要感知周围环境并对外界的变化做出相应的反应。例如，野外生活的动物敏锐地发现猎物才能进行捕食，及时地察觉天敌才能躲避危险。　　

生物信息文件处理中常见格式

阅读更多关于生物信息文件处理中常见格式

参考基因组文件 .fna / .fa (gzip -cd ref.fa.gz > a.fa 待补。。。转载请标明出处: 生物信息文件处理中常见格式文章来源: 生物信息文件处理中常见格式

控制流劫持攻击研究综述

阅读更多关于控制流劫持攻击研究综述

控制流劫持攻击研究综述 ժҪ 大部分内存漏洞是通过控制流劫持攻击（ Control-flow hijack attack ）来达到攻击的目的，它是实现代码复用攻击，如 ret2libc ， ROP ， JOP 等的重要手段。攻击者通过劫持程序的控制流，使程序的运行逻辑违背程序原本的设计目标，对系统安全危害巨大。本文对针对控制流劫持攻击现有的防御机制做出总结和优缺点比较，并对未来研究方向做出总结。一、概述控制流攻击是一种常见的针对计算机软件的攻击，在 1972 年第一次被提出 [1] ，利用控制流劫持，可以实现 ROP ， JOP 等代码复用攻击，而网络攻击与防御技术总是不断发展，相互制衡，针对最开始的这类代码复用攻击，研究者提出 ASLR[2],[3] 、 DSR[4] 和 CFI 的防御方法，由于 CFI 的实现难度太高，提出了更加简洁可行的粗粒度 CFI ，之后，出现了能够绕过粗粒度 CFI 的 COOP 攻击。另外，针对 ASLR 等随机化防御，提出了 JIT-ROP 的代码复用攻击，结合内存信息泄漏漏洞，能够破解所有随机化防御，为了防止这类攻击，研究者提出不可读保护，防止攻击者获取代码信息。现在，基于隔离思想的 CPI 被提出，将控制流相关数据隔离，避免控制流劫持。控制流劫持攻击的步骤包括，构造攻击载体，利用内存漏洞，篡改控制数据，绕过安全机制，最后完成控制流劫持攻击

动态多协议研究

阅读更多关于动态多协议研究

计划中文章来源: 动态多协议研究

radar chart

阅读更多关于 radar chart

radar chart or 但是第一幅图用于比价种类比较鲜明，而第二幅图虽然比较个体很清楚却不能比较种类，所以图像服务于研究的问题。同样的，对于不同坐标变量的选择使得图形有不同，原则上选择信息量适合于研究的图形构成。来源：博客园作者： YUANya 链接：https://www.cnblogs.com/yuanjingnan/p/11538238.html

《生物信息学：导论与方法》----新一代测序NGS：重测序的回帖和变异鉴定----听课笔记（八）

阅读更多关于《生物信息学：导论与方法》----新一代测序NGS：重测序的回帖和变异鉴定----听课笔记（八）

第五章新一代测序NGS：重测序的回帖和变异鉴定 5.1 新一代测序从二十世纪前，人类认识到DNA的重要性后，一直以来将测序----确定一个特定DNA分子的序列----作为理解生命的重要方法。真正可以大规模运用的核酸测序方法，是1977年由英国生物化学家Frederick Sanger提出并实现. Sanger测序法的广泛应用使得大规模测定基因组序列成为可能，并为人类最终在20世纪完成人类基因组草图的绘制奠定了坚实的基础。 2005年454技术发布为标志，新一代测序技术开始登上舞台。与经典的Sanger Sequencing相比，新一代测序技术可以产生更多的reads，从而得到更高的测序深度，因此也常常被称为深度测序。（Next Generation Sequencing/ Deep Sequencing）另一方面，相比于Sanger Sequencing，新一代测序产生的平均reads，长度更短，却错误率更高，从而给后续的生物信息学分析提出了更大的挑战。除ABI公司的SOLiD之外，深度测序仪产生的数据通常被保存为FASTO格式；其中对于每条read，在具体的核酸序列信息之外，还包括了每个碱基对应的质量信息。 Quality: Given p = the probability of a base calling is wrong, its Quality Score

订阅科普