gse

PCA图显示分组无差异,怎么办?

随声附和 提交于 2021-01-07 09:38:13
最近接到粉丝提问,感兴趣的数据集做差异分析,发现很勉强,不好把握。因为我以前在生信技能树写过教程: PCA都分不开的两个组强行找差异是为何 ,所以征求我的意见。但是我很忙啊,所以就把这个数据集安排给了实习生和学徒。我一直强调,做表达矩阵分析一定要有三张图,见: 你确定你的差异基因找对了吗? ,基本上看到这3张图,就明白问题出在哪里了。 粉丝求助的数据集介绍如下: 小白菊内酯处理人胆管癌细胞的基因变化 药物处理:小白菊内酯 Platform:GPL6102 Series:GSE22633 https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE22633 第一步是下载数据 rm(list = ls()) ## 魔幻操作,一键清空~ options(stringsAsFactors = F)#在调用as.data.frame的时,将stringsAsFactors设置为FALSE可以避免character类型自动转化为factor类型 # 注意查看下载文件的大小,检查数据 f='GSE22633_eSet.Rdata' library(GEOquery) # 这个包需要注意两个配置,一般来说自动化的配置是足够的。 #Setting options('download.file.method.GEOquery'='auto')

【生信】简单的 GDS (GEO DataSets) 查询统计工具

旧时模样 提交于 2020-11-18 00:05:16
背景 写了个 GDS 的查询工具,主要用于检索式检索结果的空间与数量分析,毕竟循证理念嘛,荟萃全球资源,自己是否已经做到了呢?这就需要对自己检索到的数据集的源头进行定位、统计和分析,通过喜闻乐见的 html 可视化报表形式呈现,以确定是否需要对检索式进行改进。 功能 根据检索式检索 GSE 数据集并批量查询元数据,统计 GSE 数据集所来自的国家和城市。高级功能正在逐步开发。 食用方式 从 我的仓库 下载好项目文件。 任意文本编辑器打开 XML 文件进行编辑,按照示例格式填入自己的检索式,支持多条。需要注意的是浏览器有迭代次数的限制(比如3000),检索的结果数不宜过千,否则被浏览器检测到潜在的“无限循环”,可能会启动保护机制终止程序运行,得到空白网页。目前还没有研究解法。 xsltApplySequenceConstructor: A potential infinite template recursion was detected. You can adjust xsltMaxDepth (--maxdepth) in order to raise the maximum number of nested template calls and variables/params (currently set to 3000). Chrome 浏览器关闭安全模式( chrome

携手十年Infortrend与浙江美术馆再续前缘,这一次是高性价比GSe

耗尽温柔 提交于 2020-09-30 14:51:18
用户背景:浙江美术馆坐落于杭州市南山路西子湖畔,每年举办各类展览50个左右,公共教育活动近300场次,已成为大众享受公共文化服务的重要场所。2011年,浙江美术馆成为国际现当代美术馆协会成员馆。2015年,成为国家重点美术馆。 用户要求:浙江美术馆目前已拥有近2万件不同种类的美术藏品。为了适应线上和移动新媒体的需求,馆方决定进一步对藏品进行数字化,需要稳定性可用性高的NAS存储实现这一目标。馆方之前引进的Infortrend存储,十年来从未出现过故障,无需人工维护超过800000小时的表现给馆方留下了深刻的印象。因此新的数字化项目决定继续采用Infortrend的统一存储GSe。 解决方案:GSe 2000高可用性统一存储,使用12颗SAS 4TB 配置成RAID 6,采用10GbE (SFP+)主机通道。搭建NAS环境下的高效大容量存储用于美术馆图片文档的集中化管理和存储。 方案优势: 1.与其他从开源架构搭建起来的NAS存储不同,GSe的RAID底层架构完全由Infortrend自主开发,整个存储架构全部集成在控制器,嵌入式的存储系统更加稳定,性能也更出色。 2.Infortrend在设计、供应商选择、生产和服务质量等方面严格执行全面质量管理体(TQM),硬件品质可靠耐用,经过高低温老化等多项测试,保证硬件能够长期使用。 3.GSe固件集成docker平台

20200510文献速递

坚强是说给别人听的谎言 提交于 2020-08-20 03:39:48
一 文献题目: Single-cell RNA-seq analysis of the brainstem of mutant SOD1 mice reveals perturbed cell types and pathways of amyotrophic lateral sclerosis. 不想看英文题目: SOD1突变小鼠脑干的单细胞RNA序列分析揭示了肌萎缩性侧索硬化的细胞类型和途径。 背景: 肌萎缩性侧索硬化症(ALS)的发病机制涉及多种细胞类型(例如星形胶质细胞和小胶质细胞),为了确定哪一种细胞类型影响ALS,使用单细胞RNA测序(scRNA-seq)方法进行鉴定。 杂志和影响因子: Neurobiol Dis(IF: 5.16) 样本量: 两只SOD1(G93A) 突变的转基因小鼠,以及两只年龄匹配的野生型小鼠。分别从突变型和野生型小鼠中分离出3199 和1894个细胞。 分析方法: 通过查找细胞簇内突变细胞和野生型细胞之间的差异表达基因(DEG),鉴定单细胞中ALS相关的基因。使用KEGG,Reactome,BIOCARTA和Gene Ontology数据库对差异表达基因进行注释。最后将已发表肌萎缩性侧索硬化症的GWAS文献和单细胞测序鉴定出来的差异表达基因进行重合,进一步确认可能与肌萎缩性侧索硬化症相关的基因 结论:

全球部署,弹性伸缩,就近调度:鹅厂这款游戏服务器引擎你看怎么样?

半世苍凉 提交于 2020-07-28 13:38:40
想要游戏火爆,热度经久不衰,联机必不可少。而联机游戏对于游戏低延时、服务稳定、成本控制有很高的要求,对于研发、运维挑战很大。 腾讯游戏服务器引擎(Game Server Engine,缩写GSE),支持有状态的游戏服务部署和扩缩容,实现服务发现、高效灵活的服务器伸缩和就近调度的能力,帮助开发者快速构建稳定、低延时的多人游戏的部署环境,并节约大量的运维成本,下 文将为大家全方位讲解和分析。 一、联机对战类游戏的需求 联机对战类包含FPS、MOBA、休闲IO、体育竞技、棋牌、策略等需要与人一起玩,一定时间就结束的游戏。 1. 游戏低延时,保障更多玩家流畅的体验 全球玩家分布广泛,而服务器集中部署,会使部分地区网络体验差,游戏体验受到影响,这也是部分地区玩家数量相对较少的一个原因。 有没什么办法,可以降低延时,尽量让更多玩家加入进来呢? 通常采用就近调度,或者全球加速(集中部署在一个点,各个区域到此点进行加速)的策略,可以让网络延时达到一个优化。对于实时性非常敏感的游戏来说,就近调度效果更明显。 不过就近调度也有几个棘手的问题: 方案一:业务部署在多个区域,玩家就近在一个区域完成匹配和对战。 问题:某个区域的玩家相对较少,可能匹配不到相应等级的人,最后所有玩家都集中到某个大区去了,实际上又变成了集中部署。 方案二:匹配在一个大区进行,集中匹配,对战的时候就近分配到不同的地区。 问题

20200503文献速递

人走茶凉 提交于 2020-05-04 10:09:57
一 文献题目: Genome-wide DNA methylation profiles of low- and high-grade adenoma reveals potential biomarkers for early detection of colorectal carcinoma 不想看英文题目: 全基因组DNA甲基化揭示了大肠癌早期检测的潜在生物标志物 杂志和影响因子: Clin Epigenetics (IF: 5.496) 样本量: 20个control样本(从腺瘤患者组织中提取的正常组织),18个低度腺瘤,22个高度腺瘤,以及从GEO 数据库挖掘的278个正常样本,51个腺瘤样本和504个癌症样本。 分析方法: 使用GenomeStudio处理甲基化原始数据,软件包pROC区分正常组织、LGA组织、HGA组织和CRC组织的高甲基化和低甲基化位点,使用R函数princomp进行PCA分析,使用KEGG和GO进行富集分析。 结论: 研究发现,在低度腺瘤和高度腺瘤患者中,分别有209和8692个CpG 位点呈超甲基化,通路分析表明早期腺瘤甲基化变化主要与神经系统相关,ADHFE1启动子区域的DNA甲基化最有可能成为大肠腺瘤和大肠癌的早期诊断生物标志物。 数据GEO登录号: GSE139404 文章链接: https://www.ncbi.nlm.nih.gov

【转录组入门】2:读文章得到测试数据

元气小坏坏 提交于 2020-05-02 18:23:50
作业要求: 本流程学习的文章是:AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 数据地址:GSE81916 作业:看文章的method,记下所用软件和参数,理解GEO/SRA数据的数据存放形式 具体步骤 【1】找到数据地址:GSE81916 文献检索途径:谷歌学术、SCI-HUB AKAP95 regulates splicing through scaffolding RNAs and RNA processing factors. Nat Commun 2016 Nov 8;7:13347. PMID: 27824034 文章中提示数据地址是GSE81916 【2】在NCBI的GEO中下载数据 有很多种方法 方法1 :NCBI---SRA数据库---搜索GSE81916---找到SRA---点击SRP075747---选择全部文件---send to ---file---format:Runinfo---creat file即生成了一个SraRunInfo.csv文件,打开该文件,查看SRR0000000标号是多少,然后 编写脚本,批量下载 # 编写脚本,批量下载 for i

ldap网络账号和autofs自动挂载用户家目录服务

江枫思渺然 提交于 2020-04-06 18:22:34
{***第八单元ldap网络帐号***} 1.ldap是什么 ldap目录服务认证,和windows活动目录类似,就是记录数据的一种方式 2.ldap客户端所需软件 yum sssd krb5-workstation -y 3.如何开启ldap用户认证 authconfig-tui ldap的tls证书缺失,需要到服务器端下载所需要的证书到/etc/openldap/cacerts, 下载证书: wget http://172.25.254.254/pub/example-ca.crt 重新执行 authconfig-tui 脚本: vim set-ldap.sh chmod +x set-ldap.sh sh set-ldap.sh 测试 getent passwd ldapuser1 若用户信息可以正常显示,证明客户端认证成功 列出所有用户 vim /etc/sssd/sssd.conf 16 enumerate = Ture :wq systemctl restart sssd 4.自动挂载用户家目录 [**autofs自动挂载用户家目录服务**] 1.服务功能 默认使用 mount挂载共享时当不使用共享也会处于挂载状态浪费共享服务器资源 autofs可以实现当使用时自动挂载,当闲置时自动卸载 2.安装服务 yum install autofs -y systemctl