dna

【算法】DNA

本秂侑毒 提交于 2020-04-06 12:34:07
【问题描述】 题目描述 小强从小就喜欢生命科学,他总是好奇花草鸟兽从哪里来的。终于, 小强上中学了,接触到了神圣的名词--DNA.它有一个双螺旋的结构。这让一根筋的小强抓破头皮,“要是能画出来就好了” 小强喊道。现在就请你帮助他吧 输入 输入包含多组测试数据。第一个整数N(N<=15),N表示组数,每组数据包含两个整数a,b。a表示一个单位的DNA串的行数,a为奇数且 3<=a<=39。b表示重复度(1<=b<=20)。 输出 输出DNA的形状,每组输出间有一空行。 样例输入 2 3 1 5 4 样例输出 X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X 【分析】 重点在于找到下标之间的关系 然后输出的时候注意重复那行需要控制输出 具体看代码 【代码】 //DNA #include<stdio.h> int main() { int N,i,j; int ini;//记录每个重复度对应的起始位置 int b1;//记录从1到b的重复度 int a[15]; int b[15]; int n;//用来记录组数 char A[39*15][39*15];//用来保存输出的数组 scanf("%d",&N); for(i=0; i<N; i++) { scanf("%d %d",&a[i],&b[i

cfDNA--整理

别说谁变了你拦得住时间么 提交于 2020-03-27 06:45:57
cfDNA:   用处:     诊断/监测、药物疗效/预后   mutation:     与cancer type、TMB、肿瘤异质性、克隆进化有关。     与age、cancer位置关联;     做病毒检测。抽血,用血清中的DNA、蛋白做病毒检测。   长度:     正常是160bp,肿瘤患者的cfDNA长度约132-145bp。   来源:     有文献支持:plasma中的cfDNA主要是淋巴细胞和血细胞凋亡释放到血液中的。(journal club讲的此文献:Inferring expressed genes by whole-genome sequencing of plasma DNA)       细胞凋亡apotosis:DNA降解,且凋亡DNA的片段大小是有规律的。是正常的生物学现象。     细胞死亡:DNA不降解或者降解不充分。 来源: https://www.cnblogs.com/zypiner/p/12578995.html

靶向药--顺铂--整理

血红的双手。 提交于 2020-03-27 06:45:09
靶向药(顺铂)的作用原理:       1. 只对增殖中的细胞有效。对正常细胞无效。而,癌细胞是处于高度增殖中的细胞。           它作用于DNA的大弯GC上,让其复制终止。所以,顺铂只对处于复制中的DNA起作用。否则,DNA高度压缩,不暴露在外面,顺铂无法起作用。       2. 顺铂(pt)-》CPS-3-》DME1-》细胞凋亡。               CPS-3(capase3)是一种胞质中的蛋白酶,引起细胞凋亡的关键酶。           正常的细胞凋亡也是这个过程,只是pt刺激了这个细胞凋亡的过程。但是,pt刺激的细胞凋亡过程快,与正常细胞缓慢的凋亡过程不同。        问题:顺铂治疗后细胞死亡导致的DNA降解、断裂,与正常细胞凋亡导致的DNA降解,有何不同呢?             曾经想做这个方面的课题,想看看打顺铂病人体内的断裂的DNA与正常细胞凋亡断裂的DNA有何不同。 来源: https://www.cnblogs.com/zypiner/p/12578994.html

浅谈高中生物”碱基对确定,求DNA最多种数”问题

心不动则不痛 提交于 2020-02-29 04:41:30
1.问题发现 在高中生物-遗传与进化-基因的本质学习中,有一个十分经典的问题。 即: 给定碱基对数n,不限定每种碱基(A,C,G,T)的个数,求出最多的DNA种数。 在所有的教材,辅导书,以及老师的授课过程中,对于这个问题的答案,一般都是 \(4^n\) 或者 \(\frac {4^n} {2}\) 。 对于 \(4^n\) 的思路,即每个位置有 \(4\) 种碱基对可能,一共有 \(n\) 组,根据乘法原理,故为 \(4^n\) 。 对于 \(\frac {4^n} {2}\) 的思路,即在上一种思路的基础上,考虑到有重复的情况,便除了个 \(2\) 。 但是,@ thorn ,@ opethrax 以及本人的对于这些答案深感怀疑,于是我们便手算了当碱基对数为 \(2\) 时的所有情况。 利用计算机程序进行打表,以及查询有关 \(DNA\) 的资料后,最终我们确定当 \(n=2\) 时,结果理应为 \(10\) 。 这个答案都不能用上面的公式解答,于是我们继续思考探索。 2.深入探究 通过@ opethrax 同学辛苦的打表,观察,他发现存在一些情况被忽略。 原先我们认为,一个 \(DNA\) 分子拥有 \(3'\) 与 \(5'\) 段, \(3\) 代表三碳糖, \(5\) 代表五碳糖。 如下图,从两条链的 \(3'\) 端分别扫描,一种序列最多被统计到 \(2\) 次。

ATAC-seq

不羁的心 提交于 2020-02-22 19:40:48
ATAC-seq(Assay for Transposase-Accessible Chromatin with high throughput sequencing) 是2013年由斯坦福大学William J. Greenleaf和Howard Y. Chang实验室开发的用于研究染色质可及性(通常也理解为染色质的开放性)的方法, 原理是通过转座酶Tn5容易结合在开放染色质的特性,然后对Tn5酶捕获到的DNA序列进行测序。 真核生物的核DNA并不是裸露的,而是与组蛋白结合形成染色体的基本结构单位核小体,核小体再经逐步的压缩折叠最终形成染色体高级结构(如人的DNA链完整展开约2m长,经过这样的折叠就变成了纳米级至微米级的染色质结构而可以储存在小小的细胞核)。而DNA的复制转录是需要将DNA的紧密结构打开,从而允许一些调控因子结合(转录因子或其他调控因子)。这部分打开的染色质,就叫开放染色质,打开的染色质允许其他调控因子结合的特性称为染色质的可及性(chromatin accessibility)。因此,认为染色质的可及性与转录调控密切相关。 开放染色质的研究方法有ATAC-seq以及传统的DNase-Seq及FAIRE-seq等,ATAC-Seq由于所需细胞量少,实验简单,可以在全基因组范围内检测染色质的开放状态,目前已经成为研究染色质开放性的首选技术方法。 Nat

兔子与兔子----字符串哈希

谁都会走 提交于 2020-01-22 17:55:46
链接:https://ac.nowcoder.com/acm/contest/1008/B 来源:牛客网 很久很久以前,森林里住着一群兔子。有一天,兔子们想要研究自己的 DNA 序列。我们首先选取一个好长好长的 DNA 序列(小兔子是外星生物,DNA 序列可能包含 26 个小写英文字母),然后我们每次选择两个区间,询问如果用两个区间里的 DNA 序列分别生产出来两只兔子,这两个兔子是否一模一样。注意两个兔子一模一样只可能是他们的 DNA 序列一模一样。 输入描述: 第一行一个 DNA 字符串 S。 接下来一个数字 m,表示 m 次询问。 接下来 m 行,每行四个数字 l1, r1, l2, r2,分别表示此次询问的两个区间,注意字符串的位置从1开始编号。 其中 1≤strlen(s),m≤1000000 输出描述: 对于每次询问,输出一行表示结果。如果两只兔子完全相同输出 Yes,否则输出 No(注意大小写) 示例1 输入 复制 aabbaabb 3 1 3 5 7 1 3 6 8 1 2 1 2 输出 复制 Yes No Yes 哈希的裸题,直接套用哈希字符串就行。 # include <bits/stdc++.h> using namespace std ; typedef unsigned long long LL ; const int N = 1e6 + 5 , b =

【字符串】DNA反向互补链

时光毁灭记忆、已成空白 提交于 2020-01-21 03:17:14
描述 DNA,即脱氧核糖核酸,是核苷酸的一种,根据其中碱基类型的不同,一个DNA序列可以由腺嘌呤脱氧核糖核苷酸、鸟嘌呤脱氧核糖核苷酸、胞嘧啶脱氧核糖核苷酸和胸腺嘧啶脱氧核糖核苷酸组成,分别由字母A、G、C和T表示。DNA一般呈现双链结构,是由两条单链盘绕形成的,两条单链具有互补特性,即每两个碱基之间组成碱基对,这种配对具有特异性,即A只能与T形成配对,C只能与G形成配对,称为碱基的互补配对。通过碱基互补配对,两条互相平行的DNA单链盘绕就形成了双链,其中两条互补的单链在方向上是相反的,每条单链称为另一条单链的反向互补链。 现在已知DNA中的一条单链,请计算出其反向互补链。 输入 输入数据有多组,每组占一行,每行是一串DNA单链序列,长度不超过100个字符。 输入以EOF结束。 输出 每组占一行,每行输出一串相应的反向互补链。 样例输入 ACGCTGC 样例输出 GCAGCGT 收获: 反转字符串方法——reverse(s.begin(),s.end()) 代码: #include<bits/stdc++.h> using namespace std; int main() { string s; while(cin>>s) { reverse(s.begin(),s.end()); //cout<<s<<endl; int l=s.length(); for (int i=0;i

Codeforces Round #423 (Div. 2, rated, based on VK Cup Finals) E. DNA Evolution 树状数组

吃可爱长大的小学妹 提交于 2020-01-20 05:35:57
E. DNA Evolution 题目连接: http://codeforces.com/contest/828/problem/E Description Everyone knows that DNA strands consist of nucleotides. There are four types of nucleotides: "A", "T", "G", "C". A DNA strand is a sequence of nucleotides. Scientists decided to track evolution of a rare species, which DNA strand was string s initially. Evolution of the species is described as a sequence of changes in the DNA. Every change is a change of some nucleotide, for example, the following change can happen in DNA strand "AAGC": the second nucleotide can change to "T" so that the resulting DNA strand is

B 基因改造

怎甘沉沦 提交于 2020-01-16 23:46:48
时间限制 : - MS 空间限制 : - KB 问题描述 "人类智慧的冰峰,只有萌萌哒的我寂寞地守望。" --TB TB正走在改造人类智慧基因的路上。TB发现人类智慧基因一点也不萌萌哒,导致人类普遍智商过低,为了拯救低智商人群,博爱的TB开始改造人类智慧基因。人类智慧DNA由C种人类智慧脱氧核苷酸构成(这是一种十分特殊的DNA)。 TB智慧DNA片段T长度为M,她可以把另一段长度为M的人类智慧DNA片段S改造成T。 改造过程中,TB可以充分发挥智慧,将任意两种人类智慧脱氧核苷酸交换(比如对于片段S=12321,交换1和2变成S=21312,交换1和4变成42324),可以无限次交换。如果S可以通过若干次交换变成T,那么就称S为"萌萌哒人类基因片段"。 TB想知道对于一个长度为N的人类智慧DNA片段S[1 ~ N],有多少个长度为M的连续子片段S[i ~ i+M-1],是"萌萌哒人类基因片段",并且这些"萌萌哒人类基因片段"在哪里。 输入格式 第一行包含两个正整数case和C,分别表示数据组数和人类智慧脱氧核苷酸的种数。 接下来3*case行,每三行表示一组数据: 第一行一个正整数N和M,表示人类智慧DNA片段S和TB智慧DNA片段T的长度。 第二行N个正整数,表示人类智慧DNA片段S。 第三行M个正整数,表示TB智慧DNA片段T。 对于所有数据数据,case=3, n,m,C<

xgene:之ROC曲线、ctDNA、small-RNA seq、甲基化seq、单细胞DNA, mRNA

放肆的年华 提交于 2019-12-22 05:16:38
灵敏度 高 == 假阴性率低,即漏检率低,即有病人却没有发现出来的概率低。 用于判断:有一部分人患有一种疾病, 某种检验方法 可以在人群中检出多少个病人来。 特异性 高 == 假阳性率低,即错把健康判定为病人的概率低。 用于:被某种试验判定为患病的人中,又有多少是 真的患了这种病 的。 好的检测方法: 有高的灵敏度(低的假阴性率)、同时又有高的特异性(低的假阳性率)。 ROC 曲线: 横轴:100 — 特异性。。即100减去特异性,特异性高,100减去特异性就低,故越小越好。 纵轴:灵敏度值。 ROC分析图的解读原则: 曲线越是靠近整个图的 左上方,方法越优 ; 越是接近 对角线,方法越差 ; 评价的 客观标准 是 曲线下方的面积占整个图的面积比例 。即AUC(曲线下面积,Area Under Curve,AUC)。 面积比例越接近1,方法越好 ;面积比例越接近0.5,方法越差。 ctDNA 循环肿瘤DNA,英文叫:circulating tumor DNA,简称ctDNA。对ctDNA进行测序,是目前很火的Liquid Biopsy(液体活检)中的一种。 意义 首先,我们来说一下ctDNA测序的临床意义。 第一,就是它可以减少病人的开刀痛苦, 只要抽血 ,不必开刀,就可以做检测。 第二,是它可以 增加可检测的病人范围 ,对于不适合做开刀手术的病人。例如,已经发生肿瘤全身转移的病人