- 论坛徽章:
- 8
|
本帖最后由 huang6894 于 2014-04-17 11:41 编辑
谢谢rdcwayx大大,修改了一下~
继续请教一下:
如果我有五个文本:
文本一:- CYP2C19 NM_000016 c.946-2A>C chr1 76226804 76226805 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18
- CYP2C19 NM_000016 c.946-2A>C chr1 76226814 76226815 1p31.1 1 . C snv . 106,23 77,0,2387 Hom 0.18
- TPMT NM_000016 c.957_958delAT chr1 76226817 76226820 1p31.1 1 . T del . 106,23 77,0,2387 Hom 0.18
- CYP2D6 NM_000016 c.977T>C chr1 76226837 76226838 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18
- CYP2D6 NM_000016 c.977T>C chr1 76226838 76226839 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18
- CYP2D6 NM_000500 c.710T>A chr6 32007583 32007584 6p21.33 1 . A snv . 106,23 77,0,2387 Hom 0.18
- CYP2D6 NM_000492 c.3556C>T chr7 117267662 117267663 7q31.2 1 . T snv . 106,23 77,0,2387 Hom 0.18
- MT-RNR1 NM_000016 c.356C>T chr2 17267662 17267663 7q31.2 1 . T snv . 106,23 77,0,2387 Hom 0.18
复制代码 文本二:它的第一第二第三第五列对应与文本一的第一第四第五列+1和第十列,注意有部分第二、三、四列是空的,表示第一列相同第二第三列不在文本二的所有行都是。。。这里的第四列和文本一第15列有对应关系,如果对应的文本一第15列是Het表示它是杂合的,输出A(第四列对应字符),如AB,如果是Hom则表示它是纯合的,输出(第四列对应字符)(第四列对应字符),如BB。对应关系生成的字符串根据优先级(AA<AB<AC<BB<CC)传递最高级(比如说同时存在第一列为CYP2D6 的有AA\AB\BB,则传递BB)到文本三,如果没有则传递“."
- CYP2D6 A
- CYP2D6 chr1 76226838 B C
- CYP2D6 chr1 76226839 B C
- CYP2C19 A
- CYP2C19 chr1 76226815 C C
- CYP2C19 chr1 76226805 A C
- TPMT chr1 76226818 B B
复制代码 文本三:它的第一二列对应文本二的一四列
- CYP2C19 AB PM 临床意义未明
- CYP2C19 CC Unknown 临床意义未明
- CYP2D6 AA EM 快代谢
- CYP2D6 AB EM 快代谢
- CYP2D6 AC EM 快代谢
- CYP2D6 AD EM 快代谢
- CYP2D6 A*N(N>2) UM 超快代谢
- TMPT BB IM 快代谢
复制代码 文本四:这里的第一第三列对应文本三的第一第三列
- CYP2D6 阿米替林 EM 降低剂量
- CYP2D6 阿米替林 UM 换药
- CYP2C19 阿米替林 IM 推荐剂量
- CYP2C19 阿米替林 PM 减少剂量
- CYP2C19 阿米替林 UM 换药
- MT-RNR1 庆大霉素 (这是空的) 换药
- TMPT 链霉素 IM 减少剂量或换药
复制代码 文本五:这里的第2列对应文本四的第二列- 5 阿米替林 Amitriptyline "阿米替林是临床常用的三环类抗抑郁药物,用于治疗各种抑郁症。本品镇静作用较强,适用于治疗焦虑性或激动性抑郁症。三环类抗抑郁药物的治疗窗比较窄,血药浓度过高时会对人体产生相当大的毒性,导致严重的不良反应;而血药浓度低于治疗窗时,又容易导致治疗无效[1]。副作用包括发烧、皮疹、疲劳、胃肠不适(恶心、呕吐、腹泻和腹痛等)和呼吸综合征(呼吸困难、咳嗽、咽炎等)[2]。因此,适当剂量的给药显的非常重要。阿米替林在体内主要经CYP2C19脱甲基后形成活性代谢产物去甲替林,去甲替林进一步经CYP2D6羟基化后形成无活性的产物排除体外。阿米替林及其主要代谢产物去甲替林在体内的总浓度被用于作为阿米替林调整剂量的依据。" [1]Steimer W, et al. Allele-specific change of concentration and functional gene dose for the prediction of steady-state serum concentrations of amitriptyline and nortriptyline in CYP2C19 and CYP2D6 extensive and intermediate metabolizers. Clin Chem. 2004 Sep;50(9):1623-33.[2]GlaxoSmithKline.Abacavir drug label.2008.
- 6 庆大霉素 Gentamicin "庆大霉素为氨基糖苷类抗生素,主要用于敏感需氧革兰阴性杆菌所致的全身感染。氨基糖苷类抗生素(Aminoglycoside)是由氨基糖与氨基环醇通过过氧桥连接而成的苷类抗生素。常见的氨基糖苷类抗生素包括阿米卡星、庆大霉素、卡那霉素、新霉素、奈替米星、妥布霉素、巴龙霉素等。氨基糖苷类抗生素由于价格低、治疗效果明显使其成为临床上一类常用的抗感染药物,常用于治疗由于革兰氏阴性菌引起的各种感染,包括心内膜炎、败血症、肺炎、肾盂炎等。氨基糖苷类抗生素对于细菌的作用主要是抑制细菌蛋白质的合成,作用点在细胞30S核糖体亚单位的16S rRNA解码区的A部位。研究表明此类药物可影响细菌蛋白质合成的全过程,妨碍初始复合物的合成,诱导细菌合成错误蛋白以及阻抑已合成蛋白的释放,从而导致细菌死亡。氨基糖类具有一定的肾毒性和耳毒性,由氨基糖苷类引起的肾毒性一般症状较轻且可以恢复,导致的危害较小;但是由药物导致的前庭神经细胞损伤和耳蜗神经细胞往往是不可逆的,容易导致听力障碍或完全丧失听力[1]。" [1]Hobbie SN, et al. Genetic analysis of interactions with eukaryotic rRNA identify the mitoribosome as target in aminoglycoside ototoxicity. Proc Natl Acad Sci U S A. 2008 Dec 30;105(52):20888-93.
- 7 链霉素 Streptomycin "链霉素为氨基糖苷类抗生素,主要用于敏感需氧革兰阴性杆菌所致的全身感染,和治疗结核病、鼠疫、百日咳、细菌性痢疾、泌尿道感染。氨基糖苷类抗生素(Aminoglycoside)是由氨基糖与氨基环醇通过过氧桥连接而成的苷类抗生素。常见的氨基糖苷类抗生素包括阿米卡星、庆大霉素、卡那霉素、新霉素、奈替米星、妥布霉素、巴龙霉素等。氨基糖苷类抗生素由于价格低、治疗效果明显使其成为临床上一类常用的抗感染药物,常用于治疗由于革兰氏阴性菌引起的各种感染,包括心内膜炎、败血症、肺炎、肾盂炎等。氨基糖苷类抗生素对于细菌的作用主要是抑制细菌蛋白质的合成,作用点在细胞30S核糖体亚单位的16S rRNA解码区的A部位。研究表明此类药物可影响细菌蛋白质合成的全过程,妨碍初始复合物的合成,诱导细菌合成错误蛋白以及阻抑已合成蛋白的释放,从而导致细菌死亡。氨基糖类具有一定的肾毒性和耳毒性,由氨基糖苷类引起的肾毒性一般症状较轻且可以恢复,导致的危害较小;但是由药物导致的前庭神经细胞损伤和耳蜗神经细胞往往是不可逆的,容易导致听力障碍或完全丧失听力[1]。" [1]Hobbie SN, et al. Genetic analysis of interactions with eukaryotic rRNA identify the mitoribosome as target in aminoglycoside ototoxicity. Proc Natl Acad Sci U S A. 2008 Dec 30;105(52):20888-93.
复制代码 总问题描述:
要对文本一进行数据挖掘,根据文本一的第一第四第五列+1和第十列得到文本二的第四列后把得到的这个字符根据第15列的关系和优先级传递到文本三
以上得到:- CYP2C19 NM_000016 c.946-2A>C chr1 76226804 76226805 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18 AA
- CYP2C19 NM_000016 c.946-2A>C chr1 76226814 76226815 1p31.1 1 . C snv . 106,23 77,0,2387 Hom 0.18 CC (传递这个)
- TPMT NM_000016 c.957_958delAT chr1 76226817 76226820 1p31.1 1 . T del . 106,23 77,0,2387 Hom 0.18 BB
- CYP2D6 NM_000016 c.977T>C chr1 76226837 76226838 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18 AB
- CYP2D6 NM_000016 c.977T>C chr1 76226838 76226839 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18 AB (传递这个)
- CYP2D6 NM_000500 c.710T>A chr6 32007583 32007584 6p21.33 1 . A snv . 106,23 77,0,2387 Hom 0.18 AA
- CYP2D6 NM_000492 c.3556C>T chr7 117267662 117267663 7q31.2 1 . T snv . 106,23 77,0,2387 Hom 0.18 AA
- MT-RNR1 NM_000016 c.356C>T chr2 17267662 17267663 7q31.2 1 . T snv . 106,23 77,0,2387 Hom 0.18 .
复制代码 到达文本三之后根据上面的第一列和最后一列对应它的第一二列获得对应的三四列信息,如果没有,获得”. .":
以上得到:
- CYP2C19 NM_000016 c.946-2A>C chr1 76226814 76226815 1p31.1 1 . C snv . 106,23 77,0,2387 Hom 0.18 CC Unknown 临床意义未明
- TPMT NM_000016 c.957_958delAT chr1 76226817 76226820 1p31.1 1 . T del . 106,23 77,0,2387 Hom 0.18 BB IM 快代谢
- CYP2D6 NM_000016 c.977T>C chr1 76226838 76226839 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18 AB EM 快代谢
- MT-RNR1 NM_000016 c.356C>T chr2 17267662 17267663 7q31.2 1 . T snv . 106,23 77,0,2387 Hom 0.18 . . .
复制代码 到了第四个文本,根据上面的第一列和倒数第二列对应文本四的第一第三列,获得二三列,如果上面的倒数第二列是‘.’则只需匹配文本四的第一列,倒数第二列是‘Unknown’,返回‘无’;得到:
- CYP2C19 NM_000016 c.946-2A>C chr1 76226814 76226815 1p31.1 1 . C snv . 106,23 77,0,2387 Hom 0.18 CC Unknown 临床意义未明 无 无
- TPMT NM_000016 c.957_958delAT chr1 76226817 76226820 1p31.1 1 . T del . 106,23 77,0,2387 Hom 0.18 BB IM 快代谢 链霉素 减少剂量或换药
- CYP2D6 NM_000016 c.977T>C chr1 76226838 76226839 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18 AB EM 快代谢 阿米替林 降低剂量
- MT-RNR1 NM_000016 c.356C>T chr2 17267662 17267663 7q31.2 1 . T snv . 106,23 77,0,2387 Hom 0.18 . . . 庆大霉素 换药
复制代码 最后到了第五个文本了,这里的第2列对应上面的倒数第二列,不过难点在于三列和第四列具有[0-9]的序号,需要对输出的文本进行对应递增,就是如果输出三行,第二行开始序号[0-9]将从第一行最后一个序号[0-9]+1开始递增,往后亦然。
所以最后得到:
- CYP2C19 NM_000016 c.946-2A>C chr1 76226814 76226815 1p31.1 1 . C snv . 106,23 77,0,2387 Hom 0.18 CC Unknown 临床意义未明 无 无 无 无
- TPMT NM_000016 c.957_958delAT chr1 76226817 76226820 1p31.1 1 . T del . 106,23 77,0,2387 Hom 0.18 BB IM 快代谢 链霉素 减少剂量或换药 "链霉素为氨基糖苷类抗生素,主要用于敏感需氧革兰阴性杆菌所致的全身感染,和治疗结核病、鼠疫、百日咳、细菌性痢疾、泌尿道感染。氨基糖苷类抗生素(Aminoglycoside)是由氨基糖与氨基环醇通过过氧桥连接而成的苷类抗生素。常见的氨基糖苷类抗生素包括阿米卡星、庆大霉素、卡那霉素、新霉素、奈替米星、妥布霉素、巴龙霉素等。氨基糖苷类抗生素由于价格低、治疗效果明显使其成为临床上一类常用的抗感染药物,常用于治疗由于革兰氏阴性菌引起的各种感染,包括心内膜炎、败血症、肺炎、肾盂炎等。氨基糖苷类抗生素对于细菌的作用主要是抑制细菌蛋白质的合成,作用点在细胞30S核糖体亚单位的16S rRNA解码区的A部位。研究表明此类药物可影响细菌蛋白质合成的全过程,妨碍初始复合物的合成,诱导细菌合成错误蛋白以及阻抑已合成蛋白的释放,从而导致细菌死亡。氨基糖类具有一定的肾毒性和耳毒性,由氨基糖苷类引起的肾毒性一般症状较轻且可以恢复,导致的危害较小;但是由药物导致的前庭神经细胞损伤和耳蜗神经细胞往往是不可逆的,容易导致听力障碍或完全丧失听力[1]。" [1]Hobbie SN, et al. Genetic analysis of interactions with eukaryotic rRNA identify the mitoribosome as target in aminoglycoside ototoxicity. Proc Natl Acad Sci U S A. 2008 Dec 30;105(52):20888-93.
- CYP2D6 NM_000016 c.977T>C chr1 76226838 76226839 1p31.1 1 . C snv . 106,23 77,0,2387 Het 0.18 AB EM 快代谢 阿米替林 降低剂量 "阿米替林是临床常用的三环类抗抑郁药物,用于治疗各种抑郁症。本品镇静作用较强,适用于治疗焦虑性或激动性抑郁症。三环类抗抑郁药物的治疗窗比较窄,血药浓度过高时会对人体产生相当大的毒性,导致严重的不良反应;而血药浓度低于治疗窗时,又容易导致治疗无效[2]。(<==看这里) 副作用包括发烧、皮疹、疲劳、胃肠不适(恶心、呕吐、腹泻和腹痛等)和呼吸综合征(呼吸困难、咳嗽、咽炎等)[3]。因此,适当剂量的给药显的非常重要。阿米替林在体内主要经CYP2C19脱甲基后形成活性代谢产物去甲替林,去甲替林进一步经CYP2D6羟基化后形成无活性的产物排除体外。阿米替林及其主要代谢产物去甲替林在体内的总浓度被用于作为阿米替林调整剂量的依据。" [2]Steimer W, et al. Allele-specific change of concentration and functional gene dose for the prediction of steady-state serum concentrations of amitriptyline and nortriptyline in CYP2C19 and CYP2D6 extensive and intermediate metabolizers. Clin Chem. 2004 Sep;50(9):1623-33.[3]GlaxoSmithKline.Abacavir drug label.2008.
- MT-RNR1 NM_000016 c.356C>T chr2 17267662 17267663 7q31.2 1 . T snv . 106,23 77,0,2387 Hom 0.18 . . . 庆大霉素 换药 "庆大霉素为氨基糖苷类抗生素,主要用于敏感需氧革兰阴性杆菌所致的全身感染。氨基糖苷类抗生素(Aminoglycoside)是由氨基糖与氨基环醇通过过氧桥连接而成的苷类抗生素。常见的氨基糖苷类抗生素包括阿米卡星、庆大霉素、卡那霉素、新霉素、奈替米星、妥布霉素、巴龙霉素等。氨基糖苷类抗生素由于价格低、治疗效果明显使其成为临床上一类常用的抗感染药物,常用于治疗由于革兰氏阴性菌引起的各种感染,包括心内膜炎、败血症、肺炎、肾盂炎等。氨基糖苷类抗生素对于细菌的作用主要是抑制细菌蛋白质的合成,作用点在细胞30S核糖体亚单位的16S rRNA解码区的A部位。研究表明此类药物可影响细菌蛋白质合成的全过程,妨碍初始复合物的合成,诱导细菌合成错误蛋白以及阻抑已合成蛋白的释放,从而导致细菌死亡。氨基糖类具有一定的肾毒性和耳毒性,由氨基糖苷类引起的肾毒性一般症状较轻且可以恢复,导致的危害较小;但是由药物导致的前庭神经细胞损伤和耳蜗神经细胞往往是不可逆的,容易导致听力障碍或完全丧失听力[4]。" [4]Hobbie SN, et al. Genetic analysis of interactions with eukaryotic rRNA identify the mitoribosome as target in aminoglycoside ototoxicity. Proc Natl Acad Sci U S A. 2008 Dec 30;105(52):20888-93.
复制代码 很抱歉。。。其实我觉得真的太难了,我想了一整晚都没想到有好的方法,希望有大神出手帮帮我。。
谢谢,谢谢~ |
|