'Science' Category

  • 密码子的简并性

    十二月 15, 2014

    “密码子简并”的概念在中学生物里就提过,即几个不同的密码子可以编码相同的氨基酸。但是密码子简并的规律之前却一直是模模糊糊的,趁这次刚完成类似的课题。趁热打铁总结一下:

    首先,为了直观、方便地看密码子的简并,我们需要一张“环形密码子图”,而非通常教科书上的那种“方格形密码子表”。下面就是我常用的一张环形密码子图,它的核心由三个同心圆组成:由里到外分别表示第 1 位、第 2 位和第 3 位密码子,外圈是密码子编码的氨基酸及其理化特性。
    点击此处继续阅读 ^_^

  • BLASTN适用于极短的序列搜索的参数

    七月 21, 2014

    今天遇到一个小问题:需要搜索若干极短的DNA序列(不到20bp)的来源,首先想到的是BLAST,但是直接用默认参数肯定不行了。后来在某个大学的网站上找到了调整BLAST参数以适应极短的序列搜索的方法:

    BLAST Parameters for short query sequences

    For searching sequence similarities within very short fragments, BLAST may not be the best choice. If you want to tackle this anyhow, the word size should be reduced to the minimum, and the expectation value should be adjusted as well. Minimal settings for word size are -W 7 for blastn, and -W 2 for blastx in conjunction with reducing the neighborhood word threshold score to -f 8 or below (this is only necessary for blastx). Expectation value should be -E 100. Yes, that's no joke. When comparing against large databases like NT or NR, such high amounts of expected random hits have to be accepted. A lower eValue threshold could be used when only nearly exact matches are desired.

    其实主要就是把-W 设成7.尝试过,1条8bp长的序列,就算是严格地在库中存在,如果只用默认参数,啥也搜不到。如果加上-W 7,就可以搜到。

    但是第一句话已经给出了警告:对于这样的搜索,其实BLAST并不是最好的选择。究竟有什么更合适的呢?

  • 第二篇论文

    八月 28, 2013

    当初第一篇论文被接受时,迫不及待地要写一篇博客来庆祝一下。然后,就在同一个月,第二篇论文也被接受了,离投稿相隔了两个月。因为投的是 PLos One 这种被称为“灌水级别”的杂志,要求不是太高,而且审稿速度也很快,因此经过一个月的初审,然后一次小修之后,就搞定了。

    不知为什么当时没有记录一下呢?可能是因为这个过程太波澜不惊了,直到今天,看到博客的首页已经将近五个月没动笔,才想起来补一个上去。
    这种波澜不惊的活儿以后不会再有了。以后面临的,是充满挑战的全新的领域:Population genetics。SNP、DAF、Tajima's D,welcome!
  • 第一篇论文被接受

    三月 6, 2013

    回顾一下这崎岖坎坷的历程:
    点击此处继续阅读 ^_^

  • 利用 Trinity+IGV 将 BLAT 的结果可视化

    一月 28, 2013

    课题组经常需要验证某个(或某些)注释的内含子是否存在,于是就需要使用转录数据去 map 基因组。转录数据目前常用的有两类,一类是高通量测序的 RNA-seq,这种 Map 比较简单,使用 tophat 处理即可得到比对结果,然后用 IGV 就可以实现可视化。输入数据是参考基因组和比对结果(tophat 输出的是 bam 文件,在导入 IGV 之前记得把两个数据都用 samtools 做一下索引,否则速度慢得有你好受的……)

    另一类是 EST,它们的序列比 RNA-seq 长一些,而且长度不等。这类 Map 主要是使用 BLAT 来完成。但是 BLAT 默认输出的 psl 格式的结果极其难读,更不用提可视化了。今天在网上找到了一个方法,利用 Trinity 里面的一个实用工具居然可以调用 BLAT 并产生 bam 格式的比对结果。特此记录一下。
    点击此处继续阅读 ^_^

  • 第二篇投稿

    一月 18, 2013

    经过长达四个月的修炼,第二篇文章 Mechanisms of Intron Loss and Gain in the Fission Yeast Schizosaccharomyces 终于完成并投稿了。滑稽的是,第一篇文章(去年六月份投稿的)到现在还没有着落。

    在迄今为止做的十八个课题中,这个课题的前世今生最具波折:
    点击此处继续阅读 ^_^

 

Copyright © 2010-2020 | Powered by Wordpress and MySQL. Theme by Shlomi Noach, openark.org