初品BioPerl(第八篇:后续……)

五月 16, 2011

距离 “初品BioPerl” 系列的上一篇文章已经整整过去半年了,有些朋友甚至开始着急:好像还有好多没讲呢?为啥米不更新了呢?
      没错,原因列表如下:

(1)我有点懒,一时半会儿想不出该怎么写。
(2)从博客后台的访问统计来看,这个系列还“比较受欢迎”(尽管我知道在中国学Perl的少得可怜),看来有必要整理一下。
(3)前面几篇分布得太零散了,不整理一下不行了。博客的日志是按照发表时间排序的,适合记录心情,不适合记录过于学术化的玩意儿。学术这东东,讲究按照逻辑排序,不然一些学者要愤怒了。
(4)接下来的内容会比较复杂,直接插到博文里已经不合适了。至于要把它们浅显易懂地描述出来,更是不容易。


      我猜测,至少有一半的朋友在等待:如何用BioPerl来解析GenBank文件。这理解起来确实很不容易,因为GenBank文件是用于存储基因组的,格式不仅复杂,而且精致,适合存档、检查核对。如果仅仅为了统计人类有多少个基因,而去挖出好几个G的GenBank文件来,好像不大值得。其实我相信应该有更简洁的注释文件可供选择,如gff,gtf都是信息丰富而且格式比较简练的注释。当然,如果你真的需要解析GenBank文件,那么BioPerl确实是比较好的选择,而直接使用正则表达式匹配则是比较累人的做法。
      于是,我打算将这个序列的内容分离出来,以纯html形式存放到一个子目录里。大家可以通过 http://bioperl.bnuzhutao.cn 访问它。这个页面是用“所见即所得”的Kompozer制作的,界面非常丑,但至少各种浏览器都能正常访问。网页高手请不要笑话~
      目前已完成第一章,和以前的博文相比,新加入了一些模块安装的内容,让你即使在没有系统管理员权限(或者压根就不想费劲去安装)的前提下也能使用bioperl模块。就在前段时间该cpan上的模块已经更新到了1.6.9版,看来还挺活跃。 🙂
      接下来的内容将包括:解析fasta,建立序列的索引(new!),解析genbank(估计在世界末日到来时完成)…………

posted in Perl by billzt

Follow comments via the RSS Feed | Leave a comment | Trackback URL

说点什么

22 评论 在 "初品BioPerl(第八篇:后续……)"

提醒
排序:   最新 | 最旧 | 得票最多
游客

你实在用perl做生物中中的基因方面的东西吗?

我研究生好像也是这个

游客

@freetstar, 基因研究,这么NB 😳 😛

游客

@Mucid, 一般一般

游客

@freetstar, 如此专业

游客

@婉秋, 没有没有,就和老师聊了下,大概是搞基因什么测序什马的

游客

@freetstar, 是哇!我的专业是生物信息学来着

游客

完全不懂这是什么玩意

游客

估计在世界末日到来时完成!呵呵!有这么严重吗?

游客

@祛斑, 开玩笑的。我的意思是估计在2012年到来时完成。(快了,也就剩7个多月)

游客

在GR上看到有个仙剑5的日志,咋找不着? 😯

游客

@婉秋, 不好意思,那篇日志我确实曾经发表过,3分钟之后发现里面的格式有点问题,就先把它删除了。以后会重新放上来

游客

bioperl 看英文太痛苦了 谢谢楼主 希望继续更新。

游客

@E文不行, 谢谢支持,请多多关注

游客

😛 这里http://bioperl.bnuzhutao.cn的好多程序都是处理单序列。能附上批量处理的程序吗?比如,从长序列中去子序列。

游客

@张强, 批量处理的话可以使用循环啊~

游客

@billzt, 刚接触perl 语言,很多地方都不太懂。一直学习你的 “初品BioPerl” 系列,收获颇多。

游客

@张强, 哦,既然这样的话,你应该先把普通的Perl学精通了,再来看bioperl,这样比较好

游客

期待中。。。。。。。。。。
忠实读者。

游客

很不错 我也是做bioinfor的 欢迎多交流

游客

@Eason, 好呀,呵呵

游客

正好最近要用bioperl的初学者看到LZ的文章激动到满眼放光有木有!看英文实在是不习惯,bioperl的帮助文档像天书一样,一点都不简洁明了!期待LZ下文,一定要在末日前写完呀!不然我毕业没指望了【对手指】

游客

@stanwish, 要忙paper,伤不起呀!争取今年之内把paper搞定,再腾出手来解决其它问题

wpDiscuz
 

Copyright © 2010-2017 | Powered by Wordpress and MySQL. Theme by Shlomi Noach, openark.org