Windows perl处理中文

七月 29, 2014

最近在提分网做了一段时间的兼职,工作主要是试题校对,经常需要进行文本替换操作,纯手工操作特别麻烦,于是我就想到是否可以借助 Perl 的正则表达式功能来进行替换。但是以前工作中仅用 Perl 处理过纯英文的字符串,现在要面临的是中文字符串,或者中英文以及数学公式、标点符号混合字符串,而且还是在 Windows 平台上,Perl 能否胜任?

通常,最初测试 Perl 是否正常运行的语句是:

print "Hello, world\n";

那么,如果要测试它打印中文字符串,可以尝试:

print "你好!\n";

点击此处继续阅读 ^_^

BLASTN适用于极短的序列搜索的参数

七月 21, 2014

今天遇到一个小问题:需要搜索若干极短的DNA序列(不到20bp)的来源,首先想到的是BLAST,但是直接用默认参数肯定不行了。后来在某个大学的网站上找到了调整BLAST参数以适应极短的序列搜索的方法:

BLAST Parameters for short query sequences

For searching sequence similarities within very short fragments, BLAST may not be the best choice. If you want to tackle this anyhow, the word size should be reduced to the minimum, and the expectation value should be adjusted as well. Minimal settings for word size are -W 7 for blastn, and -W 2 for blastx in conjunction with reducing the neighborhood word threshold score to -f 8 or below (this is only necessary for blastx). Expectation value should be -E 100. Yes, that's no joke. When comparing against large databases like NT or NR, such high amounts of expected random hits have to be accepted. A lower eValue threshold could be used when only nearly exact matches are desired.

其实主要就是把-W 设成7.尝试过,1条8bp长的序列,就算是严格地在库中存在,如果只用默认参数,啥也搜不到。如果加上-W 7,就可以搜到。

但是第一句话已经给出了警告:对于这样的搜索,其实BLAST并不是最好的选择。究竟有什么更合适的呢?

博客未死,坚持到2024年!

六月 25, 2014

今天给域名续费了(7月1号以后要涨价了)。2024年6月19日,好遥远的日子啊!希望到那个时候我已经过上小老百姓的日子。🙂

母亲节小记

五月 11, 2014

算起来我离开家乡读大学到现在已经有8年了。刚开始,在外地感觉挺新鲜,每过几天就时不时地给妈打电话。后来新鲜味过去了,再加上课业繁忙,往往连续几周都没怎么跟家里联系。

直到去年暑假没回家,却回家过了次中秋——七年来第一次回家过中秋,虽然也只呆了短短一周,那感觉却很不一样了。

那段时间做失败了一个课题,心里郁闷,就宅在宿舍找些老时代的电影来看,多是小时候看过一眼或听过但没细看全部情节的片子,现在回忆起来它们都是经典中的经典,尽管全是港台片。这里面有95年的《金玉满堂》、94年的《新少林五祖》、《九品芝麻官》、92年的《新龙门客栈》,还有一个更古老的,88年的《妈妈再爱我一次》,在我出生之前。
点击此处继续阅读 ^_^

足迹2013

十二月 31, 2013

截至 2013 年,我的足迹:


点击此处继续阅读 ^_^

博客被疯狂刷流量了

十二月 29, 2013

以前博客遇到过被植入恶意代码的。这次黑客攻击更隐秘了,今天发现博客的流量居然已经达到了限额的90%(以前流量从来不会超过10%),我下意识的感觉肯定出问题了,马上联系客服。然后明白了需要去看 log 文件。果然,一堆的 IP 在频繁地 GET,几乎每几秒钟一个,简直达到了丧心病狂的程度。这堆 IP 全部来自于同一个地方:福建莆田电信

然后,在客服的指导下,开始向 .htaccess 里面写入语句:

Order Allow,Deny
Allow from all
Deny from XXX.XXX.XXX.XXX

OK,上传之后,再查看 log,所有的这些 IP 的 GET 请求全部变成了 403,表明已经 deny。

在此提醒广大博主:请注意经常监控流量、磁盘以及查看 log。

 

Copyright © 2010-2018 | Powered by Wordpress and MySQL. Theme by Shlomi Noach, openark.org