12月
12
2019

从ENA下载SRA

更新于: 2020 九月 8

最近(2020年以来),Aspera(ascp)无法从NCBI下载SRA了,但是可以用ENA下载。现在以(SRR10609482)为例:

第一步:获取准确链接

访问https://www.ebi.ac.uk/ena/browser/view/SRR10609482,获取准确链接如下:

ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_1.fastq.gz
ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR106/082/SRR10609482/SRR10609482_2.fastq.gz

可以看出中间出现了一个奇怪的三位数082

第二步:打开防火墙33001端口

-I INPUT -p tcp --dport 33001 -j ACCEPT
-I OUTPUT -p tcp --dport 33001 -j ACCEPT

第三步:下载

ascp -P 33001 -v -k 1 -T -l 300m -i XXX/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR881/002/SRR8815512/SRR8815512_1.fastq.gz .
# 注意最后一个参数(.)不要忘记了(指下载目标路径)

这样子还有一个好处:下载下来的就是gzip压缩的FASTQ,无需从SRA解压。

那么,中间那个奇怪的三位数是什么?

通常情况下,它就是0+SRR ID的最后两位,例如本例是SRR10609482,那么中间三位数就是082。

但是,有时候会有例外,例如SRR8815512的中间三位数就是002,而不是012。这是很令人头疼的。

posted in Biology Science, Science by billzt

Follow comments via the RSS Feed | Leave a comment | Trackback URL

Subscribe
提醒
guest

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据

0 评论
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x
 

Copyright © 2010-2020 | Powered by Wordpress and MySQL. Theme by Shlomi Noach, openark.org. Icon by Animaticons