Como fazer o download de reads de DNA no NCBI pelo Windows 10 utilizando o Subsystem for Linux - WSL
Автор: Lourenço Ferreira
Загружено: 2021-10-28
Просмотров: 71
TUTORIAL
Como baixar reads do NCBI de duas formas:
1.Download direto da sequência
2.Download pela ferramenta SRA Toolkit
/mnt/c/Windows/System32/Wbem/fastprox.dll
C:\Users\loure\AppData\Local\Packages\CanonicalGroupLimited.UbuntuonWindows_79rhkp1fndgsc\LocalState\rootfs\home\lourenco
Hierarquia do NCBI
HHS.gov - U.S. Department of Health & Human Services
HHS Operating Divisions: NIH - National Institutes of Health
Institute: NLM - National Library of Medicine
Division: NCBI - National Center for Biotechnology Information
1 - Entrar no NCBI - https://www.ncbi.nlm.nih.gov/
2 - Selecionar o banco de dados SRA - https://www.ncbi.nlm.nih.gov/sra/
3 - 1ª Opção: Download direto da sequência: inserir o código da sequência (SRR16572037)
3.1 - Clicar no mesmo código que está na coluna "Run"
3.2 - Clicar na aba "Reads"
3.3 - Clicar em "Filtered Download"
3.4 - Selecionar o formato "FASTQ"
3.5 - Clicar em "Download"
4 - 2ª Opção: Download pela ferramenta SRA Toolkit: Entrar no NCBI - https://www.ncbi.nlm.nih.gov/
4.1 - Selecionar o banco de dados SRA - https://www.ncbi.nlm.nih.gov/sra/
4.2 - Clicar em "Download SRA Toolkit"
4.3 - Clicar na aba "Software"
4.4 - Clicar em "Toolkit Documentation"
4.5 - Clicar em "SRA Toolkit Installation and Configuration Guide"
4.6 - Digitar o comando Para Linux Ubuntu para iniciar a instalação: wget --output-document sratoolkit.tar.gz http://ftp-trace.ncbi.nlm.nih.gov/sra...
4.7 - Descompactar o arquivo: tar -vxzf sratoolkit.tar.gz
4.8 - Renomeie o diretório para sratoolkit (Opcional)
4.9 - Por conveniência (e para mostrar onde estão os binários), anexe o caminho para os binários à sua variável de ambiente PATH:
ls -lia
nano .bashrc
Digite apenas uma sequência no bashrc (preferência: sequência 1):
sequência 1:
export PATH=$PATH:/usr/sbin:/usr/local/sbin
export PATH=$PATH:$PWD/sratoolkit.2.11.2-ubuntu64/bin
OU
sequência 2:
export PATH=$PATH:/usr/sbin:/usr/local/sbin ###(Opicional)
export PATH=$PATH:$PWD/sratoolkit/bin
4.10 - Clique Ctrl+Z para salvar
4.11 - Teste se o binário será encontrado com o comando: which fastq-dump
4.12 - A resposta será: /Users/JoeUser/sratoolkit/bin/fastq-dump
4.13 - Clique em "Quick Toolkit Configuration"
Há apenas um identificador de opções que precisam ser habilitadas para poder acessar dados públicos e de acesso controlado na nuvem. Para iniciar a configuração, execute:
vdb-config -i
Você verá uma tela onde opera os botões pressionando a letra destacada em vermelho ou pressionando a tecla tab até que o botão desejado seja alcançado e, em seguida, pressionando a tecla de espaço ou a tecla enter.
Você precisa habilitar a opção "Acesso remoto" na tela principal.
Se desejar que o kit de ferramentas use como padrão o formato SRA Lite com menores pontuações de qualidade simplificadas, defina a opção "Preferir arquivos SRA Lite com pontuações de qualidade básicas simplificadas" na tela principal.
Prossiga para a guia "Cache", onde você irá habilitar o "cache de arquivo local" e definir o "Local do repositório do usuário".
a) O diretório do repositório precisa ser definido como uma pasta vazia. Esta é a pasta onde a pré-busca irá depositar os arquivos.
Vá para a guia do seu provedor de nuvem e aceite "relatar a identidade da instância da nuvem".
A identidade da instância de nuvem apenas informa em qual nuvem (AWS v GCP) você está trabalhando, para que possa acessar os dados gratuitamente.
Testando a ferramenta:
fasterq-dump --split-files SRR11180057
Доступные форматы для скачивания:
Скачать видео mp4
-
Информация по загрузке: