생물정보학 13

[Linux] Complete Genomic Data 다운 받기

Genomic data의 데이터 소스는 여럿 존재하지만, 그 중 대표적으로 세 플랫폼 (UCSC, Ensembl, NCBI) 이 있다. 1. UCSC - 지난 포스팅에서 사용한 데이터 파일이 UCSC에서 다운 받은 것이기 때문에 해당 포스팅 참고. Human Genome 데이터 예시 * 이번 예시에서 사용한 sequence data는 https://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes/에서 찾을 수 있다. 해당 사이트에 업로드되어 있는 데이터는 hg38(GRCh38 Genome Reference Consortium Human Reference 38)의 se livelyhheesun.tistory.com 2. Ensembl (https://ftp.en..

[Linux] Human Genome 데이터 예시

* 이번 예시에서 사용한 sequence data는 https://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes/에서 찾을 수 있다. 해당 사이트에 업로드되어 있는 데이터는 hg38(GRCh38 Genome Reference Consortium Human Reference 38)의 sequence data이다. Index of /goldenPath/hg38/chromosomes hgdownload.cse.ucsc.edu 1. 파일 다운 받아 압축 풀고 새 이름의 파일로 저장 $ curl http://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes/chr22.fa.gz | gunzip -c > chr22.fa - 2..

[Linux] 데이터 분석 - 완전 기초

지난 주 유전학까지 수료한 나에게 한 달 남짓의 방학 비슷한 기간이 생겼다. 제일 빠른 분자 생물학 수업이 내년 1월 중순에야 개강하기 때문이다. 그 동안 뭘 할까 생각을 해 보았다. 아무것도 안 하고 쉬면서 시간을 보내기에는 그저 흘려 보내게 될 시간이 너무 아까웠다. 그래서 이것저것 자료를 구글링해 본 결과, The Biostar Handbook이라는 꽤 좋아 보이는 Bioinformatics 자습서를 발견했고, 그 책으로 한 달 동안 공부해 보기로 결정했다. (그래서 한 달 동안의 Bioinformatics 공부 기록은 해당 책의 내용이 다수 포함되어 있을 예정이다.) 그리고 요즘 블로그를 정말 너무 방치만 해 두고 있는 것 같아서 아무리 공부할 게 많아서 바쁘더라도 공부 기록이라도 대충 해 놓으려..