분류 전체보기 135

[Linux] Ontology (2) - Gene Ontology (with goatools)

이전 포스팅에 이어서 이번엔 gene ontology에 대해 소개하려 한다. Ontology (1) - Sequence Ontology Ontology는 의미적으로, 문맥적으로 연결되어 있는 단어 및 용어들 간의 집합 같은 것이다. 생물정보학에서 주로 쓰이는 ontology에는 sequence ontology와 gene ontology, 이렇게 두 가지가 있다. 이번 포스팅 livelyhheesun.tistory.com 2-1. Gene ontology (GO) - gene functions와 관련된 정보에 해당하는 용어들 - 세 개의 sub-ontologies (1) cellular component: gene function의 결과가 나타나는 곳에 대해 (e.g., Golgi cisterna memb..

[Linux] Ontology (1) - Sequence Ontology

Ontology는 의미적으로, 문맥적으로 연결되어 있는 단어 및 용어들 간의 집합 같은 것이다. 생물정보학에서 주로 쓰이는 ontology에는 sequence ontology와 gene ontology, 이렇게 두 가지가 있다. 이번 포스팅에서는 sequence ontology에 대해서만 다루고, 다음 포스팅에서 gene ontology를 별도로 다루겠다. 1. Sequence ontology (SO) - sequence features와 관련된 정보에 해당하는 용어들 - http://www.sequenceontology.org/browser/obob.cgi에서 각 용어 별 정보 및 다른 개념들과의 연관 관계를 검색해 볼 수 있다. The MISO Sequence Ontology Browser www.s..

[Linux] bio fetch와 bio search

1. bio fetch - accession number를 이용해 해당 데이터를 자동으로 정확한 destination에서 적절한 format으로 다운로드 (1) from GenBank (a) e.g., accession number NC_045512 $ bio fetch NC_045512 | head LOCUS NC_045512 29903 bp ss-RNA linear VRL 18-JUL-2020 DEFINITION Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome. ACCESSION NC_045512 VERSION NC_045512.2 DBLINK BioProject: PRJNA485481 KEYWORD..

[Linux] Entrez Web API와 Entrez Direct로 NCBI 데이터베이스 접속하기

Entrez web API와 Entrez Direct를 사용하여 accession number AF086833.2(https://www.ncbi.nlm.nih.gov/nuccore/AF086833.2)에 해당하는 데이터를 불러와 보겠다. Ebola virus - Mayinga, Zaire, 1976, complete genome - Nucleotide - NCBI no features Feature First Previous Next Last Details www.ncbi.nlm.nih.gov 1. Entrez Web API $ curl -s 'https://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?id=AF086833.2&db=nuccore&rettype..

[Linux] Complete Genomic Data 다운 받기

Genomic data의 데이터 소스는 여럿 존재하지만, 그 중 대표적으로 세 플랫폼 (UCSC, Ensembl, NCBI) 이 있다. 1. UCSC - 지난 포스팅에서 사용한 데이터 파일이 UCSC에서 다운 받은 것이기 때문에 해당 포스팅 참고. Human Genome 데이터 예시 * 이번 예시에서 사용한 sequence data는 https://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes/에서 찾을 수 있다. 해당 사이트에 업로드되어 있는 데이터는 hg38(GRCh38 Genome Reference Consortium Human Reference 38)의 se livelyhheesun.tistory.com 2. Ensembl (https://ftp.en..

[Linux] Human Genome 데이터 예시

* 이번 예시에서 사용한 sequence data는 https://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes/에서 찾을 수 있다. 해당 사이트에 업로드되어 있는 데이터는 hg38(GRCh38 Genome Reference Consortium Human Reference 38)의 sequence data이다. Index of /goldenPath/hg38/chromosomes hgdownload.cse.ucsc.edu 1. 파일 다운 받아 압축 풀고 새 이름의 파일로 저장 $ curl http://hgdownload.cse.ucsc.edu/goldenPath/hg38/chromosomes/chr22.fa.gz | gunzip -c > chr22.fa - 2..

[Linux] 데이터 분석 - 완전 기초

지난 주 유전학까지 수료한 나에게 한 달 남짓의 방학 비슷한 기간이 생겼다. 제일 빠른 분자 생물학 수업이 내년 1월 중순에야 개강하기 때문이다. 그 동안 뭘 할까 생각을 해 보았다. 아무것도 안 하고 쉬면서 시간을 보내기에는 그저 흘려 보내게 될 시간이 너무 아까웠다. 그래서 이것저것 자료를 구글링해 본 결과, The Biostar Handbook이라는 꽤 좋아 보이는 Bioinformatics 자습서를 발견했고, 그 책으로 한 달 동안 공부해 보기로 결정했다. (그래서 한 달 동안의 Bioinformatics 공부 기록은 해당 책의 내용이 다수 포함되어 있을 예정이다.) 그리고 요즘 블로그를 정말 너무 방치만 해 두고 있는 것 같아서 아무리 공부할 게 많아서 바쁘더라도 공부 기록이라도 대충 해 놓으려..

2023 노벨문학상 수상 작가 욘 포세의 『멜랑콜리아 Ⅰ-Ⅱ』

마지막 포스팅 후 3주가 조금 지난 오늘이다. 여전히 나는 내 삶의 다음 챕터를 펼치기 위한 준비를 하며 바쁘고 알차게 지내고 있다. 블로그를 잠시 쉬고 공부에 더 많은 시간과 에너지를 쏟은 덕에 생화학을 수료하고, 유전학 또한 제때 시작할 수 있었고, 벌써 유전학은 절반 가까이 진도가 나갔다. 그러면서 지금 나는 무엇에 집중하는 것이 좋은가에 대해서도 생각을 해 보았다. 오늘의 이 책 리뷰 포스팅을 시작으로 다시 매일 블로그에 글을 써 볼까도 생각했지만, 일단은 나의 두 번째 석사 입시가 어느 정도 마무리될 예정인 내년 여름 즈음까지는 블로그에 너무 많은 에너지를 쏟지 않는 것이 현명할 것 같다고 판단했다. 그래서 적어도 그때까지는 책 한 권씩 읽을 때마다 리뷰 포스팅만 하기로 결정했다. 그리고 오늘 ..

47) 지극히 개인적인 나의 공부하는 일상 - 3

그저께 생화학 수업 진도를 완료했다. 사실 약 2주 전 진도가 밀리기 시작했을 때는 과연 수업 진도를 계획한 날까지 모두 끝낼 수 있을까 의문이었지만, 운동 시간 아껴서 공부하는 데 쓴 보람이 조금은 있는 것 같다. 아직 시험이 남아 있기 때문에 생화학 수업 자체가 마무리지어진 건 아니다. 그래서 어제부터 해당 수업에 대해서는 복습 모드에 돌입했다. 시험도 잘 쳐서 꼭 수료를 할 수 있으면 좋겠다. 아니, 수료해야 한다. 그러니까 복습 철저히 하고 시험 준비 완벽하게 해서 최대한 높은 점수를 받을 수 있도록 해야 한다. 그리고 생화학 과목이 어느 정도 매듭지어지고 있기 때문에 다음 과목인 유전학 수강을 시작하기에 앞서 생화학 진도 따라가느라 끝내지 못했던 유기화학과 생물학 인트로 과목을 12월이 시작되기..

매일의 생각 2023.11.16

46) 아침형 인간 vs. 저녁형 인간

요즘 공부하는 게 일상이어서인지 내가 아침형 인간인지 저녁형 인간인지에 대한 고민을 자주 하게 된다. 보통 아침형 인간이면 아침에 일찍 일어나 생산적인 일을 했을 때 능률이 오르고, 반대로 저녁형 인간이면 밤 늦게 혹은 새벽에 하는 일의 능률이 오르는 편이라고 알려져 있다. 그래서 나는 가끔 공부에 집중이 잘 되지 않을 때 이런 생각을 하곤 한다. 지금이 나의 피크 타임이 아닌 건가. 그래서 내가 지금 집중을 못하고 있는 건가. 일반적으로는 그냥 삶을 살아가다 보면 각자가 가지고 있는 경험적 데이터를 통해 알게 되는 것 같다. 나는 아침형인 것 같은데. 오후 5 - 6시 넘어가는 순간 난 아무 일도 손에 안 잡히더라. 나는 완전 저녁형이야. 새벽엔 진짜 무슨 일이든지 완전 집중 잘 돼. 그러나 나는 아무..

매일의 생각 2023.11.15