Machine Learning 3

머신러닝과 Proteomics

머신러닝과 Proteomics 단백질은 아미노산이 연결되어 접힘이 일어나 3차원구조를 가지게 되면서 여러가지 생체 기능을 하는 물질이다. 이 구조는 1차구조(아미노산 시퀀스), 2차구조(알파 헬릭스, 베타 시트), 3차 구조, 4차구조로 세분화 할 수 있다. 단백질의 2차구조 예측(Structure prediction)은 Sub 분야에서 주된 핵심이라고 할 수 있다.(결국 3차구조도 2차구조를 바탕으로 이루어 지기 때문) 그렇지만 단백질의 실질적인 구조를 밝히는 것은 돈도 많이 들고 시간도 엄청 걸리는 일! 그래서 아미노산 시퀀스로부터 직접적으로 Structure prediction 을 하는 방법들이 생겨나고 있는 것이다. 프로테오믹스에 머신러닝이 도입되기 전에는 하나하나 구조를 예측해야만 했지만, 오늘..

Machine Learning 2018.05.02

머신러닝과 Genomics

Machine Learning & Genomics 일단 genomics 는 genome, 즉 complete DNA seq. 를 연구하는 학문이다 근데 시퀀싱 기술 발달하면서 이 지노믹스가 폭발적으로 증가하였다. raw data 가 증가하면서 그 것들의 생물학적 해석도 중요해 졌는데 이때 머신러닝이 사용됨!! protein-encoding gene 의 위치를 자동적으로 결정해주는 머신러닝 시스템도 개발되어야 한다는 니즈가 많았음 (이런 기술을 gene prediction 이라고 함) gene prediction 은 extrinsic search 와 intrinsic search 를 함께 함 extrinsic search 같은 경우에는 Dna seq. 를 인풋으로 놓고 데이터베이스에서 그 자리에서 이미 발..

Machine Learning 2018.05.01

머신러닝과 바이오인포매틱스 [1]

머신러닝은 데이터를 바탕으로 어떠한 예측을 하는 알고리즘을 개발하는 과정을 말한다. 그래서 바이오인포매틱스와도 아주 밀접한 상관성을 지니고 있음!!! 바이오데이터로 computational and mathematical 한 접근 하는 것! 머신러닝 접목하기전에는 특히 단백질 구조예측같은게 어려웠음 하지만 지금은 바이오데이터들이 폭증하면서 이런 머신러닝기법을 사용하기 시작했는데 특히 genomics, proteomics, microarrays, system biology, evolution, text mining 에서 주로 쓰이고 있음!

Machine Learning 2018.04.26