AWS 활용 튜토리얼
Genomics on AWS
Genomics on AWS
  • Genomics on AWS
  • Amazon Genomics CLI
    • Amazon Genomics CLI
  • Amazon Omics
    • Amazon Omics
  • AWS Architecture Blog
    • Genomics workflows
Powered by GitBook
On this page
  • AWS 클라우드 상에서 유전체 분석을 위한 방법들
  • Workflow Language
  • AWS ParallelCluster
  • AWS Batch
  • Amazon Genomics CLI
  • Amazon Omics

Genomics on AWS

NextAmazon Genomics CLI

Last updated 1 year ago

  • Amazon Genomics CLI

  • Amazon Omics

AWS 클라우드 상에서 유전체 분석을 위한 방법들

Workflow Language

워크플로우 언어를 사용하면 보다 쉽게 클라우드에서 유전체학 워크로드를 구현 및 사용할 수 있습니다. 보다 자세한 사항은 각 언어별 Documentation을 참고 부탁드립니다.

AWS ParallelCluster

  • 온프레미스의 HPC Cluster 에 가장 근접한 방법입니다. 온프레미스 클러스터 환경이나 하이브리드 환경을 구축하고자 하는 경우에만 권장 됩니다. 클러스터 관리 및 설정이 필요합니다.

  • 물론 이 서비스를 사용하면 GUI 기반으로 쉽게 HPC 클러스터를 구축하고 운영할 수 있습니다. AWS Batch 또는 Slurm 엔진을 선택해서 구축할 수 있습니다.

AWS Batch

  • 모든 컨테이너화된 워크플로우를 실행할 수 있습니다. Batch는 Nextflow 및 miniWDL과 매우 잘 통합되어 있습니다. Cromwell과 통합할 수 있는 솔루션도 있으며 앞의 엔진들보다는 설정이 상대적으로 간편하지는 않더라도 CWL(또는 Toil)과도 통합할 수 있습니다.

  • 컴퓨팅 환경, 작업 대기열, 작업 실행에 필요한 IAM 역할의 설정 및 관리가 필요합니다.

  • 확장성이 높으며 스팟 인스턴스를 활용할 수 있습니다.

  • AWS 기반 구축에 능숙하고 컴퓨팅 환경, 대기열의 세부 사항을 제어하고 비용 최적화를 위해 스팟을 사용하려는 경우에만 권장됩니다.

Amazon Genomics CLI

  • AWS Batch에서 실행되며 Nextflow, WDL, Snakemake 및 CWL을 지원합니다.

  • AWS Batch에서 실행하는데 필요한 모든 설정을 수행하고, 배치에서 실행하도록 워크플로우를 설정하는데 관련된 복잡성을 추상화하여 상대적으로 사용이 간편합니다. (CLI 기반)

  • Amazon Omics를 사용할 수 없는 경우 해당 리전에서 권장됩니다.

  • 다만 서비스 팀이 보안 문제를 제외하고는 오픈소스이기때문에 특별히 고객 지원에 대한 기대가 크지 않습니다.

  • 확장성 및 비용 관리를 위한 스팟 인스턴스 사용과 관련해 위에서 설명한 AWS Batch와 동일한 이점이 있습니다.

Amazon Omics

  • 완전 관리형 컴퓨팅, 모든 컨테이너가 프라이빗이어야 하며 현재 Nextflow, WDL, CWL을 지원합니다.

AWS ParallelCluster
Nextflow - AWS
Workflow Language KR - Slack