善学者,假人之长以补其短

(本文由GeneDock公司 Bioinformatics Engineer 武雅蓉撰写,转载请保留作者信息和原文链接)

引言:

随着NGS测序成本的降低,高通量测序分析变得越来越普遍。然而,在实际工作中,生信人员往往拿到测序公司提供的数据之后,就直接开始跑流程,去接头、过滤、鉴定变异位点…

然而,过滤前和过滤后的数据到底有什么不同?数据中N碱基的含量如何?低质量的数据是否居多?测序深度是否达到要求?靶标区域覆盖度如何?这一系列的问题往往被急于出分析结果的生信人员(尤其在大Boss的问[逼]候[迫]下)抛之脑后。

满心欢喜去交付自己麻溜完成的分析成果,却遭到了客户对结果的质疑。苦苦回溯分析过程,查找众多可能的出错步骤,最终发现是测序数据质量不过关。前功尽弃,何其郁闷哉…

为保证分析结果的可靠性,对测序数据进行质量控制统计分析意义重大。尤其在临床二代测序检测领域,分析结果的可靠性与否关乎医生的诊断和病人的安危。

参照《临床分子病理实验室二代基因测序检测专家共识》、《二代测序(NGS)技术应用于临床肿瘤精准医学诊断的共识》中要求的指标,以及实际测序数据分析经验,GeneDock的小伙伴为全外显子组和全基因组产品增加了质控统计步骤,主要包括:(1)过滤前后FASTQ文件的基本测序质量统计;(2)比对后BAM文件的基本统计。

阅读文章 >>

(本文是根据GeneDock基因数据工程师孙兴强对GATK4 beta版的调研结果整理,转载请保留转载信息和原文作者及链接。)


注: 本文是根据阅读GATK4在GitHub上的说明文档和版本开发记录并加上对该版本软件对生物信息研发和生产的一些体验组成的。GATK4 GitHub的官网内容会有引用标识,其余内容为笔者的理解内容。由于GATK4还在开发中,本文的时效性会受该项目的开发进度影响,请谨慎阅读。

阅读文章 >>

为贯彻落实科技部实施人类遗传资源采集、收集、买卖、出口、出境等法规政策,加强保护我国人类遗传资源,提高我国生物企业责任感,促进平等互利的国际合作和交流,共同筑起保护我国人类遗传资源防线,GeneDOCK等数十家生物企业共同倡议:

阅读文章 >>

(本文根据GeneDock产品总监何荣惠在知乎的回答整理而成,转载请保留转载信息和原文作者及链接。)




本文根据GeneDock产品总监何荣惠在知乎的回答整理而成。原问题:to B 的产品经理和 to C 的产品经理有什么差别? to B 的产品经理的价值如何体现?

阅读文章 >>

(本文由GeneDock公司Senior DevOps Engineer王皓撰写,转载请保留转载信息和原文作者及链接)

写在前面的话

本文共分三篇:运维篇,开发篇,测试篇。分别从三个角度看DevOps究竟是什么,也许“答案在风中飘扬”。同时也邀请你一起为GeneDock的DevOps之路出谋划策。

阅读文章 >>

(本文由GeneDock公司 Bioinformatics Engineer 武雅蓉撰写,转载请保留作者信息和原文链接)

引子

为了完成主任交代的任务–同时提交成百上千次分析,小F找到了肿瘤科的小W求助。

小F:“小W,上回咱俩交流完,我通过Python SDK已经成功在GeneDock平台提交了任务。我们主任为此还夸奖了我,好激动。可是我们那边样本量很大,经常是成百上千个,如何通过Python SDK批量提交这么多分析任务呢?一个一个地手动修改配置文件好辛苦,还容易出错。”

小W:“这个简单!这种情况的批量提交任务就相当于,按照样本信息把配置文件中的输入项和输出项批量替换,每次替换完配置文件提交一个任务。下面我给你详细说一下具体步骤:”

阅读文章 >>

5月12日至14日,ACM图灵奖五十年中国大会(ACM TURC 2017)在上海召开。



图灵奖(A.M. Turing Award)由美国计算机协会(ACM)于1966年设立,其名称取自计算机科学的先驱、英国科学家阿兰·麦席森·图灵(Alan Mathison Turing)。图灵奖是计算机界最负盛名、最崇高的一个奖项,被誉为“计算机界的诺贝尔奖”。


阅读文章 >>

2017年5月15日,GeneDock正式发布人全基因组体细胞突变标准化数据分析服务:GeneDock HGTM Somatic。
HG Somatic 延续了GeneDock HG “多快好省”的特点,适用于成对测序样本标准化数据分析,可快速鉴定体细胞突变(somatic mutations)。这种分析方法常用于肿瘤领域的组学研究。

利用GeneDock HGTM Somatic完成一次常规的成对测序样本数据分析(30X Normal+60X Tumor),分析计算时长约为9小时,仅需299元。

阅读文章 >>