(本文由GeneDock公司 Bioinformatics Engineer 刘轩竹撰写,转载请保留作者信息和原文链接)

背景

随着基因测序技术的快速发展,检测成本大幅度降低,使得基因组测序投入临床市场并服务大众。但二代测序发现的变异数量是巨大的,造成变异解读及查找致病基因需耗费大量的人力物力。以人类基因组为例,1个人类基因组包含近3500000个SNV突变和1000个拷贝数变异,其中约20000-25000个变异是在编码区,10000个位点发生了氨基酸编码改变,仅有50-100个发生了蛋白截断或功能缺失,手动检查每个位点非常耗时且有些不切实际。

Variant Effect Predictor(VEP)是功能强大的注释、分析工具。它可以对二代测试产生的不同类型变异进行注释,包含SNPs, insertions, deletions, copy number variants和structural variants。也可以依据各种数据库的内容,根据需要,对变异进行过滤和排序。

GeneDock公有云平台目前提供VEP注释的工作流,使用VEP88对变异进行注释,输入变异检测后的vcf文件,输出注释后的文件(vcf格式)和经筛选后的变异位点。

阅读文章 >>

(本文由GeneDock公司 Bioinformatics Engineer 武雅蓉撰写,转载请保留作者信息和原文链接)

引言:

随着NGS测序成本的降低,高通量测序分析变得越来越普遍。然而,在实际工作中,生信人员往往拿到测序公司提供的数据之后,就直接开始跑流程,去接头、过滤、鉴定变异位点…

然而,过滤前和过滤后的数据到底有什么不同?数据中N碱基的含量如何?低质量的数据是否居多?测序深度是否达到要求?靶标区域覆盖度如何?这一系列的问题往往被急于出分析结果的生信人员(尤其在大Boss的问[逼]候[迫]下)抛之脑后。

满心欢喜去交付自己麻溜完成的分析成果,却遭到了客户对结果的质疑。苦苦回溯分析过程,查找众多可能的出错步骤,最终发现是测序数据质量不过关。前功尽弃,何其郁闷哉…

为保证分析结果的可靠性,对测序数据进行质量控制统计分析意义重大。尤其在临床二代测序检测领域,分析结果的可靠性与否关乎医生的诊断和病人的安危。

参照《临床分子病理实验室二代基因测序检测专家共识》、《二代测序(NGS)技术应用于临床肿瘤精准医学诊断的共识》中要求的指标,以及实际测序数据分析经验,GeneDock的小伙伴为全外显子组和全基因组产品增加了质控统计步骤,主要包括:(1)过滤前后FASTQ文件的基本测序质量统计;(2)比对后BAM文件的基本统计。

阅读文章 >>

(本文是根据GeneDock基因数据工程师孙兴强对GATK4 beta版的调研结果整理,转载请保留转载信息和原文作者及链接。)


注: 本文是根据阅读GATK4在GitHub上的说明文档和版本开发记录并加上对该版本软件对生物信息研发和生产的一些体验组成的。GATK4 GitHub的官网内容会有引用标识,其余内容为笔者的理解内容。由于GATK4还在开发中,本文的时效性会受该项目的开发进度影响,请谨慎阅读。

阅读文章 >>

为贯彻落实科技部实施人类遗传资源采集、收集、买卖、出口、出境等法规政策,加强保护我国人类遗传资源,提高我国生物企业责任感,促进平等互利的国际合作和交流,共同筑起保护我国人类遗传资源防线,GeneDOCK等数十家生物企业共同倡议:

阅读文章 >>

(本文根据GeneDock产品总监何荣惠在知乎的回答整理而成,转载请保留转载信息和原文作者及链接。)




本文根据GeneDock产品总监何荣惠在知乎的回答整理而成。原问题:to B 的产品经理和 to C 的产品经理有什么差别? to B 的产品经理的价值如何体现?

阅读文章 >>