善学者,假人之长以补其短

(本文由GeneDock公司 Bioinformatics Engineer Huanwei Wang撰写,转载请保留作者信息和原文链接)

引子

在二代测序(NGS)领域中,Fastq文件大小和测序深度(即测了多少乘)是两个常用的概念,但不同人给出的Fastq文件大小与测序深度的比例可能并不一致,而且之间的关系也一直模糊不清。

故,这篇博客就试图去探讨这两者的关系及其相关概念。

阅读文章 >>

(本文由GeneDock R&D Engineer 吴凯撰写,转载请保留作者信息和原文链接)

前言

生物信息的一个重点就是数据的处理与分析,随着基因行业在临床和科研方面的应用逐渐加深与扩大,样本数量的越来越多,加之分析过程本身也是高并发的过程,如何快速、高效、准确的获得分析结果变成了一个问题。为了应对这个问题,我们需要大量的机器去处理这些作业。当你有一台机器,你可以随时看着这台机器是不是可以继续投递任务,但是拥有一千台甚至是一万台机器的时候,那就已经超出了你的能力程度了。

针对生物信息的计算需求,GeneDock开发了Flash分布式调度平台(简称Flash),它承担了平台的基因分析任务的管理,调度和监控。

阅读文章 >>

(本文由GeneDock公司 Bioinformatics Engineer Huanwei Wang撰写,转载请保留作者信息和原文链接)

引子

API和SDK作为强大的技术,目前在互联网行业中被广泛使用。然而在生物信息行业中,对其了解、掌握和使用的人却很少。故作为GeneDock生物信息工程师的本文作者,希望通过这个博客,记录自己学习API和SDK的心得,也帮助更多其他生物信息从业人员使用它。

背景介绍

什么是API?

API(Application Programming Interface)是一组规则、协议或工具,清楚地定义了不同软件部分之间通信的方法。其将应用程序(application)的实现过程隐藏,只暴露调用所必须的部分,供其他开发者使用。

举个例子,大部分人都不知道投影仪的实现过程和原理,但是很多人都可以按照产品说明书,将电脑通过数据线连接到投影仪上,最终放映幻灯片。

相似地,你可能不知道一个应用程序(例如google map)的实现过程和原理,但是通过阅读API文档、调用API,你就可以方便地使用这个应用程序。

再进一步,GeneDock平台也提供了APISDK,您可以不知道GeneDock产品的实现过程、数据库结构、后台代码,只需调用GeneDock的API,就可以方便地、自动地使用我们GeneDock系统了。

阅读文章 >>

GeneDock(聚道科技)于2017年3月6日正式发布基于云计算的人全基因组标准化分析服务——GeneDock HG。它是一项面向人全基因组大规模分析的服务,主要完成从fastq到vcf的标准化分析,其成本、速度、稳定性和结果准确度均达到了大规模生产服务的标准。GeneDock HG对30X人全基因组数据的分析价格为99元/次,这也是业内首次实现了百元以下的人全基因组标准化分析服务。




阅读文章 >>

本文总结了生物信息人员在使用BLASTX的一些经验,期待与其他同行交流BLASTX的优化经验。

0 前言

BLAST作为生物信息最重要的局部比对工具,在序列物种注释和基因注释起重要作用。其中BLASTX(将query序列翻译成氨基酸序列和蛋白数据库进行比对)常常作为对核酸序列的基因注释工具。BLASTX先要将DNA序列按照6个读码框翻译成氨基酸序列,从而BLASTX的比对时间和需要计算资源都是比较大的,如何减少运行时间和降低运算成本,成为生信工作人员关心的重要问题之一。另外,本文主要讨论BLASTX工具的优化,其他BLASTX的替代工具,比如DIAMOND等,不在此文的讨论范围。

阅读文章 >>

(本文由GeneDock 后端研发实习生魏畅撰写。转载请保留作者信息和原文链接)

Docker简介

Docker是什么?

Docker is the world’s leading software containerization platform.

根据Docker的官方解释,Docker是一个世界领先的软件“集装箱化”平台。

那么“集装箱化”又是什么呢?下面这张图可以帮助我们直观地理解这一概念。


阅读文章 >>

(本文由GeneDock 前端实习生程建华撰写,点击可查看原文。转载请保留作者信息和原文链接)



就在上个礼拜我结束了在北京的前端工程师实习回到了学校,现在正在学校休整中。在实习的这段时间内忙于各种事情也没有再写过一篇博客了,然而一个想成为优秀程序员的我怎么能放弃这样的自我总结机会呢!于是乎现在先写下过去这三个月的暑期实习的感受,从而也让自己清楚一下自己所处的状态。


阅读文章 >>

(本文由GeneDock 后端数据实习生饶梦南撰写,点击可查看原文。转载请保留作者信息和原文链接)


从公司回来,到明天的毕业图像采集,差不多满满一个月了。



从南昌火车站下车,坐232回到麦庐,再从菊圃路口懒洋洋地走到学校后门,如此熟悉的小路,如此熟悉的灯光,也许后面的日子里,我能重复走过的次数屈指可数了。


本来从北京回来时就想写一些东西,然而一直在折腾Linux环境之类的东西拖到了现在。这一个月里,脑海中频频地回荡着在京城的三个月时光。七月中旬到GeneDock实习,十月中旬返校,这期间经历了许许多多的事情,在学习、在心智、在眼界,都有不小的收获。

阅读文章 >>