善学者,假人之长以补其短



“GeneDock的核心竞争力来自于丰富的云计算环境搭建和管理经验,以及使用多种数据技术快速分析处理基因数据的能力。这两点的基础正是云计算所能提供的无上限的计算资源。”

GeneDock所提供的公有云环境使得用户不需要在本地准备计算和存储资源,通过GeneDock客户端和网页平台即可完成数据传输、管理、分析等操作。针对用户的实际业务场景,GeneDock云平台在正式上线时便准备了主要用于体验和调试的公有云北京域以及可供用户完成批量生产任务的公有云深圳域,在实现不同目的用户互相隔离互不干扰的同时,也解决了跨地域数据传输可能遇到的问题。

阅读文章 >>




快捷稳定的数据传输是海量基因数据云端分析的基础,也一直是GeneDock研发的重点方向。过去,针对生命科学领域的实际需求和生信分析人员的使用习惯,GeneDock开发了命令行模式的客户端,方便生信人员尽快地掌握GeneDock平台的使用方法。如今,随着用户数的增长和分析数据量的上升,GeneDock对原有的数据传输方式和命令行客户端功能进行了重要的升级,希望能够为所有用户带来更出色的使用体验。


阅读文章 >>

(本文由GeneDock Senior Bioinformatics Engineer 许雄翻译撰写,转载请保留作者信息和原文链接)

usage


samtools

Program: samtools (Tools for alignments in the SAM format)
Version: 1.3 (using htslib 1.3)

阅读文章 >>




GeneDock成立至今已经453天,每一天,我们都在努力地积累和生长,让自己可以更好地承担用户的期望。GeneDock的数据管理系统从Data V1升级到了Data V2,我们迈出了一小步。这一小步离不开团队中每个人的辛劳付出,也离不开用户的批评和建议。


阅读文章 >>

(本文由GeneDock工程师刘畅撰写,原文地址 转载请保留作者信息和原文链接)

概述

Python 是一门优美简单、功能强大的动态语言。在刚刚接触这门语言时,我们会被其优美的格式、简洁的语法和无穷无尽的类库所震撼。在真正的将python应用到实际的项目中,你会遇到一些无法避免的问题。最让人困惑不解的问题有二类,一个 编码问题,另一个则是引用问题。

本文主要讨论关于Python中import的机制、实现、以及介绍一些有意思的Python Hooks。

阅读文章 >>


黑夜似一头巨兽,吞没了这座充斥着现代气息的古老城市。

夜色渐浓,城市中心偏西北,那个靠近宇宙中心的地方,一扇窗户如往常那样闪着幽幽的光。

从窗户望进去,便会看到惊人的一幕:在两面巨大的显示屏背后,一位少年正在用匪夷所思的动作忙碌着。他十指在键盘上高速跳动,偶尔飞快地移动一下鼠标。少年的双手在空中留下了一串串残影,两面屏幕上则有代码如瀑布般倾泻而下。


阅读文章 >>

(本文由GeneDock资深扫地大叔王海洋撰写, 转载请保留作者信息和原文链接)

随着Docker [1]的普及和在不同企业的深入应用,对于如何更安全,更快速的管理及存储 丰富多样的Docker私有镜像成为使用者亟需解决的问题。目前对于这个问题,Docker官方提供了公共的Docker Hub为用户管理Docker 镜像。国内也有京东开源的Speedy, DaoCloud提供的Docker Hub等。

除此以外的另一种常用方案是搭建自己的私有镜像仓库。本文以阿里云的环境为例,将介绍如何在Ubuntu12.04上基于Docker Registry V2 [2],阿里云OSS, Nginx [4]搭建负载均衡自己的Docker镜像私有仓库, 如图1.

本文内容主要包括以下几个主要部分:

  1. Docker Registry Server端配置
  2. Docker Registry Client端配置
  3. 如何使用使用私有Docker Registry

同时,本文还会介绍如何配置负载均衡Nginx,及如何使用OSS作为Docker 镜像的存储。

阅读文章 >>

“基因大数据的分析处理必须解决很多难题:首先是怎样保证数据的安全和权限隔离……对第一个问题给出完备的答案,是我们这份事业的前提。我们自己放心,才可以让用户放心。”

——聚道科技CEO李厦戎在“云之稻”媒体见面会上说。

       安全是挖掘并利用数据的前提。2009年至2012年,美国政府共发现了2100万例健康报告的泄露事件,其中66%是由于本地的电源或存储设备的损坏、遗失或被窃造成的。另外,据美国HHS部的估计,约77%的个人数据面临着相同的风险。约6%的个人数据则面临着被入侵的风险。

       为了解决安全问题,GeneDock主要从数据安全、架构安全、管理安全三个角度入手,使用符合HIPAA安全规范的技术手段,通过覆盖数据运作的所有环节,让你高枕无忧。

阅读文章 >>

(本文由GeneDock实习工程师胡英谦撰写,原文地址 转载请保留作者信息和原文链接)

如何基于Docker容器技术,构建一个自动化、易管理、高可用的运维部署系统。本文希望分享GeneDock的经验和教训。


GeneDock的系统是典型的微服务架构:超过二十个模块分别负责平台的各项功能,例如接口、权限、资源管理、编译、调度、监控等,模块之间通过RESTful接口相互通讯。模块这么多,如果没有自动部署工具,运维工程师全凭手工操作,在敏捷开发的快节奏下,升级部署会成为一个大坑。

于是需求来了:用程序代替人,实现脚本化甚至自动化部署。


先干什么?大多数工程师都会想到两件事:

       1.采用Docker技术发布和部署所有服务。
       2.编写脚本,自动完成代码下载、构建镜像、启动服务的流程。

阅读文章 >>