善学者,假人之长以补其短

“基因大数据的分析处理必须解决很多难题:首先是怎样保证数据的安全和权限隔离……对第一个问题给出完备的答案,是我们这份事业的前提。我们自己放心,才可以让用户放心。”

——聚道科技CEO李厦戎在“云之稻”媒体见面会上说。

       安全是挖掘并利用数据的前提。2009年至2012年,美国政府共发现了2100万例健康报告的泄露事件,其中66%是由于本地的电源或存储设备的损坏、遗失或被窃造成的。另外,据美国HHS部的估计,约77%的个人数据面临着相同的风险。约6%的个人数据则面临着被入侵的风险。

       为了解决安全问题,GeneDock主要从数据安全、架构安全、管理安全三个角度入手,使用符合HIPAA安全规范的技术手段,通过覆盖数据运作的所有环节,让你高枕无忧。

阅读文章 >>

(本文由GeneDock实习工程师胡英谦撰写,原文地址 转载请保留作者信息和原文链接)

如何基于Docker容器技术,构建一个自动化、易管理、高可用的运维部署系统。本文希望分享GeneDock的经验和教训。


GeneDock的系统是典型的微服务架构:超过二十个模块分别负责平台的各项功能,例如接口、权限、资源管理、编译、调度、监控等,模块之间通过RESTful接口相互通讯。模块这么多,如果没有自动部署工具,运维工程师全凭手工操作,在敏捷开发的快节奏下,升级部署会成为一个大坑。

于是需求来了:用程序代替人,实现脚本化甚至自动化部署。


先干什么?大多数工程师都会想到两件事:

       1.采用Docker技术发布和部署所有服务。
       2.编写脚本,自动完成代码下载、构建镜像、启动服务的流程。

阅读文章 >>

       9月15日,农科院、阿里云、华智水稻、聚道科技共同举办了“云之稻”媒体见面会,正式对媒体和科学界宣布“云之稻”项目上线。该项目是源自于比尔和梅琳达•盖茨基金会的“为非洲和亚洲资源贫瘠地区培育绿色超级稻”项目和国家国际合作专项共同资助的3000份水稻基因组项目的测序成果。这一系列项目的总体目标是培育能够广泛适⽤于灌溉和⾬养地区⽣态环 境,并具有氮磷高效利⽤、抗病、抗⾍、高产、优质、抗逆(干旱、盐碱)等特性的水稻新品种,并在目标国家进⾏⽰范和推⼴。

阅读文章 >>

Hi GDers,

       GeneDock一周岁了!

       2014年9月9日,我司诞生于回龙观智慧社一个普通的二居室里。

       当天,只有我、乐珩、海洋、程夫四个人,我们简单收拾了下房子,去华联超市买了点零食和水就开工了。

       那时候,我们的数据上传OSS还有问题,程夫同学测试了好久都没把数据传上去,而workflow还不能运行。

       一晃一年,加入了更多有梦想的GDer,产品如同新生儿般茁壮,有了相信我们梦想的天使客户,有了信任我们的投资者。

阅读文章 >>

(本文由GeneDock公司 Bioinformatics Engineer MAO 撰写,转载请保留作者信息和原文链接)

基本信息

  • 测试集群 CPU 型号: Intel(R) Xeon(R) CPU E5-4610 v2 @ 2.30GHz
  • bwa 版本:0.7.12-r1039
  • 参考序列:hg19
  • 原始数据:SRX265482

一、小样本测试

1
2
3
4
$ wc -l read*_1000.fq
1000 read1_1000.fq
1000 read2_1000.fq
2000 total

提取了 1000 行 fastq 数据,一共 250 条 reads 做测试。

1
2
$ samtools view reads_1000.sam | wc -l
501

Mapping 出来的结果是 501 行。

阅读文章 >>


[招聘]前端工程师

GeneDock.com是基因数据云计算领域的创业团队,帮助各领域用户处理海量的基因数据。随着业务增长和产品功能的增加,前端团队已经忙不过来了。所以我们需要你:一位有品味、有好奇心、热衷于前端技术的工程师。

阅读文章 >>


[招聘]基因数据工程师

传统生物信息分析是件苦逼的差事:维护服务器,安装系统,配置升级软件,调试脚本,传输数据,调整参数执行workflow,搜集实验数据,查询数据库,做图表,攒报告…… 日复一日,重复数百遍。
软件和网络正在改变世界,低效琐碎重复的人工操作应该让机器去干。GeneDock团队正在努力打造高效简捷的生物信息云平台。
现在我们需要你,一位有品位的基因数据工程师。
加入GeneDock,一起用前沿技术打造最酷的产品,让数据分析变得更高效,让生物信息应用变得更有趣。

阅读文章 >>