生信分析云平台产品开发 - 2样本信息处理

生信分析云平台开发 - 2样本信息处理

生信分析云平台开发- 样本信息处理


一、基于生信分析云平台的需求,在下图中可以看出样本信息在整个软件中的作用


attachments-2019-08-PBuNhWDW5d669873ae44c.png



样本信息用于数据拆分、运行运行流程、分析报告,是整个系统的基础数据之一。

下面来具体归纳一下样本信息在软件系统的作用并列出详细的数据字段:


1、 用于标记分析运行状态的 

序号

字段名称

数据类型

作用

1

样本编号

SampleID${sn}

字符

系统内唯一编号,用于区别样本,为了便于识别,默认为样本编号内容设计了一套编码规则(非强制)

 

以样本编号:B1908280744FF 为例:

A. 前缀:B代表分析流程的代号,显示该样本用于哪个项目,与 项目编号 字段联动

B. 数字:190828,表示该样本录入系统的日期为2019828

C. 数字:0744为样本流水号,自动增加

D. 后缀:FF 表示样本类型为FFPE

还可以继续增加后缀内容,用于标记试验状态,如

L01表示第一次建库

D01表示该样本第一次提取

 

等等,可以根据实际需要自行定义。

2

项目编号

SampleProject

字符

分析流程的编号,表示样本的分析项目

 

3

优先级别

SamplePriority

整数

优先级别:数字1-9,数字越大优先级别越高

4

报告日期

SampleReport

日期

样本项目分析完毕,获得分析报告的日期;如果该字段为空,表示尚未分析,如果非空表示样本已经经过分析。

5

拆分状态

DemultiplexStatus

布尔

标记该样本测序仪下机数据是否已经完成拆分

 

 

2、 分析报告上显示的信息,用于生物样本属性的数据

序号

字段名称

数据类型

作用

1

样本来源

SampleSource

字符

记录样本的来源,医院、实验室、等

2

样本类型

SampleType

字符

样本类型,为以下其中之一:

蜡块、血液、唾液、新鲜组织、冰冻组织、其它

3

取样位置

SamplePosi

字符

取样的位置:器官位置

4

取样方法

SampleMethod

字符

取样方法:穿刺、抽血、口腔刮棒?

5

取样日期

SampleCollect

日期

取样的日期

6

收样日期

SampleReceive

日期

收到样本的日期

 

3、 分析报告上显示的患者的信息,属于隐私内容,但是在报告上有需要显示的

序号

字段名称

数据类型

作用

1

患者编号

PatientNumber

字符

系统内唯一编号,用于区别患者,为了便于识别,默认为患者编号内容设计了一套编码规则(非强制)

 

以样本编号:1908280834为例:

A. 数字:190828,表示该样本录入系统的日期为2019828

B. 数字:0834为患者流水号,自动增加

 

另外,可以根据实际需要自行定义。

2

患者姓名

PatientName

字符

患者姓名

 

3

患者性别

PatientGender

字符

患者性别

4

患者年龄

PatientAge

整数

患者年龄

5

诊断信息

PatientDiag

字符

患者来源于其它渠道的诊断信息

6

临床信息

PatientClinic

字符

患者来源于其它渠道的临床信息

 

 

4、 用于和测序仪联动,生成SampleSheet文件,拆分数据

序号

字段名称

数据类型

作用

1

上机编号

RunID${runid}

字符

对应于Illumina RunID的前两个字段,用于识别下机数据目录

2

测序平台

Instrument

字符

用于测序的平台,如:

MiSeqMiniseq/NextSeq

3

I7 Index ID

I7_Index_ID

字符

I7 Index ID

4

Index序列

Index

字符

I7 Index ID 实际碱基序列

5

I5 Index ID

I5_Index_ID

字符

I5 Index ID

6

Index2 序列

index2

字符

I5 Index ID 实际碱基序列

 

技术实现:

基于以上数据,设计录入表单如下

 

attachments-2019-08-6LizT9fz5d6698bdae987.PNG

一个样本信息就有二十几个个字段。如果一个一个录入,可能不是很好的体验。可以从以下几点缓解这个问题:

A. 设置必填项,可以看到经过筛选,必填项减少到5项。

B. 提供默认值,比如样本编号,患者编号,可以默认提供计算好的默认值;需要选择的下拉框,将最常用的值设置为默认值也可以提高效率。

C. 搜索输入,并提供联动的数据填充选项,如下图红色部分:

 

 

attachments-2019-08-rZ3KAhSU5d6698dde9f6c.PNG


attachments-2019-08-QOHmYeEr5d6698e80d046.png

D. 批量导入,使用固定的excel格式来实现批量导入数据:

 

attachments-2019-08-oGQ1E7VJ5d6699004d705.PNG



attachments-2019-08-rU4hkX605d66990801b56.PNG

 

按照以上设计提升了使用体验,基本就完成了样本信息处理功能,为开发后续功能提供支撑。

 


欢迎加入QQ群讨论:853718264   PPT下载attachments-2019-08-sjKbIpY85d5d0c0b1dabb.png


 

  • 发表于 2019-08-28 23:10
  • 阅读 ( 110 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
不写代码的码农
豆浆包子

6 篇文章

作家榜 »

  1. 合肥国肽生物 113 文章
  2. 祝让飞 104 文章
  3. 刘永鑫 64 文章
  4. 生信分析流 47 文章
  5. SXR 44 文章
  6. 调研图 38 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章