一行命令从cds的fasta序列转换成bed

数据来源: http://www.plantkingdomgdb.com/tea_tree/data/cds/Teatree_CDS.fas 转换成bed命令: grep '>' Teatree_CDS.fas |awk -F '>' '{print $2}'|awk -F ' ' '{print $3"\t"$1}'...

数据来源:

http://www.plantkingdomgdb.com/tea_tree/data/cds/Teatree_CDS.fas

attachments-2018-01-FjF4pHY85a644ea90ff87.png

转换成bed命令:

grep '>' Teatree_CDS.fas |awk -F '>' '{print $2}'|awk -F ' ' '{print $3"\t"$1}'|awk -F ':' '{print $1"\t"$2}'|awk -F '(' '{print $1$2}'|awk -F ')' '{print $1"\t"$2}'|perl -npe 's/(.*)([0-9]+)\-([0-9]+)(.*)/$1$2\t$3$4/'|awk -F '\t' '{print $1"\t"$2"\t"$3"\t"$5"\t200\t"$4}'>Teatree_CDS.bed

看起来命令很复杂,其实就是awk各种组合,然后再加了个perl替换

attachments-2018-01-kHsDh3T45a644ec1d93b0.png

  • 发表于 2018-01-21 16:17
  • 阅读 ( 9727 )
  • 分类:软件工具

0 条评论

请先 登录 后评论
不写代码的码农
祝让飞

生物信息工程师

118 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章