0
点赞
收藏
分享

微信扫一扫

linux 的三驾马车grep ,sed,awk

grep

只要出现gene字眼都查找出



精确查找,一个单词一个单词的搜索


用于找文件前缀

到file文件里面查找关键词
grep -w -f file


-n显示行号

正则表达式


  • 只查找以“T”开头的行


  • 模糊匹配的方法 f*ee


  • grep 'f?ee' 其中 \是转义符
    表示f可以出现0次或1次, 查找fee 或者ee

    • 匹配1次或多次
      grep 're+'
      表示e可以出现1次或多次,查找 ree, re, ree等
  • {n}匹配n次


  • 列出以*结尾的文件


  • 一般情况下*可以当做通配符

  • *表示出现0次或者1次


sed












1,练习题目


从第二行开始,使用y函数,ATCG对应TAGC,如果想要保存,利用重定向命令

awk

awk定义


循环语句




先匹配外显子的exon的行,第五列减去第四列

当用cut命令取第九列的时候,取得很多

基因前后的空格都被分割了,取出来

所以需要重新定义分隔符

-F分隔符被重新定义为制表符

打印关于UTR的所有列出来


print和print end 类似于在开头结尾加注释


举报

相关推荐

0 条评论