看教程不够直观,那就看视频吧! >>点击加载视频
本讲主要介绍正则表达式(regular expression, regex)的概念、主要语法风格以及在R中的使用方法。
为何讲它
一周前,在学习The Art of R Programming第35页的时候遇到一个练习,我想用模式匹配去解决,也就是regex,但遇到了未曾料到的问题,于是我在stackoverflow上提问了,大牛的解答让我想要集中几天精力搞清楚regex到底怎么用,问题见此:my question,不巧被标记了重复...
regex是一个相对独立的内容,几乎所有编程语言都实现了这种功能,这也证明了它的重要性,另外,本讲标题序号虽然是01,但其实大家可以放在遇到实际问题时再来学,那样有了共鸣,印象更深刻!
正则表达式
我们在面对生物数据,尤其是序列信息(比如碱基序列、氨基酸序列等)的时候, 会时常想要问自己,这其中是否包含着且含有多少某种已知的模式,一段DNA中是否包含转录起始特征TATA box、一段RNA中是否包含某种lncRNA、一段肽链中是否包含锌指结构等等;另一方面,我们在操作数据时,会时常遇到诸如把某个字符(对象)换成另一种字符(对象)的替换操作,而其本质还是如何搜索符合某种(替换)模式的对象。
在这些几乎天天都可以碰到的模式匹配/搜索问题中,正则表达式就是一把解决问题的利剑!
更多内容请看:
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!