再次声明,用R来处理惩罚字符串数据并不是一个很好的选择,照旧推荐利用Perl可能Python等语言。不外R自己除了提供了一些常用的字符串处理惩罚函数,也对正则表达式有了必然的支持,详细各个函数的利用要领照旧要参考R的辅佐文档。
grep(pattern, x, ignore.case = FALSE, extended = TRUE,
regexpr(pattern, text, ignore.case = FALSE, extended = TRUE,
gregexpr(pattern, text, ignore.case = FALSE, extended = TRUE,
sub(pattern, replacement, x,
gsub(pattern, replacement, x,
> grep(“[a-z]”, letters)
[25] 25 26
#参数value的利用
> grep(“[a-z]”, letters,value=TRUE)
[19] “s” “t” “u” “v” “w” “x” “y” “z”
#将字符串的首字母转换为大写
> gsub(“^(\\w)”, “\\U\\1”, “a test of capitalizing”, perl=TRUE)
[1] “A test of capitalizing”
#将字符串中每个单词的首字母转换为大写
> gsub(“\\b(\\w)”, “\\U\\1”, “a test of capitalizing”, perl=TRUE)
[1] “A Test Of Capitalizing”
#对电子邮件地点举办匹配为例,用一个正则表达式来匹配电子邮件地点是一项很常见的任务。
>text<-c(“[email protected]”,”[email protected]”,”ka…[email protected]”,”[email protected]″,”[email protected]”)
> text
[1] “[email protected]”
[4] “[email protected]”
> grep(“(\\w+\\.)*\\w+@(\\w+\\.)+[a-zA-Z]+”,text)
[1] 1 3 5
在R中利用正则表达式
最后更新 2017-12-04 08:00 星期一 所属:
其他教程 浏览:432
