小伙伴们大家好,今天给大家介绍一个自定义函数,可以用来提取文本中的数字、汉字和字母,话不多说,让我们一起看下效果。
功能讲解
上图中,通过自定义一个函数“tiqu”,它一共有两个参数:
tiqu(字符串,提取类型)
参数一是需要提取的字符串;
参数二是需要提取的类型,1代表提取字母,2代表提取数字,3代表提取汉字。
代码讲解
首先通过一个IF函数,来判断自定义函数参数二的输入情况:
如果参数二输入为1,则正则表达式匹配非字母;
如果参数二输入为2,则正则表达式匹配非数字;
如果参数二输入为3,则正则表达式匹配非汉字;
变量a存储匹配模式。
在确定参数二之后,建立正则表达式,并将上面的a赋值给匹配模式,接着将输入的参数一中的内容,符合正则表达式的部分全部替换为空;
这样,如果参数二输入的为1,匹配到的非字母全部被替换为空,最终自会留下字母,依次类推。
完整代码如下所示:
Function tiqu(str As String, i As Integer)
If i = 1 Then
a = "[^A-Za-z]"
ElseIf i = 2 Then
a = "[^0-9]"
ElseIf i = 3 Then
a = "[^u4e00-u9fa5]"
End If
Set regEx = CreateObject("VBScript.RegExp")
With regEx
.Global = True
.Pattern = a
tiqu = .Replace(str, "")
End With
End Function
小结
正则表达式的方便之处在于,可以灵活提取想要的字符组合,不局限于字符串是否规则,熟练掌握,是一款强大的字符串处理工具。