0
点赞
收藏
分享

微信扫一扫

正则表达式引用

import re

# 匹配括号及括号里面的内容,例如:"(a)"、"《朝花夕拾》"、"【第三册】"等
bracket_pat = re.compile(r'([((][^))]*[))]|[\[【][^]】]*[]】]|[{][^}]*[}]|[<《][^>》]*[>》])')

# 匹配中文字符,例如:"今"
zh_pat = re.compile(r'[一-龥]')

# 公司经营范围相关模板
# 切分模板
business_scope_sep_pat = re.compile(r'[a-zA-Z\u4e00-\u9fa5.|]+')
# 干扰字符模板
business_scope_noise_pat = re.compile(r'(法律、法规、国务院决定规定禁止的不得经营|法律、法规、国务院决定规定应当许可的|经审批机关批准后凭许可文件经营|在隶属企业经营范围内从事|以下限分支机构经营|法律、法规、国务院决定规定无需许可的;市场主体自主选择经营|一般经营项目是|许可经营项目是|兼营范围|^[;。、*\s]|[;。、*\s]$)')



from utils.re_util import (
bracket_pat,
zh_pat,
business_scope_sep_pat,
business_scope_noise_pat
)

if re.findall(bracket_pat, i): # 写法一
# re.search(bracket_pat, i).group(): # 写法二
new list.append(i)


举报

相关推荐

0 条评论