易语言正则匹配以后,替换的问题

作者: admin 分类: 易语言 发布时间: 2017-10-27 16:10

2017年10月29号更新:已经自行研究解决,下面这个问题,其实可以直接取出来,利用正则即可:

.版本 2
.支持库 RegEx

.子程序 正则_去掉a标签的HTML代码, 文本型, 公开, 源文本中有:开头<a href="" target="_blank">中间</a>,结尾。用这个命令以后,返回:开头中间,结尾.本方法只能去掉一个<a>标签的HTML,建议段落内使用,如果需要去掉多个,需要反复调用此方法
.参数 源文本, 文本型, , 欲被匹配的文本
.局部变量 局_正则, 正则表达式, , , 采用的 正则表达式 支持库,无此支持库的请到此下载:http://e.3600gz.cn/uploads/soft/zck/RegEx.rar
.局部变量 局_搜索结果, 搜索结果, 静态, "0"
.局部变量 局_匹配数, 整数型, , , 匹配数量
.局部变量 局_计次, 整数型

.如果真 (局_正则.创建 (“(.*?)<a href=.*?>(.*?)</a>([\s\S]*)”, 假) = 假)
    信息框 (“正则创建失败,请检查正则表达式语句是否有误!”, #错误图标, , )
    返回 (源文本)
.如果真结束
局_正则.多行模式 = 假
局_搜索结果 = 局_正则.搜索全部 (源文本)
局_匹配数 = 取数组成员数 (局_搜索结果)
.如果真 (局_匹配数 = 0)

    返回 (源文本)
.如果真结束

返回 (局_搜索结果 [1].取子匹配文本 (源文本, 1, ) + 局_搜索结果 [1].取子匹配文本 (源文本, 2, ) + 局_搜索结果 [1].取子匹配文本 (源文本, 3, ))

 

最近研究采集,遇到个问题,那就是用正则匹配到内容以后,怎么替换掉呢?

源文本如下:

<p>无论<a href="http://lusongsong.com/info/post/640.html?from=timeline&isappinstalled=1 

 

" target="_blank">你在哪个城市</a>,每半个月都必须缴纳$778(5168元)的联邦税、社会保障税、和联邦医疗保险费用</p>

我的目的是把对方的a标签的HTML代码去掉,最终变成这样:

<p>无论你在哪个城市,每半个月都必须缴纳$778(5168元)的联邦税、社会保障税、和联邦医疗保险费用</p>

用易语言可以匹配到这部分内容:

<a href="http://lusongsong.com/reed/8826.html?from=timeline 

 

" target="_blank">年薪是一个</a>

但是不知道怎么替换掉,请高手指教一二!

标签:

相关文章

发表评论

邮箱地址不会被公开。 必填项已用*标注

Powered by 草根站长笔记 © 2015-2020 草根站长笔记 Inc.版权所有,禁止转载