温馨提示×

温馨提示×

您好,登录后才能下订单哦!

密码登录×
登录注册×
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》

php正则去除网页中所有的html,js,css,注释的方法

发布时间:2021-06-29 14:50:27 来源:亿速云 阅读:427 作者:chen 栏目:开发技术

这篇文章主要讲解了“php正则去除网页中所有的html,js,css,注释的方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“php正则去除网页中所有的html,js,css,注释的方法”吧!

如下所示:

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript  "'<style[^>]*?>.*?</style>'si",  // 去掉 css  "'<[/!]*?[^<>]*?>'si",      // 去掉 HTML 标记  "'<!--[/!]*?[^<>]*?>'si",      // 去掉 注释 标记  "'([rn])[s]+'",  // 去掉空白字符  "'&(quot|#34);'i",  // 替换 HTML 实体  "'&(amp|#38);'i",  "'&(lt|#60);'i",  "'&(gt|#62);'i",  "'&(nbsp|#160);'i",  "'&(iexcl|#161);'i",  "'&(cent|#162);'i",  "'&(pound|#163);'i",  "'&(copy|#169);'i",  "'&#(d+);'e");   // 作为 PHP 代码运行   $replace = array ("",  "",  "",  "",  "\1",  "\"",  "&",  "<",   ">",  " ",  chr(161),  chr(162),  chr(163),  chr(169),  "chr(\1)"); //$document为需要处理字符串,如果来源为文件可以$document = file_get_contents($filename); $out = preg_replace($search, $replace, $document);

也可以使用php的内置函数strip_tags()清除html,js,注释等标记

感谢各位的阅读,以上就是“php正则去除网页中所有的html,js,css,注释的方法”的内容了,经过本文的学习后,相信大家对php正则去除网页中所有的html,js,css,注释的方法这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是亿速云,小编将为大家推送更多相关知识点的文章,欢迎关注!

向AI问一下细节

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

AI