PHP开发⼩技巧①⑥—提取富⽂本字符串中的⽂本内容
综述
富⽂本在我们平常的项⽬中应⽤已经很⼴泛了,并逐渐发展成了⼀个⾏业。最近在项⽬中遇到需要提取富⽂本字符串中的⽂本内容,本篇博⽂就是记述如何
重富⽂本字符串中提取出⽂本内容,欢迎⼤家相互学习。
富⽂本字符样例
<h1 -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family    1、时间复杂度
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family ⼀般最先接触的就是时间复杂度和空间复杂度的学习了,这两个概念以及如何计算,是必须学的,也是必须最先学的,主要有最⼤复杂度、平均复杂度等,直接通过</p>
<h1 -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family    1、线性表
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 链表(必学)
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 并查集(建议结合刷题学习)
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family    2、栈与队列
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 队列(必学)
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 多级反馈队列(原理与应⽤)
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 三分钟基础知识:什么是栈?
</p>
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 【算法与数据结构】堆排序是什么⿁?
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 碰撞解决⽅法:开放定址法、链地址法、再次哈希法、建⽴公共溢出区(必学)
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 哈希表相关的,推荐通过博客来学习,推荐⽂章:
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family    4、树
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 哈夫曼树与编码(原理与应⽤)
</p>
box sizing
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family    B 树与 B+ 树(原理与应⽤)
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 红⿊树(原理与应⽤)
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family    5、数组
</p>
<p -webkit-tap-highlight-color: transparent; box-sizing: border-box; margin-top: 16px; margin-bottom: 16px; padding: 0px; color: rgb(34, 34, 34); font-family 矩阵(必学)
</p>
<p <"(⼩于)和 ">"(⼤于)转换为字符;
2. 其次通过str_replace() 将HTML中的空格换成空;
3. 最后再通过strip_tags()函数剥去字符串中的 HTML、XML 以及 PHP 的标签,即可得到想要的txt纯⽂本内容。
代码实现
//从数据库获取富⽂本string
$string = $data["content"];
//把⼀些预定义的 HTML 实体转换为字符
$html_string = htmlspecialchars_decode($string);
//将空格替换成空
$content = str_replace(" ", "", $html_string);
//函数剥去字符串中的 HTML、XML 以及 PHP 的标签,获取纯⽂本内容
$contents = strip_tags($content);
//返回字符串中的前80字符串长度的字符
$text = mb_substr($contents, 0, 80, "utf-8");
//打印输出
var_dump($text);
exit;

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。