(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 113282811 A
(43)申请公布日 2021.08.20
(21)申请号 CN202110585175.3
(22)申请日 2021.05.27
(71)申请人 广州文石信息科技有限公司
    地址 510000 广东省广州市荔湾区桥中中路215号301室
(72)发明人 廖林涛 朱增
(74)专利代理机构 11227 北京集佳知识产权代理有限公司
    代理人 陈嘉雯
(51)Int.CI
      G06F16/903(20190101)
      G06F16/958(20190101)
      G06F40/149(20200101)
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      一种MOBI文档显示方法、装置及设备
(57)摘要
      本申请公开了一种MOBI文档显示方法、装置及设备,本申请通过获取用户请求的待阅读文档,进而判断待阅读文档是否仅包含一份HTML文档,若是,则解析待阅读文档以便提取待阅读文档包含的HTML文档,进一步地,将提取到的HTML文档中的分隔符作为分割点,对HTML文档进行分割,得到分割后的HTML子文档,最后仅对用户请求的待阅读内容对应的HTML子文档进行渲染并显示,本申请通过对HTML文档进行分割,得到若干个HTML子文档,当用户阅读某一章节的内容时,电子书阅读终端仅对用户待阅读内容对应的HTML子文档进行加载,而不是加载整个体积较大的HTML文档,从而缩短了文档加载时间,提高了文档的加载速度。
法律状态
法律状态公告日
法律状态信息
法律状态
2021-08-20
公开
公开
2021-09-07
正则匹配快代理实质审查的生效
实质审查的生效
2022-10-18
发明专利申请公布后的驳回IPC(主分类):G06F16/903专利申请号:2021105851753申请公布日:20210820
发明专利申请公布后的驳回
权 利 要 求 说 明 书
1.一种MOBI文档显示方法,其特征在于,该方法包括:
获取用户请求的待阅读文档;
判断所述待阅读文档是否仅包含一份HTML文档;若是,则解析所述待阅读文档,以便提取所述待阅读文档包含的所述HTML文档;
将所述HTML文档中的分隔符作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档;
将用户请求的待阅读内容所对应的HTML子文档进行渲染并显示。
2.根据权利要求1所述的方法,其特征在于,将所述HTML文档中的分隔符作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档,包括:
提取所述HTML文档的内容字符串;
对所述内容字符串匹配分隔符,得到所述分隔符所在的位置;
将所述分隔符所在的位置作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档。
3.根据权利要求2所述的方法,其特征在于,对所述内容字符串匹配分隔符,得到所述分隔符所在的位置,包括:
对所述内容字符串使用正则表达式匹配分隔符,得到所述分隔符所在的位置。
4.根据权利要求2所述的方法,其特征在于,所述提取所述HTML文档的内容字符串,包括:
将所述HTML文档中的HTML标签去除,得到无HTML标签的内容字符串。
5.根据权利要求2所述的方法,将所述分隔符所在的位置作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档,包括:
将所述分隔符所在位置作为分割点,对所述HTML文档进行分割,得到分割后的若干个内容字符串;
在分割后的每个内容字符串两侧添加HTML标签,得到对应的HTML子文档。
6.根据权利要求1所述的方法,其特征在于,所述判断所述待阅读文档是否仅包含一份HTML文档,包括:
判断所述待阅读文档是否含有KF7文档标签或MOBI词典标签,若是,则确定仅包含一份HTML文档,所述KF7文档标签或MOBI词典标签包含所述待阅读文档的版本信息。
7.根据权利要求1所述的方法,其特征在于,将所述HTML文档中的分隔符作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档之后,还包括:
将所述HTML子文档缓存于本地。
8.根据权利要求7所述的方法,其特征在于,将所述HTML子文档缓存于本地,包括:
计算所述待阅读文档的MD5值,将所述MD5值作为所述待阅读文档的关键字;
在本地创建文档缓存目录,所述文档缓存目录的名称为所述待阅读文档的关键字;
将所述HTML子文档写入所述文档缓存目录。
9.一种MOBI文档显示装置,其特征在于,包括:
获取单元,用于获取用户请求的待阅读文档;
判断单元,用于判断所述待阅读文档是否仅包含一份HTML文档;若是,则解析所述待阅读文档,以便提取所述待阅读文档包含的所述HTML文档;
分割单元,用于将所述HTML文档中的分隔符作为分割点,对所述HTML文档进行分割,得到分割后的HTML子文档;
渲染单元,用于将用户请求的待阅读内容所对应的HTML文档进行渲染。
10.一种MOBI文档显示设备,其特征在于,包括:存储器和处理器;
所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~8中任一项所述的MOBI文档显示方法的各个步骤。
说  明  书
<p>技术领域
本申请涉及文档处理技术领域,具体地说,涉及一种MOBI文档显示方法、装置及设备。
背景技术
随着移动技术的快速发展,越来越多的电子书阅读终端应运而生,因为电子书阅读终端通常具有庞大的电子书数据库,人们可以方便地从其中到自己想要阅读的书籍或者词典,从而电子书阅读器越来越受欢迎。电子书阅读终端一般可支持多种格式的文档,其中一种常见的文档就是MOBI文档。
MOBI文档是由亚马逊公司定义的一种文档,这种格式的文档有多个版本,其中比较常见的是KF7版本,KF7版本的文档有一个特点就是压缩包内只包含一个HTML文档,整本书的内容都包含在一个HTML文档里面;另外,还有MOBI词典,这种格式的词典跟KF7版本的MOBI文档有个相同的特点,就是MOBI词典的压缩包内只包含一个HTML文档,即整个词典的内容都包含在一个HTML文档里面。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。