在线法律咨询⾃动回复的⽣成⽅法与设备的制作流程
本技术公开了⼀种在线法律咨询⾃动回复的⽣成⽅法与设备,包括依托每条法律知识点对应提取出的关键词组和连接关系离线构建法律知识图例库及其查询索引;依据在线⽤户咨询问题抽取关键词检索出对应的⼀个或多个法律知识图例;依据法律知识图例数量选择拼接模板并对法律知识图例调整长宽⽐例进⾏填充,最终把填充好的拼接模板导出成JPG或PNG等图⽚格式;⽣成简单的回复语句,结合⽣成的图⽚⼀起返回给⽤户,其技术⽅案要点为,通过关键回复语句结合相应法律知识图例的拼接图⽚作为回复内容,更有针对性地、⾼度概括地、精炼易懂地解释⽤户提出的咨询问题。
权利要求书
1.⼀种在线法律咨询⾃动回复的⽣成⽅法,其特征是,包括:
依托每条法律知识点对应提取出的关键词组和连接关系离线构建法律知识图例库及其查询索引;
依据在线⽤户咨询问题抽取关键词检索出对应的⼀个或多个法律知识图例;
依据法律知识图例数量选择拼接模板并对法律知识图例调整长宽⽐例进⾏填充,最终把填充好的拼接模板导出成图⽚格式;
⽣成简单的回复语句,结合⽣成的图⽚⼀起返回给⽤户。
2.根据权利要求1所述的⼀种在线法律咨询⾃动回复的⽣成⽅法,其特征是,所述法律知识图例库的构建步骤如下:
步骤S1,基于法律法规⽂件及法律专家经验总结相关法律资料,构建法律知识图谱;
步骤S2,采⽤⽆监督机器学习算法,将法律知识图谱划分为很多不同的部分,每⼀部分即为⼀个法律知识点;其中,法律知识点的关键词是社区中每个数据对象的关键词组合交集,关键词解释是每个数据对象的具体条款内容交集;
步骤S3,对于上述计算得到的每个法律知识点,⽣成知识图例,处理⽅法如下:
步骤S3.1,事先定义描述关系及知识图例结构,所述描述关系包含总分关系、因果关系、并列关系、补充关系和递进关系;
步骤S3.2,对于法律知识点中关键词解释部分的每个句⼦,都计算句⼦内部不同部分之
间的描述关系;
步骤S3.3,对于提取出来的描述关系,编写基于图形库的知识图例⽣成程序,将各个知识点对应的知识图例绘制出来;
步骤S4,基于上述⽣成的法律知识图例,⼈⼯补充没有检测到的描述关系,并对分析有
误的知识图例进⾏修改,⼈⼯操作可以在图形制作和处理软件中进⾏;
步骤S5,将⼈⼯补充和修改后得到的所有法律知识图例存储到磁盘介质,并使⽤信息检索系统对每个图例对应的关键词
建⽴关键词倒排索引,⽅便在线计算阶段能快速检索到图例。
3.根据权利要求2所述的⼀种在线法律咨询⾃动回复的⽣成⽅法,其特征是,在法律知识图谱的构建步骤S1中,法律知识图谱处理⽅法如下:
步骤S1.1,⾸先对每条法律条款或专家经验进⾏⾃然语⾔处理,包含中⽂分词、去停⽤词、命名实体抽取和词性过滤,得到⼀组关键词,⽤来表⽰每条法律条款或专家经验;
步骤S1.2,通过简单规则或者⽆监督机器学习算法,将相关的法律条款或专家经验连接起来;两个法律知识点之间是否相关,可以由简单规则或者⽆监督机器学习算法决定;
步骤S1.3,将所有的法律条款或专家经验中,相关的条⽬连接起来,形成的整体⽹络结构即为法律知识图谱。
4.根据权利要求1所述的⼀种在线法律咨询⾃动回复的⽣成⽅法,其特征是,所述图例拼接模板选择和填充的具体处理步骤如下:
步骤S1,根据检索得到的法律知识图例数量,从候选拼接模板库中筛选对应数量的拼接模板;对于对应数量图例的拼接模板可能有⼏种,程序以⼀定事先定义好的概率分布随机选取其中⼀个拼接模板;
步骤S2,采⽤⼀定的规则选择法律知识图例在拼接模板中的填充区域,并将每个法律知识图例分别填充到对应的填充区域中;
步骤S3,将填充好的拼接模板导出成图⽚格式,在图⽚上添加追溯⽤的⽔印以及商业LOGO。
5.根据权利要求4所述的⼀种在线法律咨询⾃动回复的⽣成⽅法,其特征是,所述填充区域
选择规则是先计算每个法律知识图例中⿊⾊像素的占⽐,将⽐例最⼤的法律知识图例对应到⾯积最⼤的填充区域,如果剩余⼏个填充区域的⾯积相同,则随机选择⼀个填充区域;所述填充区域的填充⽅法是⾸先将法律知识图例的中⼼填充区域的中⼼对准,按照法律知识图例本⾝的长宽⽐例不变,逐渐放⼤法律知识图例,直⾄接触到填充区域的边缘,在未填充
到的区域填充空⽩⾊。
6.根据权利要求2所述的⼀种在线法律咨询⾃动回复的⽣成⽅法,其特征是,所述简单语
句的⽣成步骤如下所述:
步骤S1,基于在法律知识图例库构建步骤S3抽取的因果关系,尝试直接进⾏推断,处理⽅法如下:基于神经词向量的相似度匹配算法,计算⽤户咨询问题与各个因果关系的法律知识图例中原因部分的相似度,如果相似度⾼于事先设定的阈值,则认为可以推断出明确结果,否则不能推断出明确结果;
步骤S2,使⽤机器学习分类模型进⾏打分,分类模型的输⼊是⽤户咨询问题的⽂本内容,输出是推断结果得分如果⾼于
事先设定的阈值,则认为可以推断出明确结果;否则不能推断出明确结果,机器学习分类模型需要事先基于⼈⼯标注好的训练语料进⾏训练得到;
步骤S3,如果可以推断出明确结果,则装载确定倾向的回复词,否则装载不确定倾向的回复词;同时,基于统计学习的语⾔模型对回复语句进⾏润⾊;
步骤S4,装载⽂字和图⽚,在⼿机应⽤或其他产品客户端页⾯⼀起返回给⽤户。
7.⼀种如权利要求1⾄6任意⼀项所述的在线法律咨询⾃动回复的⽣成⽅法的⽣成设备,其特征是,包括:
离线构建的法律知识图例库构建模块,依托每条法律知识点对应提取出的关键词组和连接关系离线构建法律知识图例库及其查询索引;
法律知识图例检索模块,依据在线⽤户咨询问题抽取关键词检索出对应的⼀个或多个法律知识图例;
图例拼接模板选择和填充模块,依据法律知识图例数量选择拼接模板并对法律知识图例调整长宽⽐例进⾏填充,最终把填充好
的拼接模板导出成图⽚格式;
法律咨询回复推断和润⾊模块,⽣成简单的回复语句,结合⽣成的图⽚⼀起返回给⽤户。技术说明书
⼀种在线法律咨询⾃动回复的⽣成⽅法与设备
技术领域
本技术涉及法律咨询技术领域,特别涉及⼀种在线法律咨询⾃动回复的⽣成⽅法与设备。
背景技术
本部分旨在为权利要求书中陈述的本技术的实施⽅式提供背景或上下⽂。此处的描述可包括可以探究的概念,但不⼀定是之前已经想到或者已经探究的概念。因此,除⾮在此指出,否则在本部分中描述的内容对于本申请的说明书和权利要求书⽽⾔不算是现有技术,并且并不因为包括在本部分中就承认是现有技术。
在线法律咨询是很多法律类⼿机应⽤或应⽤内⼩程序的⼀项基本功能,⽤户在线提出法律咨询问题,由⼈⼯律师或计算机程序回复咨询答案。刚开始有这项功能的时候,通常由⼈⼯律师进⾏⼿⼯回复,有时⽤户需要等待⼏个⼩时甚⾄数天的时间才能看到回复内容。
随着信息检索技术、语义分析技术、机器学习和深度学习技术的发展,计算机⾃动回复在线法律咨询问题逐渐成熟,出现了基于标准问答对匹配和基于法律知识库条⽬组合两种⾃动回
复的技术⽅案。
(1)、基于标准问答对匹配:事先准备好⼀个标准问答对集合,当⽤户提出的问题时,由计算机程序通过信息检索等技术,从标准问答对中匹配出最相似的问题,并返回该问题对应的答案。例如,⽤户提出的问题是:“16周岁了,可以结婚吗”程序从标准问答对集合中匹配到最相似的问题是:“刚满16周岁可以领结婚证吗”于是程序返回该标准问题所对应的答案:“不可以的。法定结婚年龄,男不得早于22周岁,⼥不得早于20周岁。”
(2)、基于法律知识库条⽬组合:事先准备好⼀个法律知识库,当⽤户提出的问题时,由计算机程序通过信息检索等技术,从法律知识库中,匹配到对应的法律知识点,并将这些法律知识点的解释组合在⼀起,作为咨询答案回复给⽤户。例如,⽤户提出的问题是:“我有两个孩⼦,离婚抚养费怎么分摊,财产怎么分割”计算机程序在法律知识库中匹配到两条知识点,分别是:“离婚+抚养费”和“离婚+财产+分割”。于是,计算机程序将两条知识点解释组合在⼀起,作为答案回复给⽤户:“离婚时,孩⼦的抚养权问题⼀般……。夫妻共同财产应由您和对⽅协议处理……”。
然⽽上述两种技术⽅案仍有缺陷,如基于标准问答对匹配的技术⽅案只能回答简单的咨询问题,⽽且需要事先准备庞⼤的标准问题集合;⽽基于法律知识库条⽬组合的技术⽅案,由于是基于法律条⽂进⾏摘录和总结后,将多个知识点解释进⾏⽂字组合回复,内容中⼜存在着很多分叉逻辑,例如,对于“当初没有办理结婚登记,现在该如何离婚”的咨询问题,需要根据开始同居时间分为1994年前和1994年后两种情况分别解释;其内容通常冗长晦涩,⽤户需要花费较多的时间和精⼒才能看明⽩,有时甚⾄看不懂。
技术内容
针对现有技术存在的不⾜,本技术的⽬的在于提供⼀种在线法律咨询⾃动回复的⽣成⽅法与设备,通过关键回复语句结合相应法律知识图例的拼接图⽚作为回复内容,回复语句和拼接图⽚都是在线实时⽣成,相⽐于标准问答对匹配咨询回复⽅式更具有灵活性和可扩展性等优点,同时具备处理复杂问答的能⼒,相⽐于基于法律知识库条⽬组合咨询回复⽅式更有针对性地、⾼度概括地、精炼易懂地解释⽤户提出的咨询问题。
例如,上述对于“当初没有办理结婚登记,现在该如何离婚”的咨询问题,本技术会⾃动回复出如图1所⽰的内容:回复语句+图例,图例中依据时间分隔线来分隔成两种不同时间节点下的具体法律法规,同时剔除⼀些关键词的解释,另起⼀个图例分点解释关键词的具体条件或要求。
与现有相关技术相⽐,本技术能更好地改善在线法律咨询⾃动回复的内容质量和⽤户体验,避免⽤户花费较长的时间和精⼒查看晦涩冗长的⽂字内容;由于是基于法律知识要素检索图例,⽽法律知识要素的数量有限,⼀般在数⼗万左右,因此本案在实际情况下能覆盖⼤部分⽤户咨询问题的⾃动回复。
在本上下⽂中,本技术的实施⽅式期望提供⼀种在线法律咨询⾃动回复的⽣成⽅法与设备,本技术的上述技术⽬的是通过以下技术⽅案得以实现的:
在本技术实施⽅式的第⼀⽅⾯中,提供了⼀种在线法律咨询⾃动回复的⽣成⽅法,在功能模块上由四个部分组成:法律知识图例库构建模块、法律知识图例检索模块、图例拼接模板选择和填充模块、法律咨询回复推断和润⾊模块。其中,法律知识图例库构建模块为离线计算模块,其他三个都是在线计算模块、且三个模块是顺次关系,如图2所⽰。
上述实施⽅式中的⽣成⽅法具体如下所述:
通过法律知识图例库构建模块依托每条法律知识点对应提取出的关键词组和连接关系离线构建法律知识图例库及其查询索引;
法律知识图例检索模块依据在线⽤户咨询问题抽取关键词检索出对应的⼀个或多个法律知识图例;
图例拼接模板选择和填充模块依据法律知识图例数量选择拼接模板并对法律知识图例调整长宽⽐例进⾏填充,最终把填充好的拼接模板导出成图⽚格式,现有的图⽚格式包含JPEG、JPEG2000、PNG、GIF、PDF、PSD、SVG、TIFF、BMP、EMF 等图⽚格式;
法律咨询回复推断和润⾊模块⽣成简单的回复语句,结合⽣成的图⽚⼀起返回给⽤户。
在⼀些实施例中,根据本技术的上述任⼀实施例所述的⽅法,上述的法律知识图例库的构建步骤如下:
步骤S1,基于法律法规⽂件及法律专家经验总结的相关法律资料,构建法律知识图谱,处理⽅法如下:
步骤S1.1,⾸先对每条法律条款或专家经验进⾏⾃然语⾔处理,包含中⽂分词、去停⽤词、命名实体抽取、词性过滤,得到⼀组关键词⽤来表⽰每条法律条款或专家经验,关键词的获取通常只需要对法律条款或专家经验的标题或摘要计算这组关键词,⽽不需要对具体条款内容进⾏计算;
步骤S1.2,通过简单规则或者⽆监督机器学习算法,将相关的法律条款或专家经验连接起来;对于两个法律知识点之间是否相关,可以由简单规则判断,当两组关键词包含有⼀个或两个以上相同的关键词即认为相关,或者采⽤⽆监督机器学习算法决定,可采⽤基于神经词向量的相似度匹配算法,计算两组关键词相似度⼤于等于事先设定的阈值即认为相关;
步骤S1.3,将所有的法律条款或专家经验中,相关的条⽬连接起来,形成的整体⽹络结构即为法律知识图谱;
步骤S2,采⽤社区发现算法等⽆监督机器学习算法,将法律知识图谱划分为很多不同的部分,每⼀部分即为⼀个法律知识点;其中,法律知识点的关键词是社区中每个数据对象的关键词组合交集,关键词解释是每个数据对象的具体条款内容交集;
步骤S3,对于上述计算得到的每个法律知识点,⽣成知识图例,处理⽅法如下:
步骤S3.1,事先定义描述关系及知识图例结构,描述关系包含总分关系、因果关系、并列关系、补充关系、递进关系;
步骤S3.2,对于法律知识点中关键词解释部分的每个句⼦,都计算句⼦内部不同部分之
间的描述关系;计算⽅法可以采⽤事先定义的正则表达式,例如:正则表达式“有下列情形
之⼀的,.*:.*”等可以提取出总分关系,及总和分的各个部分;正则表达式“.*应当.*”等可以提取出因果关系,以及因和果的各个部分;
步骤S3.3,对于提取出来的描述关系,编写基于Qt、OpenCV、Pillow、OpenGL等图像处理库的知识图例⽣成程序,将各个知识点对应的知识图例绘制出来;
步骤S4,基于上述⽣成的法律知识图例,⼈⼯补充没有检测到的描述关系,并对分析有
误的知识图例进⾏修改,⼈⼯操作可以在Photoshop等图形制作和处理软件中进⾏;
步骤S5,将⼈⼯补充和修改后得到的所有法律知识图例存储到磁盘介质,并使⽤信息检索系统对每个图例对应的关键词建⽴关键词倒排索引,⽅便在线计算阶段能快速检索到图例,信息检索系统可采⽤Elasticsearch、Solr、Lucene、OpenSearch、Xapian等信息检索系统。
在⼀些实施例中,根据本技术的上述任⼀实施例所述的⽅法,上述图例拼接模板选择和填充模块的具体处理步骤如下:
步骤S1,根据检索得到的法律知识图例数量,从候选拼接模板库中筛选对应数量的拼接模板;例如,含三个图例的拼接模板可能有⼏种,程序以⼀定事先定义好的概率分布随机选取其中⼀个拼接模板;
步骤S2,采⽤⼀定的规则选择法律知识图例在拼接模板中的填充区域,填充区域选择规则是先计算每个法律知识图例中⿊⾊像素的占⽐,将⽐例最⼤的法律知识图例对应到⾯积最⼤的填充区域,如果剩余⼏个填充区域的⾯积相同,则随机选择⼀个填充区域;第⼆步将每个法律知识图例分别填充到对应的填充区域中,填充⽅法是⾸先将法律知识图例的中⼼填充区域的中⼼对准,按照法律知识图例本⾝的长宽⽐例不变,逐渐放⼤法律知识图例,直⾄接触到填充区域的边缘,
在未填充到的区域填充空⽩⾊;
步骤S3,将填充好的拼接模板导出成JPEG、JPEG2000、PNG、GIF、PDF、PSD、SVG、TIFF、BMP、EMF等图⽚格式,在图⽚上添加追溯⽤的⽔印以及商业LOGO,这些都可以通过OpenCV等图像处理程序库完成。
在⼀些实施例中,根据本技术的上述任⼀实施例所述的⽅法,上述法律咨询回复推断和润⾊模块的处理步骤如下所述:
步骤S1,基于在法律知识图例库构建模块步骤S3抽取的因果关系,尝试直接进⾏推断,处理⽅法如下:基于神经词向量的相似度匹配算法,计算⽤户咨询问题与各个因果关系的法律知识图例中原因部分的相似度,如果相似度⾼于事先设定的阈值,则认为可以推断出明确结果,例如,可以或不可以;否则不能推断出明确结果;
步骤S2,使⽤机器学习分类模型进⾏打分,分类模型的输⼊是⽤户咨询问题的⽂本内容,输出是推断结果得分如果⾼于事先
设定的阈值,则认为可以推断出明确结果,例如,可以或不可以;否则不能推断出明确结果,机器学习分类模型需要事先基于⼈⼯标注好的训练语料进⾏训练得到;
步骤S3,如果可以推断出明确结果,则装载确定倾向的回复词,例如,“可以”或“不可以”,否则装载不确定倾向的回复词,例如,您的问题视情况⽽定;同时,基于统计学习的语⾔模型对回复语句进⾏润⾊,例如:“不可以”替换为“是不可以的”等等;正则匹配法律条文
步骤S4,装载⽂字和图⽚,在⼿机应⽤或其他产品客户端页⾯⼀起返回给⽤户。
在本技术实施⽅式的第⼆⽅⾯中,提供了上述在线法律咨询⾃动回复的⽣成⽅法的⽣成设备。
本技术的上述技术⽬的是通过以下技术⽅案得以实现的:
⼀种在线法律咨询⾃动回复的⽣成设备,包括:
离线构建的法律知识图例库构建模块,依托每条法律知识点对应提取出的关键词组和连接关系离线构建法律知识图例库及其查询索引;
法律知识图例检索模块,依据在线⽤户咨询问题抽取关键词检索出对应的⼀个或多个法律知识图例;
图例拼接模板选择和填充模块,依据法律知识图例数量选择拼接模板并对法律知识图例调整长宽⽐例进⾏填充,最终把填充好的拼接模板导出成JPEG、JPEG2000、PNG、GIF、PDF、PSD、SVG、TIFF、BMP、EMF等图⽚格式;
法律咨询回复推断和润⾊模块,⽣成简单的回复语句,结合⽣成的图⽚⼀起返回给⽤户。
综上所述,本技术对⽐于现有技术的有益效果为:采⽤简单⽂字结合图⽚的咨询回复形式,有针对性地、⾼度概括地、精炼易懂地解释⽤户提出的咨询问题,具有⼀图抵千⾔的优点;同时,本案提出的回复语句和拼接图⽚都是在线实时⽣成的,具有灵活性和可扩展性等优点。
附图说明
通过参考附图阅读下⽂的详细描述,本技术⽰例性实施⽅式的上述以及其他⽬的、特征和优点将变得易于理解。在附图中,以⽰例性⽽⾮限制性的⽅式⽰出了本技术的若⼲实施⽅式,其中:
图1⽰意性地⽰出了根据本技术实施⽅式的⽣成的⾃动回复内容举例(咨询问题:当初没有办理结婚登记,现在该如何离婚);
图2⽰意性地⽰出了根据本技术的⼀个实施⽅式的整个技术⽅案的结构框架图;
图3⽰意性地⽰出了本技术的⼀个实施⽅式可以在其中实施的⼀个⽰例性场景;
图4⽰意性地⽰出了根据本技术的⼀个实施⽅式的法律知识图例库构建步骤;
图5⽰意性地⽰出了根据本技术的⼀个实施⽅式的知识图例描述关系结构;
图6⽰意性地⽰出了根据本技术的⼀个实施⽅式的知识图例查询索引;
图7⽰意性地⽰出了根据本技术的⼀个实施⽅式的图例拼接模板选择和填充步骤;
图8⽰意性地⽰出了根据本技术的⼀个实施⽅式的含有3个图例的拼接模板;
图9⽰意性地⽰出了根据本技术的⼀个实施⽅式的填充法律知识图例的⽅法;
图10⽰意性地⽰出了根据本技术的⼀个实施⽅式的法律咨询回复推断和润⾊模块的流程步骤。
在附图中,相同或对应的标号表⽰相同或对应的部分。
具体实施⽅案
下⾯将参考若⼲⽰例性实施⽅式来描述本技术的原理和精神。应当理解,给出这些实施⽅式仅仅是为了使本领域技术⼈员能够更好地理解进⽽实现本技术,⽽并⾮以任何⽅式限制本技术的范围。相反,提供这些实施⽅式是为了使本公开更加透彻和完整,并且能够将本公
开的范围完整地传达给本领域的技术⼈员。说明书中的“实施例”或“实施⽅式”既可表⽰⼀个实施例或⼀种实施⽅式,也可表⽰⼀些实施例或⼀些实施⽅式的情况。
本领域技术技术⼈员知道,本技术的实施⽅式可以实现为⼀种系统、装置、设备、⽅法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。