语料--688IT编程网

2025-01-07 17:38:28

(19)中华人民共和国国家知识产权局(12)发明专利说明书(10)申请公布号 CN 112966525 A(43)申请公布日 2021.06.15(21)申请号 CN202110349911.5(22)申请日 2021.03.31(71)申请人上海大学地址 200444 上海市宝山区上大路99号(72)发明人魏晓谢伟 (74)专利代理机构 31205 上海上大专利...

自然语言处理之文本情感分类

教程专区

情感分类语料词典

2025-01-07 05:04:15

⾃然语⾔处理之⽂本情感分类⼀、概述⽂本情感分析(Sentiment Analysis)是指利⽤⾃然语⾔处理和⽂本挖掘技术，对带有情感⾊彩的主观性⽂本进⾏分析、处理和抽取的过程。情感分析任务按其分析的粒度可以分为篇章级，句⼦级，词或短语级；按其处理⽂本的类别可分为基于产品评论的情感分析和基于新闻评论的情感分析；按其研究的任务类型，可分为情感分类，情感检索和情感抽取等⼦问题。⽂本情感分析...

正则表达式的生成方法及应用、装置、设备和存储介质

教程专区

分词语料确定说明书申请意图发明提高

2024-10-01 16:08:56

(19)中华人民共和国国家知识产权局(12)发明专利说明书(10)申请公布号 CN 114238634 A(43)申请公布日 2022.03.25(21)申请号 CN202111518491.5(22)申请日 2021.12.13(71)申请人北京智齿众服技术咨询有限公司地址 100071 北京市丰台区南四环西路186号二区9号楼-1至11层101内2层16室(72)...

tts正则化测试语料

教程专区

语音语料测试系统合成正则

2024-09-29 17:10:59

tts正则化测试语料【最新版】1.TTS 正则化测试语料概述 2.TTS 正则化测试语料的特点正则化英语3.TTS 正则化测试语料的应用 4.TTS 正则化测试语料的发展趋势正文1.TTS 正则化测试语料概述 TTS 正则化测试语料，即 Text-to-Speech（文本到语音）正则化测试语料，是一种用于评估和优化语音合成系统的标准测试数据。通过这...

2021届新高考英语书面表达(读后续写)高分语料积累

IT编程

后续高分语料

2024-05-19 17:57:34

2021届新高考英语书面表达(读后续写)高分语料积累表示“哭”的描写1.burst into tears2.weep/sob 3.be about ars streamed down his face/cheeks6.with tears streaming down his face/cheeks7.with tear...

用python做含有中文的正则表达式模式匹配

教程专区

是否部分加载语料模式命中分为

2024-05-05 05:41:30

⽤python做含有中⽂的正则表达式模式匹配#!/usr/bin/python#-*- coding:gbk-*-'''spec：根据是否命中126W⼈名，将usrdict分为两个部分parms:[IN][IN][OUT]author: liuyusi0121@sogou-inc date 20120808'''import re;import sys;def LoadKeys(filen...

陕西省旅游景区公示语翻译语料库系统的设计与实现

IT编程

系统语料库用户语料检索

2024-05-02 11:23:44

陕西省旅游景区公示语翻译语料库系统的设计与实现作者：董，高东怀，朱益平，张知元来源：《中国教育信息化·高教职教》2012年第12期摘　要：根据语料库语言学的基本观点，结合陕西省旅游景区的文化特及多样性特点，对陕西省旅游景区公示语翻译语料库的主题栏目进行了规划，开发了一套基于PHP的陕西省旅游景区公示语翻译语料库系统。该系统...

NLP入门系列一:搜狗新闻语料处理和word2vec词向量的训练

IT编程

语料训练分词向量

2024-04-02 05:47:55

NLP⼊门系列⼀：搜狗新闻语料处理和word2vec词向量的训练新闻语料预处理def is_Qnumber(uchar):"""判断⼀个unicode是否是全⾓数字"""if uchar >= u'\uff10' and uchar <= u'\uff19':return Trueelse:return Falsedef is_Qalphabet(uchar):"""判断⼀个unico...

读后续写语料积累15--惊讶舒缓

IT编程

惊呆感觉语料知觉联系

2024-01-29 20:04:41

读后续写语料积累15--惊讶舒缓惊讶&舒缓1． He breathed a sigh of relief.他松了⼀⼝⽓。2． He felt greatly relieved and his joy was immense.他感到如释重负，快乐⽆限。3． He could feel the tension released and a warmth spread through his b...

tensorflow2.0(Keras)实现seq2seq+Attention模型的对话系。。。

IT编程

模型对话训练实现输出语料模块数据

2024-01-28 11:32:43

tensorflow2.0（Keras）实现seq2seq+Attention模型的对话系。。。本⽂⽬录结构序列⽣成的两种⽅法⽐较seq2seq模型介绍Keras实现seq2seq+Atttention模型模型详细结构seq2seq模型训练模型预测序列⽣成的两种⽅法⽐较：通⽤的解释：以Encoder-Decoder框架为例，输⼊Source和输出Target内容是不⼀样的，⽐如对于英-中机器翻译来...

多注意力机制的藏汉机器翻译方法研究

教程专区

语料模型翻译

2024-01-28 11:26:45

多注意力机制的藏汉机器翻译方法研究刘赛虎，珠杰*（西藏大学信息科学技术学院，西藏拉萨850000）摘要：互联互通时代了解和掌握不同语言的区域文化和信息十分重要，机器翻译是目前广泛应用的交流媒介。本文以藏汉机器翻译为研究对象，利用Transformer框架和模型，研究了基于Transformer多注意力机制的藏汉机器翻译方法。经过实验，评估了多语料融合实验、语料双切分实验对比效果，得到了BLEU值3...

python文本聚类可视化_使用K-means及TF-IDF算法对中文文本聚类并可视 ...

IT编程

聚类权重算法语料分词效果实现定义

2024-01-27 01:43:39

python⽂本聚类可视化_使⽤K-means及TF-IDF算法对中⽂⽂本聚类并可视化使⽤K-means及TF-IDF算法对中⽂⽂本聚类并可视化2018-05-317,826对于⽆监督学习来说，聚类算法对于数据挖掘、NLP处理等⽅向都有着⾮常重要的地位。常见的聚类算法⽐如K-means、BIRCH(Balanced Iterative Reducing and Clustering Using H...

libsvmjava情感分类_自然语言处理系列篇——情感分类

IT编程

分类情感语料模型极性评论

2024-01-11 15:00:17

libsvmjava情感分类_⾃然语⾔处理系列篇——情感分类情感分类是对带有感情⾊彩的主观性⽂本进⾏分析、推理的过程，即分析对说话⼈的态度，倾向正⾯，还是反⾯。它与传统的⽂本主题分类⼜不相同，传统主题分类是分析⽂本讨论的客观内容，⽽情感分类是要从⽂本中得到它是否⽀持某种观点的信息。⽐如，“⽇媒：认为歼-31能够抗衡F-35，这种说法颇具恭维的意味。”传统主题分类是要将其归为类别为“军事”主题，⽽情...

一个超大规模分类标注语料库的建立

IT编程

网页分类标记信息语料体系语料库

2023-12-30 16:37:17

一个超大规模分类标注语料库的建立刘华摘要：针对文本分类中训练（测试）集获得较难、分类系统不合理的问题，我们构建了一个超大规模层级网页分类语料库。该语料库字段信息丰富，分类系统科学，存储格式可扩展性强、语义结构化。适合构建文本分类、话题识别和信息检索的大型训练（测试）集。关键词：语料库内容解析字段信息分类体系 xmlConstruction of a Super Classed and...

StanfordNER模型使用,训练自己的NER模型,终端使用和java调用

教程专区

模型识别语料实体命名标注输出参考

2023-12-23 05:11:11

StanfordNER模型使⽤，训练⾃⼰的NER模型，终端使⽤和java调⽤使⽤Stanford NER模型对语料进⾏命名实体识别⾸先下载Stanford NER包，地址nlp.stanford.edu/software/CRF-NER.html，然后下载解压即可使⽤。⼀、⽤Stanford NER原始训练好的模型对语料识别1.简单默认操作：命令：java -mx600m -cp...

Paddleocr文本识别数据集的合成与制作---超级详细

IT编程

识别数据合成数字需要模型语料训练

2023-12-18 15:43:11

Paddleocr⽂本识别数据集的合成与制作----超级详细⽬录前⾔由于官⽅提供的Paddleocr模型是⼀个通⽤的OCR识别模型，在很多的⽇常的场景中识别准确还是可以的，但是在⼀些⽐较特殊的场景中，识别的精确度就不是很好。如果要让我们的模型更加符合⾃⼰的业务需要，那么就需要训练我们⾃⼰的OCR识别模型。OCR识别分为⽂本检测和⽂本识别，⽂本检测就是让模型到⽂字所在的位置，⽽⽂本识别是在⽂本检测...

使用LSTM进行文本分类

教程专区

分类训练作为语料

2023-12-15 11:10:01

使⽤LSTM进⾏⽂本分类说明之前写过⽤lstm模型做的⽂本分类，但是代码结构⾮常混乱。读过Bert源码后，决定模仿Bert的结构，⾃⼰重新写⼀遍使⽤lstm模型的代码。只作为熟悉tensorflow各个api与⼀个⽐较清楚的NLP模型结构的练⼿⽤，不求更⾼的准确率。使⽤包含10个商品类别，60000+数据的，已标注正负情感的商品评论数据作为训练语料。原⽂件为csv格式，包含3个字段：cat（类别）...

Gensim入门教程

IT编程

向量模型主题语料训练变换

2023-11-26 15:52:21

Gensim⼊门教程What is Gensim?是⼀款开源的第三⽅Python⼯具包，⽤于从原始的⾮结构化的⽂本中，⽆监督地学习到⽂本隐层的主题向量表达。它⽀持包括TF-IDF，LSA，LDA，和word2vec在内的多种主题模型算法，⽀持流式训练，并提供了诸如相似度计算，信息检索等⼀些常⽤任务的API接⼝。基本概念语料（Corpus）：⼀组原始⽂本的集合，⽤于⽆监督地训练⽂本主题的隐层结构。语...

688IT编程网

语料

一种基于预训练模型和卷积神经网络算法的法律领域事件抽取方法

自然语言处理之文本情感分类

正则表达式的生成方法及应用、装置、设备和存储介质

tts正则化测试语料

2021届新高考英语书面表达(读后续写)高分语料积累

用python做含有中文的正则表达式模式匹配

陕西省旅游景区公示语翻译语料库系统的设计与实现

NLP入门系列一:搜狗新闻语料处理和word2vec词向量的训练

读后续写语料积累15--惊讶舒缓

tensorflow2.0(Keras)实现seq2seq+Attention模型的对话系。。。

多注意力机制的藏汉机器翻译方法研究

python文本聚类可视化_使用K-means及TF-IDF算法对中文文本聚类并可视 ...

libsvmjava情感分类_自然语言处理系列篇——情感分类

一个超大规模分类标注语料库的建立

StanfordNER模型使用,训练自己的NER模型,终端使用和java调用

Paddleocr文本识别数据集的合成与制作---超级详细

使用LSTM进行文本分类

Gensim入门教程

大图推荐

大于0小于等于1的正则表达式

...分别统计出其中英文字母、空格、数字和其它字符的个数)

用正则表达式限制文本框只能输入数字,小数点,英文字母,汉字等各类...

linux grep 26个字母

最新文章

IntelliJIDEA设置代码提示或自动补全的快捷键(附IntelliJIDEA常用快捷...

ideamac替换_史上最全的IntelliJIDEAForMac快捷键!快来收藏吧!_百度文 ...

IDEA快捷键总结和修改快捷键和全局搜索替换

IDEA打jar包(IDEA自带的打包方式)

IntelliJIDEA常见问题解决办法汇总

Brew安装Maven及其IDEA配置

标签列表