java调用python模型--688IT编程网

java调⽤python模型

import org.apachemons.lang3.StringUtils;

sorflow.Graph;

sorflow.Session;

sorflow.Tensor;

import java.io.*;

import java.nio.file.Files;

import java.nio.file.Paths;

import java.util.*;

public class MatchTensor {

public static String filePath="D:\\ideaprojects\\match1\\src\\main\\java\\com\\data\\";

public static String labelPath="D:\\ideaprojects\\match1\\src\\main\\java\\com\\data\\";

public static HashMap<String,Integer> hashMap =new HashMap<String,Integer>(){

{

put("0",1693);

}

};

public static Boolean is_control(char char_){

if (("\t".equals(char_)) |("\n".equals(char_))|("\r".equals(char_))){

return false;

}

Character c=new Character(char_);

int Type(char_);

if (type==15 | type==16 |type==18|type==19|type==7){

return true;

}

return false;

}

public static Boolean is_whitespace(char char_){

Character newchar=new Character(char_);

if(" ".equals(newchar)|"\t".equals(newchar)|"\n".equals(newchar)|"\r".equals(newchar)){

return true;

}

if (Type(newchar)==12){

return true;

}

return false;

}

public static String cleanText(String str){

String result="";

for (int i = 0; i < str.length(); i++){

int chr1 = (char) str.charAt(i);

if((chr1==0)|(chr1==0xfffd)|is_control(str.charAt(i))){

continue;

}

if(is_whitespace(str.charAt(i))){

result+=" ";

}else{

result+=str.charAt(i);

}

return result;

}

private static String run_strip_accents(String text){

return "";

}

int num= (int)char_ ;

if ((num >= 33 && num <= 47) | (num >= 58 && num <= 64) |

(num >= 91 && num <= 96) | (num >= 123 && num <= 126)){ return true;

}

Character c=new Character(char_);

int Type(char_);

if((t>=20 && t<=24)|(t>=29 && t<=30)){

return true ;

}

return false;

}

private static ArrayList<String> _run_split_on_punc(String text){

char[] CharArray();

ArrayList<ArrayList> output=new ArrayList();

//String[] output=new String[500];

int i=0;

Boolean start_new_word =true;

while(i<chars.length){

char char_=chars[i];

if(_is_punctuation(char_)){

ArrayList arrayList=new ArrayList();

arrayList.add(char_);

output.add(arrayList);

start_new_word =true;

}else{

if(start_new_word){

ArrayList arrayList=new ArrayList();

output.add(arrayList);

}

start_new_word=false;

<(output.size()-1).add(char_);

}

i+=1;

}

ArrayList<String> result=new ArrayList<>();

for(ArrayList arrayList:output){

String ss="";

for(int m = 0;m < arrayList.size(); m++){

ss+=(m);

}

result.add(ss);

}

return result;

}

public static ArrayList<String> whitespace_tokenize(String text){

ArrayList<String> outtexts=new ArrayList();

if(StringUtils.isNotEmpty(text)){

String[] texts=text.split("\\s+");// Java 以空格分割字符串

for(String i:texts){

outtexts.add(i);

}

return outtexts;

}

public static ArrayList<String> basicTokenize(String text){

String newText=cleanText(text);

ArrayList<String> outtexts= whitespace_tokenize(newText);

ArrayList<String> split_tokens=new ArrayList<>();

for(String s:outtexts){

String LowerCase();

//String newtoken=run_strip_accents(news);

ArrayList<String> newss=_run_split_on_punc(news);

for(String ss:newss){

}

String all="";

for(String s:split_tokens){

all+=s+" ";

}

return whitespace_tokenize(all.substring(0,all.length()-1));

}

public static HashMap<String,Integer> getVocab(String filePath) throws IOException {

HashMap<String,Integer> hashMap=new HashMap<>();

FileInputStream fileInputStream=new FileInputStream(filePath);

InputStreamReader inputStreamReader=new InputStreamReader(fileInputStream,"UTF-8"); BufferedReader br=new BufferedReader(inputStreamReader);

String line="";

int i=0;

while((adLine())!=null){ // line 是否有换⾏符

hashMap.put(line,i);

i+=1;

}

return hashMap;

}

public static String index2label(int index) throws IOException {

HashMap<Integer,String> hashMap=new HashMap<>();

FileInputStream fileInputStream=new FileInputStream(labelPath);

InputStreamReader inputStreamReader=new InputStreamReader(fileInputStream,"UTF-8"); BufferedReader br=new BufferedReader(inputStreamReader);

String line="";

int i=0;

while((adLine())!=null){ // line 是否有换⾏符

hashMap.put(i,line);

i+=1;

}

(index);

}

public static ArrayList<String> wordpiece_tokenizer(String text) throws IOException{

HashMap<String,Integer> hashMap=getVocab(filePath);

ArrayList<String> output_tokens=new ArrayList<>();

for(String s:whitespace_tokenize(text)){

char[] chars = s.toCharArray();

if(chars.length>100){

output_tokens.add("[UNK]");

continue;

}

boolean is_bad=false;

int start=0;

ArrayList<String> sub_tokens=new ArrayList<>();

while(start<chars.length){

int end=chars.length;

String cur_subsrt=null;

while(start<end){

String substr="";

for(int i=start;i<end;i++){

substr+=chars[i];

}

if(start>0){

substr="##"+substr;

}

if( ainsKey(substr)){

cur_subsrt=substr;

break;

}

if(cur_subsrt.isEmpty()){

is_bad=true;

break;

}

sub_tokens.add(cur_subsrt);

start=end;

}

if(is_bad){

output_tokens.add("[UNK]");

}else{

for(String tokens:sub_tokens){

output_tokens.add(tokens);

}

return output_tokens;

}

public static ArrayList<String> tokenize(String text) throws IOException {

ArrayList<String> split_tokens=new ArrayList<>();

java调用python模型ArrayList<String> list=basicTokenize(text);

for(String s:list){

for(String tokens:wordpiece_tokenizer(s)){

split_tokens.add(tokens);

}

return split_tokens;

}

public static InputFeature constructTensor(String data) throws IOException {

HashMap<String,Integer> hashMap= getVocab(filePath);

InputExample example=new InputExample();

example.setGuid("1");

example.setText_a("........");

example.setText_b("");

example.setLabel("0");

ArrayList<String> tokens_a = Text_a());

ArrayList<String> tokens_anew=new ArrayList<>();

ArrayList<String> tokens=new ArrayList<>();

ArrayList<Integer> segment_ids=new ArrayList<>();

tokens.add("[CLS]");

segment_ids.add(0);

if(tokens_a.size()>23){

for(int i=0;i<tokens_a.size()-2;i++){

tokens_anew.add((i));

}

}else{

tokens_anew=tokens_a;

}

for(String s:tokens_anew){

tokens.add(s);

segment_ids.add(0);

}

tokens.add("[SEP]");

segment_ids.add(0);

ArrayList<Integer> input_ids=new ArrayList<>();

ArrayList<Integer> input_mask=new ArrayList<>();

for(String s:tokens){

input_ids.(s));

input_mask.add(1);

}

while(input_ids.size()<25){

segment_ids.add(0);

}

InputFeature feature=new InputFeature();

feature.setInput_ids(input_ids);

feature.setInput_mask(input_mask);

feature.setSegments_ids(segment_ids);

feature.setLabel_id(1693);

return feature;

}

public static Session readGraph() throws IOException {

String modelDir = ".";

byte[] graphDef = ("D:\\ideaprojects\\match1\\src\\main\\java\\com\\data\\graph.db"));

Graph g = new Graph();

g.importGraphDef(graphDef);

Session session= new Session(g);

return session;

}

public static void main(String[] args) throws Exception{

Date start = new Date();

Date sess=new Date();

Session session = readGraph();

Date t1=new Date();

System.out.Time()-Time());

System.out.println("..........t1");

InputFeature input = constructTensor("........");

Date t2=new Date();

System.out.Time()-t1.getTime());

System.out.println("..........t2");

ArrayList<Integer> input_ids1 = Input_ids();

int[] inputs_ids=new int[25];

for(int i=0;i<input_ids1.size();i++){

inputs_ids[i]=(i);

}

//int[] target= Arrays.stream(targetInter).mapToInt(Integer::valueOf).toArray();

ArrayList<Integer> input_mask1 = Input_mask();

int[] input_mask=new int[25];

for(int i=0;i<input_mask1.size();i++){

input_mask[i]=(i);

}

ArrayList<Integer> segments_ids1 = Segments_ids();

int[] segments_ids=new int[25];

for(int i=0;i<segments_ids.length;i++){

segments_ids[i]=(i);

}

Date t3=new Date();

System.out.Time()-t2.getTime());

System.out.println("..........t3");

Tensor result = session.runner().feed("inputs_id", ate(inputs_ids)).feed("input_mask",ate(input_mask)).feed("token_type_ids",Tenso Date t4=new Date();

System.out.Time()-t3.getTime());

System.out.println("..........t4");

long[] rshape = result.shape();

// System.out.println(result); // FLOAT tensor with shape [1, 1693]

float[][] prop= (float[][]) pyTo(new float[1][1693]);

HashMap<Float,Integer> map=new HashMap();

float[] t=prop[0];

for(int i=0;i<prop[0].length;i++) {

map.put(prop[0][i],i); //将值和下标存⼊Map

}

Arrays.sort(t);

688IT编程网

java调用python模型

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

java调用python模型

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式