python深度学习方法代码整理--688IT编程网

python深度学习⽅法代码整理

使⽤keras框架构建模型。

中的主要数据结构是model（模型），它提供定义完整计算图的⽅法。通过将图层添加到现有模型/计算图，我们可以构建出复杂的神经⽹络。

代码中使⽤的为

model = Sequential()

Sequential模型可以构建⾮常复杂的神经⽹络，包括全连接神经⽹络、卷积神经⽹络(CNN)、循环神经⽹络(RNN)等等。

Sequential更准确的应该理解为堆叠，通过堆叠许多层，构建出深度神经⽹络。

Sequential模型的核⼼操作是添加layers（图层）

参考1:

参考2:

参考3:

1、CNN

"""配置参数"""

N = 25000 # 最⼤词数

input_dim = N + 1 # 词库⼤⼩

output_dim = 100 # 词嵌⼊维度

kernel_size = 7 # 卷积核⼤⼩

units = filters = 64 # RNN神经元数量、卷积滤波器数量

maxlen = 100 # 序列长度

batch_size = 64 # 每批数据量⼤⼩

epochs = 20 # 训练最⼤轮数

verbose = 2 # 训练过程展⽰

patience = 10 # 没有进步的训练轮数

callbacks = [EarlyStopping('val_acc', patience=patience)]

C = [1.0,2.0]

num_classes = len(C)

DISCARD_FLAG = {'c', 'd', 'e', 'o', 'p', 'r', 'u', 'uv', 'y', 'NUM'}

def model_cnn():

layer_name='CNN'

model = Sequential()

model.add(Embedding(input_dim, output_dim, input_length=maxlen, input_shape=(maxlen,)))

model.add(Conv1D(units, kernel_size * 2, padding='same', activation='relu'))

model.add(MaxPool1D(pool_size=2)) # strides默认等于pool_size

model.add(Conv1D(units * 2, kernel_size, padding='same', activation='relu'))

model.add(GlobalMaxPool1D()) # 对于时序数据的全局最⼤池化

model.add(Dense(num_classes, activation='softmax'))

modelpile('adam', 'categorical_crossentropy', ['acc'])

# 训练、预测

history = model.fit(x11, y11, batch_size, epochs, verbose, callbacks, validation_data=(x12, y12)) e = len(history.history['acc'])

print(model.evaluate(x2, y2, batch_size, verbose), e)

# 验证集加⼊训练、预测

model.fit(x12, y12, batch_size, int(e * validation_size) + 1, verbose, callbacks)

# tk.yellow(model.evaluate(x2, y2, batch_size, verbose))

y_pred = model.predict(x2)

b = np.ones(len(y_pred))

# y_pred = np.insert(y_pred,0,values=b,axis=1)

# print(y_pred)

y_predict_class = np.argmax(y_pred,axis=1)

y_true=np.argmax(y2,axis=1)

# print(y_predict_class)

# print(y_true)

2、LSTM/BiLSTM

def model_lstm():

for layer, layer_name in (

(LSTM(units), 'LSTM') ,

(Bidirectional(LSTM(units)), 'BiLSTM'),

# (Bidirectional(GRU(units)), 'BiGRU'),

# (GRU(units), 'GRU')):

# tk.cyan(layer_name)

# 建模

model = Sequential()

model.add(Embedding(input_dim, output_dim, input_length=maxlen, input_shape=(maxlen,))) model.add(layer)

model.add(Dense(units=num_classes, activation='softmax'))

modelpile('adam', 'categorical_crossentropy', ['acc'])

# 训练、预测

history = model.fit(x11, y11, batch_size, epochs, verbose, callbacks, validation_data=(x12, y12)) e = len(history.history['acc'])

# print(model.evaluate(x2, y2, batch_size, verbose), e)

# 验证集加⼊训练、预测

model.fit(x12, y12, batch_size, int(e * validation_size) + 1,verbose, callbacks)

y_pred=model.predict(x2)

#b = np.ones(len(y_pred))

# y_pred = np.insert(y_pred,0,values=b,axis=1)

# print(y_pred)

y_predict_class = np.argmax(y_pred,axis=1)

y_true=np.argmax(y2,axis=1)

# print(y_predict_class)

# print(y_true)

3、BERT

1）Bert_only

#构建模型

def build_model_BERT_Only():

bert_model = load_trained_model_from_checkpoint(config_path, checkpoint_path, seq_len=None)

for l in bert_model.layers:

x1_in = Input(shape=(None,))

x2_in = Input(shape=(None,))

x = bert_model([x1_in, x2_in])

cls_layer = Lambda(lambda x: x[:, 0])(x) ## 取出[CLS]对应的向量⽤来做分类,[cls]能代表整句话在经过token后 output = Dense(2, activation='softmax')(cls_layer)

model = Model([x1_in, x2_in], output)

modelpile(

loss='categorical_crossentropy',

optimizer=Adam(1e-5),

metrics=['accuracy']

)

model.summary()

return model

#训练模型

def train_model(allTrainData, allValData, tokenizer,modelName):

python代码转换model = build_model_BERT_Only()

filepath='checkpoint/BertNoTrain_'+ modelName+'_{epoch:02d}-{accuracy:.4f}-{val_accuracy:.4f}.h5'

early_stopping = EarlyStopping(monitor='loss', patience=3,verbose=1) # 早停法，防⽌过拟合

plateau = ReduceLROnPlateau(monitor="loss", verbose=1, mode='max', factor=0.5,

patience=2) # 当评价指标不在提升时，减少学习率

checkpoint = ModelCheckpoint(filepath, monitor='loss', verbose=1, period=1,

save_best_only=True, mode='min', save_weights_only=False) # 保存最好的模型

train_D = data_generator( allTrainData,tokenizer)

valid_D = data_generator(allValData,tokenizer)

history = model.fit_generator(

train_D.__iter__(),

steps_per_epoch=len(train_D),

epochs=10,

validation_data=valid_D.__iter__(),

validation_steps=len(valid_D),

callbacks=[early_stopping, plateau, checkpoint]

)

model.save_weights('keras_bert_'+ modelName+'.h5')

#model.save('keras_lstm')

return history

2)bert+cnn

x1_in = Input(shape=(None,))

x2_in = Input(shape=(None,))

x = bert_model([x1_in, x2_in])

c = Conv1D(128, 3, activation='relu')(x)

c = GlobalMaxPooling1D()(c)

c = Dropout(0.3)(c)

output = Dense(2, activation='softmax')(c)

model = Model([x1_in, x2_in], output)

modelpile(

loss='categorical_crossentropy',

optimizer=Adam(1e-5),

metrics=['accuracy']

)

model.summary()

return model

3)bert+lstm

def build_model_LSTM():

bert_model = load_trained_model_from_checkpoint(config_path, checkpoint_path, seq_len=None)

for l in bert_model.layers:

x1_in = Input(shape=(None,))

x2_in = Input(shape=(None,))

print("加载bert模型")

x = bert_model([x1_in, x2_in]) # cls_layer = Lambda(lambda x: x[:, 0])(x) ## 取出[CLS]对应的向

量⽤来做分类 T = LSTM(128, return_sequences=False)(x)

T = Dropout(0.3)(T)

output = Dense(2, activation='softmax')(T)

model = Model([x1_in, x2_in], output)

modelpile(

loss='categorical_crossentropy',

optimizer=Adam(1e-5),

metrics=['accuracy']

)

model.summary()

return model

4)bert+bilstm

x1_in = Input(shape=(None,))

x2_in = Input(shape=(None,))

x = bert_model([x1_in, x2_in])

T = Bidirectional(LSTM(128, return_sequences=False))(x) T = Dropout(0.3)(T)

output = Dense(2, activation='softmax')(T)

model = Model([x1_in, x2_in], output)

modelpile(

loss='categorical_crossentropy',

optimizer=Adam(1e-5),

metrics=['accuracy']

)

model.summary()

return model

688IT编程网

python深度学习方法代码整理

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

python深度学习方法代码整理

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式