0% found this document useful (0 votes)

30 views7 pages

Chinese Character Recognition BN

The document discusses training a neural network for Chinese character recognition. It defines flags for hyperparameters, builds the graph with convolutional and fully connected layers using batch normalization, loads training and test data in batches, and trains the network to minimize loss while evaluating on the test set at intervals.

Uploaded by

Christy Binu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

30 views7 pages

Chinese Character Recognition BN

Uploaded by

Christy Binu

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as TXT, PDF, TXT or read online on Scribd

You are on page 1/ 7

# with batch norm

import os
import random
import tensorflow.contrib.slim as slim
import time
import logging
import numpy as np
import tensorflow as tf
import pickle
from PIL import Image
from tensorflow.python.ops import control_flow_ops

os.environ['CUDA_VISIBLE_DEVICES']='1'

logger = logging.getLogger('Training a chinese write char recognition')

logger.setLevel(logging.INFO)
# formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %
(message)s')
ch = logging.StreamHandler()
ch.setLevel(logging.INFO)
logger.addHandler(ch)

# 设置全局变量
tf.app.flags.DEFINE_boolean('random_flip_up_down', False, "Whether to random flip
up down")
tf.app.flags.DEFINE_boolean('random_brightness', True, "whether to adjust
brightness")
tf.app.flags.DEFINE_boolean('random_contrast', True, "whether to random constrast")

tf.app.flags.DEFINE_integer('charset_size', 3755, "Choose the first `charset_size`

characters only.")
tf.app.flags.DEFINE_integer('image_size', 64, "Needs to provide same value as in
training.")
tf.app.flags.DEFINE_boolean('gray', True, "whether to change the rbg to gray")
tf.app.flags.DEFINE_integer('max_steps', 16002, 'the max training steps ')
tf.app.flags.DEFINE_integer('eval_steps', 100, "the step num to eval")
tf.app.flags.DEFINE_integer('save_steps', 500, "the steps to save")

tf.app.flags.DEFINE_string('checkpoint_dir', './checkpoint/', 'the checkpoint dir')

tf.app.flags.DEFINE_string('train_data_dir', './data/train/', 'the train dataset
dir')
tf.app.flags.DEFINE_string('test_data_dir', './data/test/', 'the test dataset dir')
tf.app.flags.DEFINE_string('log_dir', './log/', 'the logging dir')

tf.app.flags.DEFINE_boolean('restore', False, 'whether to restore from checkpoint')

tf.app.flags.DEFINE_boolean('epoch', 1, 'Number of epoches')
tf.app.flags.DEFINE_integer('batch_size', 128, 'Validation batch size')
tf.app.flags.DEFINE_string('mode', 'train', 'Running mode. One of {"train",
"valid", "test"}')

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.9)
FLAGS = tf.app.flags.FLAGS

class DataIterator:
def __init__(self, data_dir):
# Set FLAGS.charset_size to a small value if available computation power is
limited.
truncate_path = data_dir + ('%05d' % FLAGS.charset_size)
print(truncate_path)
self.image_names = []
for root, sub_folder, file_list in os.walk(data_dir):
if root < truncate_path:
self.image_names += [os.path.join(root, file_path) for file_path in
file_list]
random.shuffle(self.image_names)
self.labels = [int(file_name[len(data_dir):].split(os.sep)[0]) for
file_name in self.image_names]

@property
def size(self):
return len(self.labels)

@staticmethod
def data_augmentation(images):
if FLAGS.random_flip_up_down:
images = tf.image.random_flip_up_down(images)
if FLAGS.random_brightness:
images = tf.image.random_brightness(images, max_delta=0.3)
if FLAGS.random_contrast:
images = tf.image.random_contrast(images, 0.8, 1.2)
return images

def input_pipeline(self, batch_size, num_epochs=None, aug=False):

images_tensor = tf.convert_to_tensor(self.image_names, dtype=tf.string)
labels_tensor = tf.convert_to_tensor(self.labels, dtype=tf.int64)
input_queue = tf.train.slice_input_producer([images_tensor, labels_tensor],
num_epochs=num_epochs)

labels = input_queue[1]
images_content = tf.read_file(input_queue[0])
images = tf.image.convert_image_dtype(tf.image.decode_png(images_content,
channels=1), tf.float32)
if aug:
images = self.data_augmentation(images)
new_size = tf.constant([FLAGS.image_size, FLAGS.image_size],
dtype=tf.int32)
images = tf.image.resize_images(images, new_size)
image_batch, label_batch = tf.train.shuffle_batch([images, labels],
batch_size=batch_size, capacity=50000,
min_after_dequeue=10000)
# print 'image_batch', image_batch.get_shape()
return image_batch, label_batch

def build_graph(top_k):
keep_prob = tf.placeholder(dtype=tf.float32, shape=[], name='keep_prob')
images = tf.placeholder(dtype=tf.float32, shape=[None, 64, 64, 1],
name='image_batch')
labels = tf.placeholder(dtype=tf.int64, shape=[None], name='label_batch')
is_training = tf.placeholder(dtype=tf.bool, shape=[], name='train_flag')
with tf.device('/gpu:1'):
with slim.arg_scope([slim.conv2d, slim.fully_connected],
normalizer_fn=slim.batch_norm,
normalizer_params={'is_training': is_training}):
conv3_1 = slim.conv2d(images, 64, [3, 3], 1, padding='SAME',
scope='conv3_1')
max_pool_1 = slim.max_pool2d(conv3_1, [2, 2], [2, 2], padding='SAME',
scope='pool1')
conv3_2 = slim.conv2d(max_pool_1, 128, [3, 3], padding='SAME',
scope='conv3_2')
max_pool_2 = slim.max_pool2d(conv3_2, [2, 2], [2, 2], padding='SAME',
scope='pool2')
conv3_3 = slim.conv2d(max_pool_2, 256, [3, 3], padding='SAME',
scope='conv3_3')
max_pool_3 = slim.max_pool2d(conv3_3, [2, 2], [2, 2], padding='SAME',
scope='pool3')
conv3_4 = slim.conv2d(max_pool_3, 512, [3, 3], padding='SAME',
scope='conv3_4')
conv3_5 = slim.conv2d(conv3_4, 512, [3, 3], padding='SAME',
scope='conv3_5')
max_pool_4 = slim.max_pool2d(conv3_5, [2, 2], [2, 2], padding='SAME',
scope='pool4')

flatten = slim.flatten(max_pool_4)
fc1 = slim.fully_connected(slim.dropout(flatten, keep_prob), 1024,
activation_fn=tf.nn.relu, scope='fc1')
logits = slim.fully_connected(slim.dropout(fc1, keep_prob),
FLAGS.charset_size, activation_fn=None,
scope='fc2')
loss =
tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=logits,
labels=labels))
accuracy = tf.reduce_mean(tf.cast(tf.equal(tf.argmax(logits, 1), labels),
tf.float32))

update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
if update_ops:
updates = tf.group(*update_ops)
loss = control_flow_ops.with_dependencies([updates], loss)

global_step = tf.get_variable("step", [],

initializer=tf.constant_initializer(0.0), trainable=False)
optimizer = tf.train.AdamOptimizer(learning_rate=0.1)
train_op = slim.learning.create_train_op(loss, optimizer,
global_step=global_step)
probabilities = tf.nn.softmax(logits)

tf.summary.scalar('loss', loss)
tf.summary.scalar('accuracy', accuracy)
merged_summary_op = tf.summary.merge_all()
predicted_val_top_k, predicted_index_top_k = tf.nn.top_k(probabilities,
k=top_k)
accuracy_in_top_k = tf.reduce_mean(tf.cast(tf.nn.in_top_k(probabilities,
labels, top_k), tf.float32))

return {'images': images,

'labels': labels,
'keep_prob': keep_prob,
'top_k': top_k,
'global_step': global_step,
'train_op': train_op,
'loss': loss,
'is_training': is_training,
'accuracy': accuracy,
'accuracy_top_k': accuracy_in_top_k,
'merged_summary_op': merged_summary_op,
'predicted_distribution': probabilities,
'predicted_index_top_k': predicted_index_top_k,
'predicted_val_top_k': predicted_val_top_k}

def train():
logger.info('Begin training')
train_feeder = DataIterator(data_dir='./data/train/')
test_feeder = DataIterator(data_dir='./data/test/')
model_name = 'chinese-rec-model'
with tf.Session(config=tf.ConfigProto(gpu_options=gpu_options,
allow_soft_placement=True)) as sess:
train_images, train_labels =
train_feeder.input_pipeline(batch_size=FLAGS.batch_size, aug=True)
test_images, test_labels =
test_feeder.input_pipeline(batch_size=FLAGS.batch_size)
graph = build_graph(top_k=1)
saver = tf.train.Saver()
sess.run(tf.global_variables_initializer())
coord = tf.train.Coordinator()
threads = tf.train.start_queue_runners(sess=sess, coord=coord)

train_writer = tf.summary.FileWriter(FLAGS.log_dir + '/train', sess.graph)

test_writer = tf.summary.FileWriter(FLAGS.log_dir + '/val')
start_step = 0
if FLAGS.restore:
ckpt = tf.train.latest_checkpoint(FLAGS.checkpoint_dir)
if ckpt:
saver.restore(sess, ckpt)
print("restore from the checkpoint {0}".format(ckpt))
start_step += int(ckpt.split('-')[-1])

logger.info(':::Training Start:::')
try:
i = 0
while not coord.should_stop():
i += 1
start_time = time.time()
train_images_batch, train_labels_batch = sess.run([train_images,
train_labels])
feed_dict = {graph['images']: train_images_batch,
graph['labels']: train_labels_batch,
graph['keep_prob']: 0.8,
graph['is_training']: True}
_, loss_val, train_summary, step = sess.run(
[graph['train_op'], graph['loss'], graph['merged_summary_op'],
graph['global_step']],
feed_dict=feed_dict)
train_writer.add_summary(train_summary, step)
end_time = time.time()
logger.info("the step {0} takes {1} loss {2}".format(step, end_time
- start_time, loss_val))
if step > FLAGS.max_steps:
break
if step % FLAGS.eval_steps == 1:
test_images_batch, test_labels_batch = sess.run([test_images,
test_labels])
feed_dict = {graph['images']: test_images_batch,
graph['labels']: test_labels_batch,
graph['keep_prob']: 1.0,
graph['is_training']: False}
accuracy_test, test_summary = sess.run([graph['accuracy'],
graph['merged_summary_op']],
feed_dict=feed_dict)
if step > 300:
test_writer.add_summary(test_summary, step)
logger.info('===============Eval a
batch=======================')
logger.info('the step {0} test accuracy: {1}'
.format(step, accuracy_test))
logger.info('===============Eval a
batch=======================')
if step % FLAGS.save_steps == 1:
logger.info('Save the ckpt of {0}'.format(step))
saver.save(sess, os.path.join(FLAGS.checkpoint_dir,
model_name),
global_step=graph['global_step'])
except tf.errors.OutOfRangeError:
logger.info('==================Train Finished================')
saver.save(sess, os.path.join(FLAGS.checkpoint_dir, model_name),
global_step=graph['global_step'])
finally:
coord.request_stop()
coord.join(threads)

def validation():
print('Begin validation')
test_feeder = DataIterator(data_dir='./data/test/')

final_predict_val = []
final_predict_index = []
groundtruth = []

with tf.Session() as sess:

test_images, test_labels =
test_feeder.input_pipeline(batch_size=FLAGS.batch_size, num_epochs=1)
graph = build_graph(top_k=3)
saver = tf.train.Saver()

sess.run(tf.global_variables_initializer())
sess.run(tf.local_variables_initializer()) # initialize test_feeder's
inside state

coord = tf.train.Coordinator()
threads = tf.train.start_queue_runners(sess=sess, coord=coord)

ckpt = tf.train.latest_checkpoint(FLAGS.checkpoint_dir)
if ckpt:
saver.restore(sess, ckpt)
print("restore from the checkpoint {0}".format(ckpt))

logger.info(':::Start validation:::')
try:
i = 0
acc_top_1, acc_top_k = 0.0, 0.0
while not coord.should_stop():
i += 1
start_time = time.time()
test_images_batch, test_labels_batch = sess.run([test_images,
test_labels])
feed_dict = {graph['images']: test_images_batch,
graph['labels']: test_labels_batch,
graph['keep_prob']: 1.0,
graph['is_training']: False}
batch_labels, probs, indices, acc_1, acc_k =
sess.run([graph['labels'],

graph['predicted_val_top_k'],

graph['predicted_index_top_k'],

graph['accuracy'],

graph['accuracy_top_k']], feed_dict=feed_dict)
final_predict_val += probs.tolist()
final_predict_index += indices.tolist()
groundtruth += batch_labels.tolist()
acc_top_1 += acc_1
acc_top_k += acc_k
end_time = time.time()
logger.info("the batch {0} takes {1} seconds, accuracy = {2}(top_1)
{3}(top_k)"
.format(i, end_time - start_time, acc_1, acc_k))

except tf.errors.OutOfRangeError:
logger.info('==================Validation Finished================')
acc_top_1 = acc_top_1 * FLAGS.batch_size / test_feeder.size
acc_top_k = acc_top_k * FLAGS.batch_size / test_feeder.size
logger.info('top 1 accuracy {0} top k accuracy {1}'.format(acc_top_1,
acc_top_k))
finally:
coord.request_stop()
coord.join(threads)
return {'prob': final_predict_val, 'indices': final_predict_index,
'groundtruth': groundtruth}

def inference(image):
print('inference')
temp_image = Image.open(image).convert('L')
temp_image = temp_image.resize((FLAGS.image_size, FLAGS.image_size),
Image.ANTIALIAS)
temp_image = np.asarray(temp_image) / 255.0
temp_image = temp_image.reshape([-1, 64, 64, 1])
with tf.Session() as sess:
logger.info('========start inference============')
# images = tf.placeholder(dtype=tf.float32, shape=[None, 64, 64, 1])
# Pass a shadow label 0. This label will not affect the computation graph.
graph = build_graph(top_k=3)
saver = tf.train.Saver()
ckpt = tf.train.latest_checkpoint(FLAGS.checkpoint_dir)
if ckpt:
saver.restore(sess, ckpt)
predict_val, predict_index = sess.run([graph['predicted_val_top_k'],
graph['predicted_index_top_k']],
feed_dict={graph['images']:
temp_image,
graph['keep_prob']: 1.0,
graph['is_training']:
False})
return predict_val, predict_index

def main(_):
print(FLAGS.mode)
if FLAGS.mode == "train":
train()
elif FLAGS.mode == 'validation':
dct = validation()
result_file = 'result.dict'
logger.info('Write result into {0}'.format(result_file))
with open(result_file, 'wb') as f:
pickle.dump(dct, f)
logger.info('Write file ends')
elif FLAGS.mode == 'inference':
image_path = './data/test/00190/13320.png'
final_predict_val, final_predict_index = inference(image_path)
logger.info('the result info label {0} predict index {1} predict_val
{2}'.format(190, final_predict_index,

final_predict_val))

if __name__ == "__main__":
tf.app.run()

AlexNet Transfer Learning - Ipynb
No ratings yet
AlexNet Transfer Learning - Ipynb
5 pages
TensorFlow Mechanics 101
No ratings yet
TensorFlow Mechanics 101
7 pages
Apex For Bres 1
No ratings yet
Apex For Bres 1
6 pages
Csc413 Project Semantic Segmentation
No ratings yet
Csc413 Project Semantic Segmentation
84 pages
Final Code
No ratings yet
Final Code
16 pages
CVcode
No ratings yet
CVcode
4 pages
Train
No ratings yet
Train
13 pages
Mnist
No ratings yet
Mnist
3 pages
Hand Written
No ratings yet
Hand Written
13 pages
NN From Scratch
No ratings yet
NN From Scratch
5 pages
Training Code
No ratings yet
Training Code
27 pages
DL 5 Excuted
No ratings yet
DL 5 Excuted
13 pages
Assignment 2.3.1 Transfer Learning
No ratings yet
Assignment 2.3.1 Transfer Learning
7 pages
Not F: # Check If The File Exists
No ratings yet
Not F: # Check If The File Exists
7 pages
DL - 5 Excuted
No ratings yet
DL - 5 Excuted
13 pages
CNN Ise
No ratings yet
CNN Ise
5 pages
Malaria 1735833704
No ratings yet
Malaria 1735833704
14 pages
MNIST Tensorflow Mini Project 1749471354
No ratings yet
MNIST Tensorflow Mini Project 1749471354
4 pages
Tensorflow, Keras and Deep Learning
No ratings yet
Tensorflow, Keras and Deep Learning
51 pages
TLM For CNN
No ratings yet
TLM For CNN
32 pages
# Load The Dataset # Normalize The Images To (-1, 1) For Better Performance of The GAN # Add Channel Dimension # Set Buffer and Batch Size
No ratings yet
# Load The Dataset # Normalize The Images To (-1, 1) For Better Performance of The GAN # Add Channel Dimension # Set Buffer and Batch Size
3 pages
VGG16 Estudo
No ratings yet
VGG16 Estudo
10 pages
Def Return: Round
No ratings yet
Def Return: Round
18 pages
Appix
No ratings yet
Appix
15 pages
Lab
No ratings yet
Lab
12 pages
Original Code
No ratings yet
Original Code
3 pages
AM19 ADL U-Net-Model
No ratings yet
AM19 ADL U-Net-Model
37 pages
This Python Script Implements A Single
No ratings yet
This Python Script Implements A Single
6 pages
DL Internal
No ratings yet
DL Internal
12 pages
Lab Manual
No ratings yet
Lab Manual
45 pages
Intro To Pytorch
No ratings yet
Intro To Pytorch
12 pages
EXP6
No ratings yet
EXP6
5 pages
Potato Disease Classification Using CNN
No ratings yet
Potato Disease Classification Using CNN
21 pages
Vit32 GPTMD
No ratings yet
Vit32 GPTMD
6 pages
Deep Learning Programs Updated
No ratings yet
Deep Learning Programs Updated
24 pages
Brain Tumour Classification
No ratings yet
Brain Tumour Classification
10 pages
1729492946538
No ratings yet
1729492946538
10 pages
C1 W421
No ratings yet
C1 W421
31 pages
Val
No ratings yet
Val
9 pages
Ass 3
No ratings yet
Ass 3
5 pages
HW4ML Project Code
No ratings yet
HW4ML Project Code
24 pages
C2 W3
No ratings yet
C2 W3
29 pages
C2 W3
No ratings yet
C2 W3
29 pages
CNN TF Keras
No ratings yet
CNN TF Keras
6 pages
实践任务
No ratings yet
实践任务
29 pages
Trainrealfill
No ratings yet
Trainrealfill
19 pages
Brain Tumor Classification Using Vision Transformer (Vit) : Import As Import As
No ratings yet
Brain Tumor Classification Using Vision Transformer (Vit) : Import As Import As
11 pages
Ccnet Only
No ratings yet
Ccnet Only
6 pages
Project Car Code
No ratings yet
Project Car Code
15 pages
Skill 7
No ratings yet
Skill 7
11 pages
Network
No ratings yet
Network
6 pages
NNDL 7&8 Programs
No ratings yet
NNDL 7&8 Programs
7 pages
Conv Net
No ratings yet
Conv Net
7 pages
01 249212 012 10129792044 11122022 112910pm
No ratings yet
01 249212 012 10129792044 11122022 112910pm
8 pages
Assignment3 AL
No ratings yet
Assignment3 AL
23 pages
Code File
No ratings yet
Code File
6 pages
DL 8
No ratings yet
DL 8
4 pages
Import Numpy As NP
No ratings yet
Import Numpy As NP
3 pages
Entropy 23 00090 v3
No ratings yet
Entropy 23 00090 v3
12 pages
Sap Emp Record
No ratings yet
Sap Emp Record
1,110 pages
XI-10 STRAIGHT LINES-remesh-hsslive
No ratings yet
XI-10 STRAIGHT LINES-remesh-hsslive
13 pages
Hsslive-CH 12. INTRODUCTION TO THREE DIMENSIONAL GEOMETRY
No ratings yet
Hsslive-CH 12. INTRODUCTION TO THREE DIMENSIONAL GEOMETRY
4 pages
XI-Maths-LINEAR INEQUALITIES-ramesh-hsslive
No ratings yet
XI-Maths-LINEAR INEQUALITIES-ramesh-hsslive
9 pages
XI CH 14. Mathematical Reasoning Remesh Hsslive
No ratings yet
XI CH 14. Mathematical Reasoning Remesh Hsslive
13 pages
MSC AI Syllabus
No ratings yet
MSC AI Syllabus
63 pages
Automated Planning and Scheduling - Wikipedia
No ratings yet
Automated Planning and Scheduling - Wikipedia
7 pages
Adressing NFR With Agile Practices
No ratings yet
Adressing NFR With Agile Practices
44 pages

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.

Chinese Character Recognition BN

Uploaded by

Chinese Character Recognition BN

Uploaded by

# with batch norm

logger = logging.getLogger('Training a chinese write char recognition')

tf.app.flags.DEFINE_integer('charset_size', 3755, "Choose the first `charset_size`

tf.app.flags.DEFINE_string('checkpoint_dir', './checkpoint/', 'the checkpoint dir')

tf.app.flags.DEFINE_boolean('restore', False, 'whether to restore from checkpoint')

def input_pipeline(self, batch_size, num_epochs=None, aug=False):

global_step = tf.get_variable("step", [],

return {'images': images,

train_writer = tf.summary.FileWriter(FLAGS.log_dir + '/train', sess.graph)

with tf.Session() as sess:

You might also like

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.