목록딥러닝 (7)
uos-machine-learning
오늘은 Text to Speech 딥 보이스 코드를 실행해보고 뜯어보는 시간을 가지겠습니다. 만들어진 오디오 샘플은 아래링크에서 확인가능하다고 합니다. 시작하기 전에 아래 코드로 먼저 설치해주세요. 다만 위 깃허브는 아웃풋을 실제 음성으로 만들 때 쓰는 World 알고리즘이 생략되어 있습니다. World 알고리즘이 구현된 코드가 궁금하시다면 링크로 들어가시면 됩니다. 0. Installation git clone https://github.com/r9y9/deepvoice3_pytorch && cd deepvoice3_pytorch pip install -e ".[bin]" 1. Getting Started 1-0. Preset Parameters 더보기 이 코드에서는 많은 파라미터를 사용할 수 있습니다..
Yolo v3는 이름에서 알 수 있듯이 초기 Yolo Model에서 약간의 디자인의 변화를 준 모델이다. 320 x 320 yolo v3는 22ms 정도로 빠르며, SSD와 거의 정확도가 유사하다는 것을 장점으로 꼽고 있다. 1. The Deal 1-1. Bounding Box Prediction network 는 bounding box의 4좌표 tx, ty, tw, th 를 예측한다. 학습하는 동안에는 sum of squared error loss를 사용한다. 그리고 각 bounding box의 objectness socre를 logistic regression 을 이용하여 예측한다. 1-2. Class Prediction softmax 함수를 쓰는 것 대신에 독립적인 logistic classifie..
오늘은 딥러닝 모델을 돌릴 때 Image Data Augmentation을 편하게 해주는 imgaug 라이브러리에 대하여 소개하고자 합니다. Data augmentation은 학습 데이터의 변조를 통해 좀 더 일반화된 모델을 얻기 위해서 사용하는 기법인데, 그 중에서도 imgaug는 이미지를 augmentation 해주는 효과를 가지고 있습니다. imgaug의 가장 좋은 점은 단순히 데이터를 회전, 노이즈, 확대 등을 할 수도 있지만 anchor box, heatmaps, seg.Maps, Keypoints 등도 같이 적용할 수 있다는 점입니다. Installation 파이썬 라이브러리다 보니 설치도 매우 쉽게 가능합니다. conda, pip 로 설치가 가능합니다! Installation : Anacon..
기존 CycleGAN Discriminator Loss를 Mean_squared error 대신 Wasserstein Loss을 사용하면 좀 더 안정적인 학습이 가능하다. Discriminator A loss function # Real loss loss_real = criterion_GAN(D_A(real_A), valid) # Fake loss (on batch of previously generated samples) fake_A_ = fake_A_buffer.push_and_pop(fake_A) loss_fake = criterion_GAN(D_A(fake_A_.detach()), fake) # Total loss loss_D_A = (loss_real + loss_fake) / 2 Discrim..
https://colab.research.google.com/github/tensorflow/docs/blob/master/site/en/r2/tutorials/generative/style_transfer.ipynb#scrollTo=eqxUicSPUOP6 Google Colaboratory colab.research.google.com Tensor flow 2.0 alpha 버전 Neural Sytle Transfer Notebook 리뷰입니다. Neural Style Transfer란? content 이미지가 style reference 이미지로 그려진 것과 같이 만들어주는 알고리즘입니다. 아래 거북이 사진(content)과 스타일 사진(style reference)을 통해 새로운 이미지를 만든 것을..
1. PSNR(Peak Signal-to-Noise Ratio) 정 의 : 신호가 가질 수 있는 최대전력 잡음비 # 케라스 psnr 평가 metric 예시 def PSNR(y_true, y_pred): return tf.image.psnr(y_true, y_pred, max_val=1.0) 2. SSIM(Structural Similarity Index) 정 의 : 압축 및 변환에 의해 발생하는 왜곡에 대하여 원본 영상에 대한 유사도를 측정하는 방법 def SSIM(y_true, y_pred): return tf.image.ssim(y_true, y_pred, max_val=1.0)
Keras는 다양한 손실함수를 제공한다. 사용하는 방법도 간단하다. from keras import losses model.compile(loss=losses.mean_squared_error, optimizer='sgd') 하지만 딥러닝 관련 여러 프로젝트를 진행하다보면 Custom loss를 만들고 싶은 욕심이 생긴다. 예를 들어 segmentation에서 dice-coef를 손실함수로 만들고자 할 때는 아래와 같이 설계하면 된다. def dice_coef(y_true, y_pred): y_true_f = K.flatten(y_true) y_pred_f = K.flatten(y_pred) intersection = K.sum(y_true_f * y_pred_f) return (2. * intersec..