uos-machine-learning
Yolo v3 논문 리뷰 본문
Yolo v3는 이름에서 알 수 있듯이 초기 Yolo Model에서 약간의 디자인의 변화를 준 모델이다. 320 x 320 yolo v3는 22ms 정도로 빠르며, SSD와 거의 정확도가 유사하다는 것을 장점으로 꼽고 있다.
1. The Deal
1-1. Bounding Box Prediction

network 는 bounding box의 4좌표 tx, ty, tw, th 를 예측한다. 학습하는 동안에는 sum of squared error loss를 사용한다. 그리고 각 bounding box의 objectness socre를 logistic regression 을 이용하여 예측한다.

1-2. Class Prediction
softmax 함수를 쓰는 것 대신에 독립적인 logistic classifier를 사용한다. 학습하는 동안 binary cross-entropy를 사용한 것을 알 수 있다. 이는 Open Image Dataset을 학습할 때 도움이 된다.
1-3. Predictions Across Scales
Yolo v3는 3가지 다른 크기의 박스를 예측한다. 3개의 feature pyramid network를 사용하여 다양한 feature를 뽑아낸다. 총 9개의 anchor box는 k-means clustering을 통해 결정한다.
1-4. Feature Extractor

1-5. Training

2. Things We Tried Didn't work
Anchor box x, y offset predictions.
Linear x,y predictions instead of logistic.
Focal loss
Dual IOS thresholds and truth assignment.
'딥러닝' 카테고리의 다른 글
Text to Speech 딥보이스 3 돌려만보기 - Deep Voice 3 (Pytorch) (1) | 2020.06.01 |
---|---|
파이썬 라이브러리 소개 - imgaug (1) | 2019.09.12 |
CycleGAN Implementataion 코드에 Wasserstein loss 추가하기(Pytorch) (0) | 2019.09.08 |
Tensorflow 2.0 Neural Style Transfer 튜토리얼 (5) | 2019.05.14 |
Image Super Resolution Evaluation Metric 케라스 구현 (0) | 2019.05.11 |