본문 바로가기
SMALL

ㄴ 공부공부룸/AI4

[위변조] CAT-Net [2023.01월 위변조 연구 관련 survey] 이미지 위변조를 detect 하고 localization하는 방법에 대해 소개하는 논문이다. 이미지의 획득과 편집에서 발생하는 JPEG 압축 Artifact에 초점을 맞춘다. 이미지 위변조를 방지하기 위해서는 이를 detect하고 위조된 영역을 localization하는 것이 중요하다. 기본 가정은 다음과 같다.조작된 영역의 이미지의 artifact 혹은 JPEG 압축 artifact는 원래 영역의 artifact와 통계적 특성이 다르다. 따라서 JPEG 압축 Artifact가 있는 Discrete Cosine Transforme(DCT) 계수를 사용한여 이미지 위변조의 localization을 가능하게 하는 CNN을 이용하는데, 이것이 Compr.. 2023. 1. 13.
하이퍼파라미터 튜닝 [2022.12.06 모델 성능을 최적화하기 위한 하이퍼파라미터 튜닝 방법 searching] 1. Hyperparameter란?모델링할 때 사용자가 직접 세팅해주는 값정해진 최적의 값은 없고, 휴리스틱한 방법이나 rules of thumb에 의해 결정하는 경우가 대부분이고, bayesian optimization와 같은 자동으로 선택해주는 라이브러리를 사용하기도 한다. 그렇다면 parameter와의 차이점은?사용자에 의해 직접 설정되는 지의 여부가 가장 큰 차이점 hyperparameterparameter설명모델 학습 과정에 반영되는 값모델 내부에서 결정되는 변수특징최적의 훈련 모델을 구현하기 위해학습 시작 전에 미리 조정됨데이터로부터 학습 또는 예측되며훈련 모델의 성능은 파라미터에 의해 결정됨예시.. 2022. 12. 6.
[OCR] PixelLink [2022.11월 OCR 개발 관련 survey] 최신 STD(Scene Text Detection) 알고리즘은 bounding box regression을 기반으로 하는 딥러닝으로, 두가지 예측을 수행한다. 1. text/non-text classification2. location regression 그러나 text/non-text classification 예측 수행만으로도 semantic segmentation 역할을 할 수 있어 location regression이 필수적이지 않다. 다만 이미지 속 text가 서로 가까워 semantic segmentation으로 분리하는 것이 어려울 때가 있다. 이 문제를 instance segmentation으로 해결하고자 하는데, 방식은 다음과 같다.먼저.. 2022. 12. 6.
[OCR] Text detection model research [2022.11월 OCR 개발 관련 survey]본 논문은 정지 장면 이미지에서 deep learning 기반 text detection과 text recognition을 연구, 각 model들을 비교 분석한 논문이다. 최근에는 OCR을 deep learning 기반으로 개발하는데, detection 부분과 recognition 부분으로 나뉘어져 있다. 내가 맡은 개발 파트는 text detectection이기 때문에 이 부분에 집중하여 survey를 진행했고 정리했다. https://arxiv.org/pdf/1811.04256v5.pdf 논문에 기재된 OCR 방법은 크게 deep learning 기반의 유무로 나뉜다.Method before the Deep Learning EraMethodol.. 2022. 11. 29.