Code Journey

[코드리뷰]타코트론2 TTS 시스템 2/2

타코트론2 개인화 TTS 시스템 만들기

[코드리뷰] - 타코트론2 TTS 시스템 2/2 지난 글에서는 TTS 시스템을 개발하기 위하여 데이터를 전처리하는 방법에 대해서 다루었습니다. 이번 글에서는 전처리된 데이터를 활용하여 Tacotron2 모델과 WaveGlow 모델을 학습시키는 방법에 대해서 말씀드리도록 하겠습니다. 딥러닝 아키텍처(타코트론2)에 대해 궁금하신 분이 계시다면 이전 글...

[코드리뷰]타코트론2 TTS 시스템 1/2

타코트론2 개인화 TTS 시스템 만들기

[코드리뷰] - 타코트론2 TTS 시스템 1/2 최근 몇년간 TTS(Text to Speech)는 빠르게 발전하여 이제는 복잡한 작업 절차 없이 데이터를 이용하여 텍스트로부터 고품질의 음성을 생성할 수 있는 방법론이 개발되었습니다. 방법론 뿐만 아니라 코드와 데이터까지 Github, Kaggle 등과 같은 공개저장소에 공개되면서 이제는 개발과정조차 ...

[코드리뷰]UDA

Unsupervised Data Augmentation for Consistency Training

[코드리뷰] - Unsupervised Data Augmentation for Consistency Training, NeurIPS 2020 딥러닝은 다양한 분야에서 기존 방법론 보다 좋은 성과를 보여주고 있습니다. Machine Translation, Sentiment Analysis, Question And Answering(Q&A) 등 ...

[코드리뷰]Bootstrapped DQN

Deep Exploration via Bootstrapped DQN

[코드리뷰] - Deep Exploration via Bootstrapped DQN, NIPS 2016 딥러닝, 강화학습 등이 사회에 보편적으로 알려져 있지 않던 2016년 3월 구글 딥마인드에서 만든 알파고와 당시 세계 바둑 랭킹 2위인 이세돌 9단과의 세기의 대결이 펼쳐졌습니다. 5국의 바둑 대결에서 놀랍게도 알파고가 이세돌 9단을 4대1로 이기...

[코드리뷰]LSTM-based Anomaly Detection

LSTM-based Encoder-Decoder for Multi-sensor Anomaly Detection

[코드리뷰] - LSTM-based Encoder-Decoder for Multi-sensor Anomaly Detection, ICML 2016 유압기, 회전엔진 등에 부착된 센서를 이용하여 기계의 수명 및 건강을 확인하는 것은 산업분야에서 매우 중요한 TASK 중 하나입니다. 하지만 다양한 외부 환경과 복잡한 물리적 연결관계를 고려하여 기계의 이...

[코드리뷰]Face Recognition Using KPCA

Face Recognition Using Kernel Principal Component Analysis

[코드리뷰] - Face Recognition Using Kernel Principal Component Analysis, 2002 오늘 리뷰는 이미지에서 Kernel-PCA를 사용하여 얼굴의 특징점을 추출하고 SVM을 이용하여 서로다른 얼굴을 분류하는 논문을 리뷰하겠습니다. 이 글은 Face Recognition Using Kernel Princi...

[논문리뷰]Grad-CAM

Learning Deep Features for Discriminative Localization

[논문리뷰] - Grad-CAM : Visual Explanations from Deep Networks via Gradient-based Localization, ICCV 2017 인공지능은 이미 거의 모든 분야에서 다양한 용도로 사용되고 있습니다. 대부분 성능이 뛰어나지만 때로는 오작동을 합니다. 하지만 현재 대부분 AI는 딥러닝 기반 모델이므로...

[코드리뷰]LSTM AutoEncoder

Unsupervised Learning of Video Representations using LSTMs

[코드리뷰] - Unsupervised Learning of Video Representations using LSTMs, ICML 2015 비디오는 여러개의 이미지 프레임으로 이루어진 sequence 데이터 입니다. 따라서 비디오 데이터는 한개의 이미지로 이루어진 데이터보다 큰 차원을 다루므로 학습에 많은 비용이 필요하며 한정적인 labeled 데...

[논문리뷰]Tacotron2

Natural TTS Synthesis By Conditioning WAVENET On Mel Spectrogram Predictions

[논문리뷰] - TACOTRON2 : Natural TTS Synthesis By Conditioning WAVENET On Mel Spectrogram Predictions, ICASSP 2018 WaveNet, Tacotron 등 딥러닝 방법론이 적용되면서 최근 몇년간 TTS(Text to Speech)은 빠르게 발전하였습니다. 따라서 이제는 복...

[논문리뷰]CAM

Learning Deep Features for Discriminative Localization

[논문리뷰] - Learning Deep Features for Discriminative Localization, CVPR 2016 이미지 분야에서 자주 쓰이는 딥러닝 네트워크의 순위를 매기면 항상 상위권에 위치한 모델이 바로 Convolution Neural Network(CNN)입니다. 이 CNN 구조가 나온 이후로 다양한 모델에 적용되면서 이...