티스토리 뷰

이제 본격적으로 CNN을 통하여 수지 vs 아이유의 대결을 시작해보고자 한다.

하지만, 인간은 두려움이 많고 불확실함을 싫어한다.

맞다. 일단 이게 어느정도 성공 가능성이 있는지 알고 하는 것과 모르고 하는 것의 차이는 분명 존재한다.

성공 가능성을 알아보기 위하여 하나의 웹사이트를 소개하고자 한다.

바로....

https://teachablemachine.withgoogle.com/ 

Teachable Machine

Train a computer to recognize your own images, sounds, & poses. A fast, easy way to create machine learning models for your sites, apps, and more – no expertise or coding required.

teachablemachine.withgoogle.com

티처블 머신이란 것이다. 도메인에서도 볼 수 있듯, 구글과 함께한 것 같다.
이 사이트는 데이터만 준비하면 간단하지만 효과는 뛰어난 딥러닝을 체험해 볼 수 있고,
export까지 할 수 있어서 웹, 앱에서 자신이 학습한 모델을 사용할 수 있다.
소개는 이쯤하고.... 일단 나의 목표 '아이유 vs 수지'의 성공 가능성을 봐야겠다.

 

 

티처블 머신에 들어간 800여장의 사진들

 

필자는 이 테스트를 위해 아이유 사진(1000장), 수지 사진(1000장)을 중복 제외와 다른 사람 제외 등등... 수작업을 거쳐 얼굴을 추출했다.
Train data로 아이유 400장, 수지 416장을 분류해 놓은 상태이다.
이 사진을 티처블 머신에 넣어 아무것도 만지지 않고 학습해보겠다.

 

위 티처블 머신으로 학습한 지표

 

자, 이렇게 지표가 나왔다. 정확도는 76%... 개인적으로 어느 정도 괜찮다고 생각했다.
이유는 간단하다. 1. 데이터 정제가 훌륭하지 않다. 2. 데이터가 너무 적다. 3. 학습 세부적 파라미터를 바꾸지 않았다.
이 정도라고 생각한다. 딥러닝을 접해본 사람은 보통 이런 말을 들어봤을 것이다. '방대한 양의 데이터가 기본이다'
그 예로 딥러닝의 가장 기본으로 언급되는 MNIST(손글씨 숫자 판단)은 1만 개의 데이터를 학습하는 것으로 알고 있다.
자그마치 1만 개... 여기서는 고작 800개의 데이터를 사용했으니... 턱없이 부족하다 생각한다.

하지만 필자의 목적은 단 한 가지, '구분이 가능한가?'이므로 어느 정도 목적은 충족했다.
이왕 학습시킨 거 테스트도 해보자.

 

아이유 vs 수지

 

 

테스트를 해보니 잘 인식한다. 여기서 Class 2는 수지를 의미한다.(모르고 안 바꿨다.)
물론, 틀리게 인식하는 사진도 있지만, 그래도 괜찮다. 분류할 수 있다는 소리니까. 희망을 품고 시작할 수 있다.
딥러닝을 처음 시작해 보고 어떤 것인지 맛보기로 보고 싶은 분들은 티처블 머신(https://teachablemachine.withgoogle.com/) 강추한다. 성능도 성능이고 사용법도 간단하여 누구나 접할 수 있다. 부디 티처블 머신이 흥미를 돋웠으면 하는 바람이다.

다음 화는 파이썬과 대표적 딥러닝 프레임워크 Keras를 사용해 나만의 DIY CNN모델을 만들어보고 성능도 봐보자.

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함