知/job지식 24

Reinforcement Learning

머신러닝의 3요소 중 하나 RL(Reinforcement Learning)은 머신 러닝에 3가지 학습 법 중 하나로 인공지능의 학습의 글에서는 Supervised Learning에 대해 이야기를 잠깐 하였는데 이는 입력과 원하는 답(Label)이 존재해야 한다.개와 고양이, 쿠키와 치와와를 구분을 하기 위해 데이터가 필요하다.하지만 그런 답을 만들기 어려운 상황이 있다.예로 차나 로봇이 움직인다고 할 때 팔다리의 위치를 상황에 따라 일일히 라벨하기에는 어렵다.(길사진에 차가 꺽을 핸들 각도를  라벨링 한 적은 있음)  위와 같은 상황에서 쓸 수 있는 방법으로 상호작용이 가능한 환경에서 상태(input or state)를 얻고 행동(Action)을 정하는 정책(Policy)을 보상(reward)을 최대화하..

知/job지식 2024.05.21

Drop Out(드롭 아웃 및 초간단 구현)

목차 열기" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스왜 무엇을 버리나?Drop Out은 말 그대로 버리는 것이다. MLP로 예를 들면 퍼셉트론의 연결을 훈련중에 일정 확률로 일부분을 랜덤하게 연결을 끊어 학습을 더디게 만드는 것이다.  왜 더디게 만드는 지 이야기 전 논문 저자의 직관부터 이야기 하면 2014년도 Bishop은 이를 유성생식에 비유했다. 부모의 한쪽 유전자씩 받는 그 과정에서 유전의 혼합 능력을 떠올린 것이다. (그래서 50프로 확률로 연결을 끊어 절반만 살린다) 하지만 더 나은 직관으로 앙상블 효과로 보는 경우도 있다. 앙상블이란 간단하게 똑똑한 애 하나의 점수보다 덜 똑똑한 애 10명이 투표해 낸 결과의 점수가 높다는 것이다. 기존 앙상블은 여러 다른 ..

知/job지식 2024.05.18

Weight initialization

목차 열기" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스처음이 중요새로운 인공지능을 구성하고 학습 시 맨 처음 파라미터(가중치와 편향)는 어떻게 설정해야 할까?가중치의 최종값이 음수일지 양수일지 모르는 상황이라 모든 가중치는 0으로 설정하면 모두가 잘 찾아갈 수 있을 것 같다.하지만 모든 가중치가 같은 값을 가지면 위 링크의 w1이 x1에 영향을 받고 w2는 x2에 영향을 받는 것 같이 w에 관련 없이 입력에 따라 가중치가 업데이트를 가지는 경우도 있지만, 층이 깊어질 때 w에 영향을 받는다면 아예 학습이 안되거나 모두가 같은 값으로 업데이트가 될 수 있다.  0에 가깝게모두가 0이되면 학습이 안되니 매우 가깝게 랜덤으로 만들면 되지 않을까? 해서 정규분포의 모양 또는 평균이..

知/job지식 2024.05.15

Resnet 직관

개요이번 글에서는 Resnet이라 불리고 CNN의 도약으로 깊은 신경망을 구성할 수 있도록 된 Resnet에 대해 알아보자.먼저 이름이 어떻게 유래했는지 보자.ResNet의 논문명은 Deep Residual Learning for image Recognition 이다.Residual의 Res와 Network의 합성으로 ResNet이 나오게 되었다.Vanishing gradient(기울기 소실)깊은 신경망을 구성할 수 있게 되었다면 왜 그 이전에는 신경망을 깊게 쌓지 못했는지 파악하자.먼저 훈련을 진행하기 위해서는 변수의 영향력(미분값)을 측정해야한다. 역전파의 과정으로 Chain Rule에 따라 입력값에 가까워 질 수록 곱해지는 값이 많아진다. Activation Function이 Sigmoid라 생각해..

知/job지식 2024.05.05

CNN(Convolution Neural Network)

목차 열기" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스 개요MLP에서 미처 말하지 못했지만, MLP같이 완전히 서로 연결되어 있는 Fully Conneted Layer이라 한다. 이것의 단점은 훈련할 파라미터(가중치와 편향)의 개수가 많다는 것이다. 입력의 개수를 N이라 했을 때 레이어의 퍼셉트론 개수를 O라 하면 (N+1) O가 파라미터의 수이다. 인풋이 이미지라고 생각해 보면 입력의 개수는 가로세로 256X256이어도 이미지는 색이 존재해 3채널(R,G,B)로 있어 256X256X3개이다. 퍼셉트론의 수가 곧 분석 도구의 개수이니 초반부터 개수를 줄이기 힘들다. 이를 극복할 방법중 하나로 CNN을 사용할 수 있다. 합성곱 신경망이라고도 부르는 CNN은 2개의 차원(가로,..

知/job지식 2024.05.02