'知/job지식' 카테고리의 글 목록 (4 Page)

Stochastic process

개념한국말로 확률 과정이라고도 하는 Strochastic process는 시간에 따라 일어나는 현상이 확률에 의해 결정되는 것을 수학적으로 표현한 것이다.예를 들어 주식 가격의 변동이나 날씨변화를 Stochastic process가 가능하다. 이러한 현상들은 과거의 값들에 의존하지만, 미래의 값은 확률적으로 결정된다.단순 확률인 probability와 혼동이 올 수 있으나 시간(Path)에 따른 확률로 이해하면 쉽다.특징Independent Increment : 시간 t에서의 값 $X_t$와 t-1에서의 값 $X_{t-1}$의 차이인 $X_t-X_{t-1}은 t에 독립적이다. 즉 과거의 값으로부터 미래의 값을 정확히 예측할 수 없다. 오늘 비올 확률과 내일 비올확률이 독립.Stationary : Stoc..

知/job지식 2024.05.23

Reinforcement Learning

머신러닝의 3요소 중 하나 RL(Reinforcement Learning)은 머신 러닝에 3가지 학습 법 중 하나로 인공지능의 학습의 글에서는 Supervised Learning에 대해 이야기를 잠깐 하였는데 이는 입력과 원하는 답(Label)이 존재해야 한다.개와 고양이, 쿠키와 치와와를 구분을 하기 위해 데이터가 필요하다.하지만 그런 답을 만들기 어려운 상황이 있다.예로 차나 로봇이 움직인다고 할 때 팔다리의 위치를 상황에 따라 일일히 라벨하기에는 어렵다.(길사진에 차가 꺽을 핸들 각도를 라벨링 한 적은 있음) 위와 같은 상황에서 쓸 수 있는 방법으로 상호작용이 가능한 환경에서 상태(input or state)를 얻고 행동(Action)을 정하는 정책(Policy)을 보상(reward)을 최대화하..

知/job지식 2024.05.21

Drop Out(드롭 아웃 및 초간단 구현)

목차 열기" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스왜 무엇을 버리나?Drop Out은 말 그대로 버리는 것이다. MLP로 예를 들면 퍼셉트론의 연결을 훈련중에 일정 확률로 일부분을 랜덤하게 연결을 끊어 학습을 더디게 만드는 것이다. 왜 더디게 만드는 지 이야기 전 논문 저자의 직관부터 이야기 하면 2014년도 Bishop은 이를 유성생식에 비유했다. 부모의 한쪽 유전자씩 받는 그 과정에서 유전의 혼합 능력을 떠올린 것이다. (그래서 50프로 확률로 연결을 끊어 절반만 살린다) 하지만 더 나은 직관으로 앙상블 효과로 보는 경우도 있다. 앙상블이란 간단하게 똑똑한 애 하나의 점수보다 덜 똑똑한 애 10명이 투표해 낸 결과의 점수가 높다는 것이다. 기존 앙상블은 여러 다른 ..

知/job지식 2024.05.18

Weight initialization

목차 열기" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스처음이 중요새로운 인공지능을 구성하고 학습 시 맨 처음 파라미터(가중치와 편향)는 어떻게 설정해야 할까?가중치의 최종값이 음수일지 양수일지 모르는 상황이라 모든 가중치는 0으로 설정하면 모두가 잘 찾아갈 수 있을 것 같다.하지만 모든 가중치가 같은 값을 가지면 위 링크의 w1이 x1에 영향을 받고 w2는 x2에 영향을 받는 것 같이 w에 관련 없이 입력에 따라 가중치가 업데이트를 가지는 경우도 있지만, 층이 깊어질 때 w에 영향을 받는다면 아예 학습이 안되거나 모두가 같은 값으로 업데이트가 될 수 있다. 0에 가깝게모두가 0이되면 학습이 안되니 매우 가깝게 랜덤으로 만들면 되지 않을까? 해서 정규분포의 모양 또는 평균이..

知/job지식 2024.05.15

Resnet 직관

개요이번 글에서는 Resnet이라 불리고 CNN의 도약으로 깊은 신경망을 구성할 수 있도록 된 Resnet에 대해 알아보자.먼저 이름이 어떻게 유래했는지 보자.ResNet의 논문명은 Deep Residual Learning for image Recognition 이다.Residual의 Res와 Network의 합성으로 ResNet이 나오게 되었다.Vanishing gradient(기울기 소실)깊은 신경망을 구성할 수 있게 되었다면 왜 그 이전에는 신경망을 깊게 쌓지 못했는지 파악하자.먼저 훈련을 진행하기 위해서는 변수의 영향력(미분값)을 측정해야한다. 역전파의 과정으로 Chain Rule에 따라 입력값에 가까워 질 수록 곱해지는 값이 많아진다. Activation Function이 Sigmoid라 생각해..

知/job지식 2024.05.05

대답해드리는게 인지상정

知/job지식 25

티스토리툴바