34

Drop Out(드롭 아웃 및 초간단 구현)

목차 열기" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스왜 무엇을 버리나?Drop Out은 말 그대로 버리는 것이다. MLP로 예를 들면 퍼셉트론의 연결을 훈련중에 일정 확률로 일부분을 랜덤하게 연결을 끊어 학습을 더디게 만드는 것이다.  왜 더디게 만드는 지 이야기 전 논문 저자의 직관부터 이야기 하면 2014년도 Bishop은 이를 유성생식에 비유했다. 부모의 한쪽 유전자씩 받는 그 과정에서 유전의 혼합 능력을 떠올린 것이다. (그래서 50프로 확률로 연결을 끊어 절반만 살린다) 하지만 더 나은 직관으로 앙상블 효과로 보는 경우도 있다. 앙상블이란 간단하게 똑똑한 애 하나의 점수보다 덜 똑똑한 애 10명이 투표해 낸 결과의 점수가 높다는 것이다. 기존 앙상블은 여러 다른 ..

知/job지식 2024.05.18

Weight initialization

목차 열기" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스처음이 중요새로운 인공지능을 구성하고 학습 시 맨 처음 파라미터(가중치와 편향)는 어떻게 설정해야 할까?가중치의 최종값이 음수일지 양수일지 모르는 상황이라 모든 가중치는 0으로 설정하면 모두가 잘 찾아갈 수 있을 것 같다.하지만 모든 가중치가 같은 값을 가지면 위 링크의 w1이 x1에 영향을 받고 w2는 x2에 영향을 받는 것 같이 w에 관련 없이 입력에 따라 가중치가 업데이트를 가지는 경우도 있지만, 층이 깊어질 때 w에 영향을 받는다면 아예 학습이 안되거나 모두가 같은 값으로 업데이트가 될 수 있다.  0에 가깝게모두가 0이되면 학습이 안되니 매우 가깝게 랜덤으로 만들면 되지 않을까? 해서 정규분포의 모양 또는 평균이..

知/job지식 2024.05.15

베이킹에서 오일과 버터의 차이점

안녕하세영, 로사입니다.홈베이킹을 좀 더 잘하고 싶은 마음으로 쓰게 된 글,베이킹하다 생기는 궁금증을 풀어보고자오늘도 한 가지의 의문점을 갖고 왔습니다.그럼 오늘도 스따뚜@ 베이킹을 할 때오일을 넣을 때도 있고,버터를 넣을 때도 있는데각각 어떨 때 넣는 건가요?1)  버터와 식물성 오일이 베이킹에서 하는 역할가장 큰 역할은 바로 폭신폭신한 식감을 주는 것입니다.보통 녹인버터와 식물성 오일이 서로 대체가 가능한데,두 재료의 맛의 차이를 찾으라면,버터를 넣으면 오일에 비해 좀 더 풍미가 있다 보시면 됩니다.오일은 그냥 폭신함만 주는 용도인 거죠. 2)  식물성 오일을 넣으라고 하면 식용오일 다 해당되나요?보통 올리브오일을 제외하곤 다 가능합니다.올리브오일은 특유의 향이 너무 강해우리가 생각하는 빵의 향이 올..

知/잡지식 2024.05.14

이스트는 뭘까?

안녕하세영, 로사입니다.홈베이킹을 좀 더 잘하고 싶은 마음으로 쓰게 된 글,베이킹하다 생기는 궁금증을 풀어보고자오늘도 한 가지의 의문점을 갖고 왔습니다.그럼 오늘도 스따뚜@제빵을 하다 보면이스트가 항상 들어가던데이스트가 정확히 뭔가요??1)  이스트 사전정의알코올 발효가 일어날 때 다량의 이산화탄소를 발생시켜 빵을 부풀게 하는 작용을 한다.빵효모를 다량으로 만드는 데는 당밀액에 질소영양(암모니아나 요소)을 가하면서 접종하고,강렬하게 공기를 불어넣으면서 25 ℃에서 증식시킨다.[네이버 지식백과] 이스트 [yeast] (두산백과 두피디아, 두산백과) 제품화된 생이스트는 수분이 65~70%, 단백질이 40~45%그 외 탄수화물, 인지질, 무기질 등으로 구성되어 있고500g의 제품으로 판매되는 생이스트 안에는1..

知/잡지식 2024.05.06

Resnet 직관

개요이번 글에서는 Resnet이라 불리고 CNN의 도약으로 깊은 신경망을 구성할 수 있도록 된 Resnet에 대해 알아보자.먼저 이름이 어떻게 유래했는지 보자.ResNet의 논문명은 Deep Residual Learning for image Recognition 이다.Residual의 Res와 Network의 합성으로 ResNet이 나오게 되었다.Vanishing gradient(기울기 소실)깊은 신경망을 구성할 수 있게 되었다면 왜 그 이전에는 신경망을 깊게 쌓지 못했는지 파악하자.먼저 훈련을 진행하기 위해서는 변수의 영향력(미분값)을 측정해야한다. 역전파의 과정으로 Chain Rule에 따라 입력값에 가까워 질 수록 곱해지는 값이 많아진다. Activation Function이 Sigmoid라 생각해..

知/job지식 2024.05.05