본문 바로가기

인공지능/연구일지

2020-11-09(월) 연구일지

Ongoing projects

 

  1. 강화 학습을 이용한 주식투자

더보기

 

  • "주식 데이터 획득 방법 조사하기"
  • "증권사 API 설치, 환경 설정, 자동 로그인"

  2. 개인 홈페이지

더보기

 

  • "관련 템플릿 조사하기"

  3. 게시판(스터디)

더보기

 

  • "톰캣 연결"
  • "jdbc 설정 및 DB 연결"
  • "mybatis 이용 및 로그인 구현과 그 후 화면 전환"
  • "jquery, ajax 이용 및 DB에서 게시글 목록 불러오기"

 

 

To Do List

 

  1. 연구실 세미나 - 발표 자료들 미리 읽어보기 (Dive into Deep Learning 3장, 4장)

  2. 연구실 세미나 - 발표할 (Dive into Deep Learning 5장) 공부하기 (1/3)


1. 연구실 세미나 - 발표 자료들 미리 읽어보기 (Dive into Deep Learning 3장, 4장)

 

이번 주에 있을 연구실 세미나를 위해 다른 사람들이 발표할 "Dive into Deep Learning"의 3장과 4장을 미리 읽었다.

3장은 Linear Regression에 관한 내용이었고, 4장은 Multilayer perceptron에 관한 내용이었다.

 

Linear Regression은 예측 함수가 입력 feature들의 선형 조합으로 표현된다.

선형 모델은 데이터를 학습하여 예측 함수 y = wx + b에 대한 w와 b를 예측하게 된다.

그 후 예측한 w와 b에 대한 Loss 함수를 구하고 최적화 알고리즘을 이용해 최적의 w와 b를 학습해간다.

 

Multilayer perceptron의 경우

다양한 층 형성을 통해 특성들의 상관관계를 찾아내고 입력 featrue들에 대해 유연하게 적용될 수 있다는 장점이 있다.

예측과 분류를 원하는 형태로 활성화 함수를 이용해 표현하지만,

층이 깊어질 수록 기울기 소실과 폭발이 발생해 학습이 제대로 되지 않는 단점이 있다.

또한 학습에 따라 학습 데이터셋에 대해 overfitting 되어 일반화가 제대로 되지 않는 경우가 존재하며,

overfitting을 해결하기 위해 dropout, weight decay 등 다양한 페널티를 적용함으로써 해당 문제를 해결하게 된다.

 

다음 주가 학교 기말고사 치는 주이기 때문에 정말 가볍게만 읽어보았다.

다음부터는 미리 읽어보고 정리도 함께 하여 세미나에 좀 더 집중하도록 해야겠다. 


2. 연구실 세미나 - 발표할 (Dive into Deep Learning 5장) 공부하기 (1/3)

 

오늘은 Dive into Deep Learning 5장의 앞부분만 공부를 하였다.

앞부분에서는 MLP의 layer 구성 방식과 block의 개념과 Pytorch를 이용한 네트워크 구성 방법을 배웠다. 

학교 수업과 병행하다보니 진도가 느린 것 같지만 꾸준히 진행하여 발표 전까지 완벽하게 공부를 해 볼 예정이다.

 

5.1 Layers and Blocks

딥러닝이 우수한 중요 요소 중에 하나는 우수한 소프트웨어이다. 크기가 작은 MLP의 경우 모든 layer를 설계하여 직접적으로 구성할 수 있다. 하지만 컴퓨터 비전 문제를 풀기 위해 제안된 ResNet-152

jungnamgyu.tistory.com

'인공지능 > 연구일지' 카테고리의 다른 글

2020-11-11(수) 연구일지  (0) 2020.11.11
2020-11-10(화) 연구일지  (0) 2020.11.10
2020-11-06(금) 연구일지  (0) 2020.11.06
2020-11-05(목) 연구일지  (0) 2020.11.05
2020-11-04(수) 연구일지  (0) 2020.11.04