본문 바로가기

전체 글

(8)
모두를위한 강화학습(Sung Kim): 4강 6강 정리 4강 Dummy Q-Learning Frozen Lake: Even if you know the way, ask.(아는 길도, 물어가라). Agent가 어떤 갈림길에 섰을 때 어떻게 판단해야하는가는 Q함수에 달려있다. Q함수란 state와 action을 입력으로 받으면, 어떤 reward를 출력으로 주는 함수이다. 따라서 state-action value 함수라고도 부른다. 따라서 학습이란 것은 이러한 q함수를 찾는 것이라고 할 수 있다. 이러한 q 함수를 어떻게 이용하는가를 결정하는 과정을 policy라고 하며 강의에선 policy를 greedy방식(max argument를 선택)을 선택했다. Q중에 가장 높은 값을 Max Q라하고, 이 Q를 출력하는 action을 선택하는 것을 optimal poli..
[MATLAB] 메틀랩으로 2차 방정식 풀기 메틀랩을 이용하면 빠르게 이차방정식의 해를 구할 수 있다. 주요함수 및 키워드 syms: 메틀랩의 symbolic 변수를 선언할 때 사용한다. solve(조건, 방정식의 변수): 조건을 만족시키는 일반해를 구한다. subs(일반해, 계수, 상수): 특수해를 구한다. simplify(solution): 기약 분수로 만든다. vpa(Variable Precision Arithmetic): 분수를 실수로 표현한다. 2차 방정식 해법 심볼릭 변수를 만든다. (a,b,c,x) 방정식을 세운다. (이차식) 조건과 구하고자 하는 변수를 명시하여 일반해를 구한다.(아래의 경우 근의 공식) 특수해를 구한다.(a, b, c 가 각각 3, 2, -6일 때) Real Number로 바꾸어 출력한다. (vpa 함수 이용) sy..
[ML-agents] 란 무엇 인가? https://github.com/Unity-Technologies/ml-agents Unity-Technologies/ml-agents Unity Machine Learning Agents Toolkit. Contribute to Unity-Technologies/ml-agents development by creating an account on GitHub. github.com Ml-agents의 공식 홈페이지다. ML-agnets는 유니티에서 지능형 에이젼트를 학습하고 개발할 수 있는 환경을 제공하는 시뮬레이션 플러그인이다. 현재 2019년 5월 2일 기준으로 베타 버젼을 발표한 상태다. ML-agents는 총 크게 4가지 방식으로 에이젼트를 학습시킬 수 있는 환경을 제공한다. Reinforcem..
[HCI] 는 무엇이며 왜 중요한가? HCI란 무엇인가? HCI(Human Computer Interaction)은 말 그대로 인간과 컴퓨터 사이의 상호작용을 연구하는 학문이며, 최종 목표는 사용자에게 최적의 경험을 제공하는 것이다. HCI 1.0 때는 한명의 사용자와 한 대의 컴퓨터 시스템 간의 상호작용을 연구하는 것이었다면 HCI 2.0 부터는 그 연구 범위가 모든 시스템과 모든 사용자 간의 상호작용으로 넓어지게 되었다. 연구범위를 자세하게 살펴보자. HIC는 왜 중요한가? 디지털기술은 일반인의 도구로 변환되고 있다. 따라서 부가가치를 올릴 수 있는 HCI는 산업적인 측면에서의 중요한 위치를 차지한다. (돈이 된다) 실수가 용납되지 않는 분야의 경우 HCI의 설계가 큰 재앙을 초래할 수도 있다. (이지스 군함의 민간기 격추 사건) HCI..
[HCI] 사람은 어떻게 기억하고, 생각하는가? 어떻게 기억하는가? 외부 자극이 들어왔을 때, 이를 부호화 하여 단기기억에 저장하고 또 이를 정교화 하여 장기기억에 저장한다. 감각 기억(Sensory Memory)란 무엇인가? 시각, 청각, 촉각등 감각기관을 통해 외부 정보를 저장하고 전달하는 역할을 하는 과정을 말하는데, 기억은 평균 2초 정도 지속되기 때문에 주의를 기울이지 않으면 바로 소멸된다. 그리고 용량이 매우 적다. 단기 기억, 작업기억(Short-term Memory, Working Memory)란 무엇인가? 감각 기억의 정보 중 주의(Attention)를 기울인 정보들만 한정된 양으로 저장한 것이다. 정보를 부호화하여 장기기억에 저장하고 또는 정보를 처리하여 인출하는 역할을 담당한다. 한번에 저장되는 정보가 감각기억에 비해서는 많지만 빠..
[HCI] 상호작용이란 무엇인가? 상호작용에 대한 여러가지 정의 사회학적 관점에서 상호작용이란 사건의 가장 기본단위로, 둘 이상의 사람들이 서로의 행동에 영향을 주는 양방향적 관계를 말한다. 커뮤니케이션학 관점에서는 사람과 미디어 컨텐츠간에 일어나는 반응이다. HCI의 관점에서는 디지털 시스템과 사람간에 발생하는 일련의 작용, 반작용의 절차로 정의한다. 상호작용의 절차는 어떻게 이루어지는가? 표명단계: 사용자의 명확하지 않는 목표가 구체화되는 단계이다. 이슈: 특정 시스템을 사용해 달성하고자 하는 목표가 시스템에서 제공하는 기능이나 정보와 얼마나 일치하는가? 변환단계: 입력장치가 받은 정보를 시스템의 처리장치로 변환하는 과정 이슈: 사용자의 입력장치가 시스템의 기능을 얼마나 충실하게 표현할 수 있는가? 표현단계: 시스템의 반응을 출력도구..
좋은 프로그래밍 언어란? (Goodness of a programming language) 좋은 프로그래밍 언어란?(Goodness of a programming language) 본 포스팅의 내용은 Concepts of Programming Language 11th (Pearson) 책의 내용을 참고하여 작성되었습니다. 개발을 하다보면, 주변에서 어떤 프로그래밍 언어가 좋다더라, 디버깅이 쉽더라 등등 많은 이야기를 들을 수 있는데요. 그럼 프로그래머들이 가장 많이 사용하는 언어는 무엇일까요? 그렇다면 그 언어는 좋은언어일까요? 그렇다면 성능이 아주 뛰어난 컴파일러가 있다면, 과연 그 언어가 가장 좋은 언어라고 할 수 있을 까요? Python처럼 쉬운언어? C처럼 정직한 언어? Java처럼 개발자를 편하게 해주는 언어? 이번 포스팅에서는 컴파일러를 제작하기에 앞서서, 좋은 프로그래밍 언어라는 ..
데이터 베이스, 함수적 종속성, 정규화 1NF, 2NF, 3NF, BCNF 14장 데이터 베이스 함수적 종속성, 정규화 (Dependencies and Normalization) 본 포스팅의 내용은 Fundamentals of Database System (Pearson) 책의 내용을 참고하여 작성되었습니다. 이번 시간에는 데이터 베이스 정규화에 대해서 살펴보도록 하겠습니다.위키피디아에 따르면, 데이터 베이스 정규화란 다음과 같습니다.관계형 데이터베이스의 설계에서 중복을 최소화하게 데이터를 구조화하는 프로세스를 정규화라고 한다. 데이터베이스 정규화의 목표는 이상이 있는 관계를 재구성하여 작고 잘 조직된 관계를 생성하는 것에 있다. 일반적으로 정규화란 크고, 제대로 조직되지 않은 테이블들과 관계들을 작고 잘 조직된 테이블과 관계들로 나누는 것을 포함한다. 정규화의 목적은 하나의 ..