5기(210102~)

2021/03/27 세미나

KAU 2021. 3. 27. 15:49

휴리스틱한 해를 찾는다?
==>어떠한 
근사해? approximation
주변만 바꾼다고 했을 때 그 전이랑 얼마나 바뀌는지?
Improvement를 한다.

적용되는 좋은 방법들이 달라서 
전문가의 수작업이 필요하다.

휴리스틱이 뭐에요?
알고리즘=>정확한 답을 찾는다
시간 복잡도==>어떤 시간 내에 이 문제를 정확히 답을 낼 수 있다.
메타 휴리스틱,휴리스틱: 정확한 답을 못낸다.
휴리스틱: 국한된 문제
메타 휴리스틱:고차원적인 개념?<틀,, 프레임 워크>


SDS에서 AI를 이용해서 문제를 해결하려 한다.

Baseline이라는 기준치에.. 
정답은 아니다. 
평균길이를 2.5로 했을 때 3가지 시도 

이렇게 3가지를 사용하면 가운데 AI는 
최적의 옵티멈을 발견하기가 힘들다.

POMO라는 알고리즘을 개발해서 성능을 높였다.

산업현장에서 어떻게 적용되는가 
강화학습이 연구 단계에서 많은 분야에서 사용 x 
조합 최적화 문제는 많이 연구 안되서 
삼성 SDS에서 주로 연구하고 있다.

강화학습이 산업현장에 적용되는 예를 보면 
핸드폰을 제작할 때 단계마다 수행해주는 로봇이 3개 있다.

휴대폰의 기종을 나타내는데 현재 60시간 걸리는 공정을
강화학습을 이용해서 50시간 까지 줄일 수 있고 
컴퓨터 프로그래밍을 하는 작업에서 AI를 적용하면 
여러가지 프로그램을 처리할 때 
할당되는 용량의 최적값을 찾아서 
효율적인 용량을 찾아주는 역할을 합니다. 
운송 경로 최적화에서 100개의 지점에 할당량을 배송해야 한다.'

최적의 최소 시간으로 가는 경로를 찾아낼 수 있다.
제약 상황이 트럭에 실릴 수 있는 양이 제한된다.
실제 문제에서는 제약 사항이 훨씬 많지만 수치화하여 
적용해주는것이 좋다.

강화학습에서 기존 알고리즘을 최적화 시킨다고 했을 때
모든부분을 최적화하는것이 아니라
딜레이라기 보다, 문제가 있는 루프를 처리한다거나
부분적으로 적용하는것이 좋다.