4기(20200711)/데이콘 5

산업제어시스템 보안위협 탐지 AI 경진대회 HAI 2.0 baseline model

작성자: 김종헌 79개의 column이 존재 HAI 1.0에서 주어진 data sheet를 보면 압력, 온도 등의 값이었음 -> 단위나 범위가 너무 다양하므로 정규화를 진행한다. 그 방법은 최댓값을 1, 최솟값을 0이 되도록 (data-최솟값)/(최댓값-최솟값)을 이용 단, 값이 일정할 경우 전체를 다 0으로 처리한다. 정규화 이후에 exponential weighted function을 통과시킨다. 그 이유는 센서에서 발생하는 noise를 smoothing 시켜주기 위함이다. 사전 공개된 HAI 1.0에는 data sheet를 통해 각 데이터들 간의 관계나 단위 등을 알 수 있었다. 하지만 본대회용 HAI 2.0에서의 column에 대한 label이 따로 존재하지 않아서 unsupervised lear..

Attention 기법

딥러닝 초창기에 machine translation 에 관한 Method는 sequence 방식이였습니다. 데이터를 토큰으로 나눠서 sequence하게 input을 준다음에 output을 sequence하게 뽑아내는 방식이였습니다. 위의 사진은 프랑스어를 영어로 번역하는 예시를 나타낸 것입니다. 초록색: 원문 보라색: 번역 이 번역방식은 데이터 사이언티스트들이 무에서 유를 창조하듯이 뚝딱 만들어 낸 것이 아닙니다. 인간의 번역방식에도 위와 같은 유사한 방식이 있습니다. 봉준호 감독님의 영상입니다. 봉준호 감독님이 말씀하신 내용을 번역가 분께서 '순차번역' 하셧습니다. '순차번역' : 원문을 끝까지 들은 다음에 번역을 하는 과정을 의미합니다. 위에 있는 인코더-디코더 아키텍처에서 볼 수 있는 것은 짧은 문..

3주차 - 모델 정하기(RNN, LSTM)

작성자 : 윤나라 - 데이터 분석한 내용을 바탕으로 어떤 기법을 적용했을때 정함 - 프로세스에 흐름이 있고, time step이 있으므로 RNN, LSTM 등 타임 시리즈를 쓰는것이 좋겠다고 정함. - 이번주 신입기수 강의에 RNN이 있으므로 LSTM 위주로 스터디 RNN의 한계 보통의 인공 신경망과 마찬가지로 Vanishing과 Exploding 문제가 존재한다. 손실값을 구하고, 역전파를 이용해 가중치를 업데이트 하려고 할 때 Chain Rule이 이용됩니다. 위와 같은 식이 나오는데, 만약 데이터의 길이나 시퀀스가 길다면 곱해지는 그래디언트들의 값은 많아질것입니다. 각 값들이 1보다 작다면 0으로 수렴하여 Vanishing이 발생하고, 1보다 크다면 무한대로 발산하는 Exploding 문제가 생길것..

산업제어시스템 보안위협 탐지 AI 경진대회

작성자: 김종헌 국토교통 빅데이터 온라인 해커톤 경진대회는 평가 기준의 모호성, 데이터 크기의 방대함 등으로 인하여 불참 결정 1. 주제 산업제어시스템 보안위협 탐지대회 2. 배경 최근 국가기반시설 및 산업시설의 제어시스템에 대한 사이버 보안위협이 지속적으로 증가 3. 주최/주관/후원 주최 : 국가정보원 주관 : 국가보안기술연구소 후원 : 한국정보보호학회 증기 터빈 발전기, 펌프 저장 수력 발전기의 2개의 발전기 모델을 이용하는 시뮬레이션 제어 시스템이 공격 받는 것을 탐지하는 대회 P1인 보일러 프로세스에서 압력, 수면 높이, 유속, 온도 등을 제어 P2인 터빈 프로세스에서 터빈 회전 속도 제어 P3인 수처리 프로세스에서 수면 높이 제어 구체적인 내부 제어 시스템은 다음의 예시와 같다. 다음의 예시는 ..

국토교통 빅데이터 온라인 해커톤 경진대회

작성자 : 최웅준 지금 현실적으로 참여할 수 있는 대회가 2개 있습니다. 저희 조는 투표를 통해서 국토교통 빅데이터 온라인 해커톤 경진대회에 참가하기로 했습니다. 1. 주제 및 배경 - 국토교통 데이터와 코로나 데이터 등을 융합분석하여, 국민의 안전한 이동을 위한 새로운 통찰과 창의적 아이디어 도출 - 국토교통 데이터 활용 저변을 넓히고 국민적 관심도 제고 - 교통빅데이터 플랫폼을 통한 데이터 이용 활성화 2. 주최/주관/운영 - 주최 : 국토교통부 - 주관 : 한국도로공사, 한국철도공사, 한국교통안전공단, 한국교통연구원 - 데이터 협조 : KT - 운영 : DACON 3. 참가대상 - 데이터 활용 능력과 기획력으로 새로운 문제를 해결하려는 열정을 가진 대한민국 국민이면 누구나 (외국인 참가자는 심사 대..