POSTECHIAN 기사 보기

[2022 봄호] 4-컴퓨터공학과가 본 '황사 X 미세먼지'

  • 김나림
  • 2022-06-24 07:03:25

2022 SPRING 공대생이 보는 세상 4

컴퓨터공학과가 본 '황사 X 미세먼지'
Dept. of Computer Science and Engineering



아~ 진짜 이놈의 황사는 올 때마다 너무 힘든 것 같아…. 어? 저기 전광판을 보니까 미세먼지 농도가 $458 \mu g/{m^3}$으로 초미세먼지 주의보가 내려졌구나! 맞다, 너희들 그거 알아? 미세먼지 농도를 알아낼 때는 광산란법으로 농도를 측정한 뒤에, 다중 선형 회귀 모델을 사용해서 기계학습으로 보정해 준다고 해! 좀 더 자세히 알아볼까? 광산란법은 먼지의 개수와 크기를 측정하기 위해, 먼지의 부피를 측정해 무게를 추정하는 방법이야. 이 방법이 미세먼지를 측정할 때는 문제가 되지 않는데, 황사는 밀도가 굉장히 높고 초미세먼지 비율도 높아서 광산란법에서 많은 오류가 발생한다고 해. 이 오류를 바로 기계학습 방법 중 하나인 ‘선형 회귀 모델’을 이용해 해결할 수 있는 거지. 선형 회귀 모델은 이름에서도 알 수 있듯이 선형 방정식을 사용하는 방식이야. 임의의 선형 방정식을 예시로 들어 설명해 볼게.
$$ h = {a_0}{x_0} + {a_1}{x_1} + {a_2}{x_2} + {a_3}{x_3} + b $$
여기서 $h$는 우리가 구하고자 하는 종속변수인데, 광산란법에서는 우리가 구하고 싶은 보정된 초미세먼지 농도에 해당해. $x_n$꼴은 독립변수로, 광산란법에서 측정된 크기에 따른 여러 먼지의 농도가 되는 거야. 그리고 $a_n$꼴과 $b$는 독립변수에 곱해지는 상수에 해당하고, 바로 이 상수를 기계학습을 통해 알아내어 식에 적용하는 거지. 그렇다면 상수를 구하기 위한 기계학습은 어떻게 일어날까? 기계학습을 위해서는 위에서 언급한 독립변수, 즉 실시간으로 계속하여 바뀌는 먼지의 농도가 필요해. 그리고 이 독립변수를 올바르게 보정하기 위해 제대로 측정된 값인 참조데이터가 필요하지. 여기서 일어나는 기계학습은 쉽게 말해 위의 선형 방정식으로 계산한 값이 참조데이터와 근사하게 나오도록 상수를 계속하여 조정하는 과정이라고 이해하면 돼! 데이터는 황사가 있을 때와 황사가 없을 때 두 경우 모두를 데이터로 가지고 있는데, 황사가 아닌 경우에는 이 선형 회귀 모델을 실행시키면 안 되기 때문에 따로 필터링이라는 과정을 거쳐.
이렇게 보니 기계학습이라는 방법은 정말 많은 곳에서 다양하게 쓰이고 있는 것 같아. 놀라운 점은 이런 기계학습은 우리에게 친근한 파이썬과 같은 프로그래밍 언어를 사용하여 진행한다고 해.
나도 일상생활에 있는 여러 문제를 기계학습으로 해결해 봐야겠다!
지금까지 컴퓨터공학과가 본 '황사 X 미세먼지'였어. 다른 학과는 어땠는지 기억나니?
[PREVIOUS] 1- 신소재공학과가 본 '황사 X 미세먼지'

ALIMI 27기 무은재학부 김나림

예비 포스테키안 친구들 많이 질문해 주세요!

기사 모아 보기
공유하기
목록