책 한 권도 교육이다 –
아이스크림에듀의 출판 철학
‘봄바람 휘날리며~ 흩날리는 벚꽃잎이~’
장범준이 ‘벚꽃연금’을 수령하러 돌아왔다. 봄의 눈 같은 새하얀 벚꽃이 개화하기 시작했다. 이 계절이 되면 사람들은 어김없이 가성을 끌어올리며 벚꽃을 찾아 여기저기 놀러 다닌다. 그런데 올해는 그런 풍경을 보기 어려워졌다. 감염병 코로나19로 야외활동이 제한됐기 때문이다. 우리나라 최대 벚꽃 축제 중 하나인 진해 군항제는 물론 여의도 벚꽃 축제, 하동 쌍계사 벚꽃 축제 등도 줄지어 취소됐다.
1년 중 봄 한철에만 만날 수 있는 귀한 벚꽃을 흠뻑 즐길 수 없어 아쉬운 상황이지만, 꽃은 우리가 사회적 거리를 두든지 말든지 개의치 않고 활짝 피어나고 있다. 창문 너머에서나마, 혹은 모니터 너머로나마 이들을 보며 벚꽃과 관련된 흥미로운 수학 이야기에 주목해 보자.
벚꽃이 몰려오는 선, 벚꽃 전선
매년 개화 시기가 되면 ‘벚꽃 개화 지도’가 발표된다. 벚꽃이 피는 시기가 같은 지역을 선으로 이어 ‘벚꽃 전선’이라고 부르기도 한다. 올해 기상정보업체인 케이웨더가 발표한 주요 지역의 개화 시기는 서울 4월 2일, 대전 3월 28일, 부산 3월 22일이다. 평년에 비해 6~8일가량 빨라졌다. 만개 시기는 보통 개화일에서 일주일 정도 뒤로, 서울 4월 9일, 대전 4월 4일, 부산 3월 29일로 예측됐다.
출처: 케이웨더
그런데 3월 27일, 서울 벚꽃이 개화했다. 서울 표준 관측목인 종로구 송월동 서울기상관측소의 벚꽃이 핀 것이다. 1992년 서울 벚꽃 관측이 시작된 이래 가장 빠른 개화다. 기상청의 발표에 따르면 올해의 개화는 평년보다 14일 빠르고 작년보다 7일 빠르다. 과도하게 앞당겨진 개화 시기로 인해 예측은 엇나가게 됐다.
보통 사람들에게는 조금 일찍 찾아온 기쁨이거나 조금 늦게 찾아온 반가움 정도의 일이지만, 개화 시기 예측이 엇나가는 것은 생각보다 중요한 문제다. 잘못된 예측으로 꽃이 피지 않았는데 축제가 개막하거나 다 질 무렵 개막해서 관광객이나 지자체가 손해를 볼 수 있고, 무엇보다 예측에서 크게 엇나갔다는 것은 기후가 급격하게 변하고 있다는 뜻일 수도 있기 때문이다. 그렇다면 매해 개화 시기는 어떤 자료를 바탕으로, 어떤 계산을 통해 예측하는 걸까?
개화 시기 예측하는 수학 모형
가장 기본적인 방법은 통계를 활용하는 것이다. 벚꽃이 피는 시기는 2월과 3월의 기온 변화가 가장 큰 영향을 미친다. 따라서 2월 상순~중순의 지역별 관측 기온과 2월 하순~3월의 기온 전망을 토대로 날짜를 예측한다. 이때 작년의 기록만 활용하는 것이 아니라 과거 기온과 개화 시기에 대한 장기적인 기후 자료를 바탕으로 회귀식을 만든다.
통계학에서 회귀 분석은 지속적으로 관찰된 연속적인 변수들에 대해 두 변수 사이의 모형을 구한 뒤 적합도를 측정하는 분석 방법이다. 쉽게 말하면 어떤 자료 간의 관계를 수학적으로 설명하는 방법으로, ‘통계학의 꽃’이라고 불릴 만큼 많이 쓰인다. 시간에 따라 변화하는 데이터나 인과 관계가 있는 데이터가 있을 때 종속변수와 독립변수의 분포도를 통해 각각의 변수들이 어떻게 영향을 미치는지 함수식으로 구할 수 있다.
벚꽃도 2월 3월의 기온, 강수량, 일조시간, 개화 시기에 대한 장기 데이터를 바탕으로 어떤 변수가 개화 시기에 얼마나 영향을 미치는지에 대한 통계적인 관계식을 구할 수 있다. 이것이 벚꽃 개화 시기 예측 회귀식이 된다. 일반적으로 기상전문업체가 발표하는 날짜는 이러한 회귀식을 기반으로 한다.
회귀 분석의 정확도가 높아지려면 급격한 변화나 새로운 변수의 영향이 없어야 한다. 지금까지의 변화에 대한 추세가 그대로 유지된다고 할 때의 결과를 예측하는 것이기 때문이다. 그런데 최근 몇 년 동안 지구 가열에 의한 이상기온 현상이 심해지면서 기후 변화가 급격해졌다. 그에 따라 기상 예측은 물론 개화 시기 예측도 틀리는 경우가 많아졌다.
실제로 올봄에 쉽게 볼 수 있는 만개한 벚꽃 나무 아래 개나리는 1980년대에는 절대 볼 수 없던 풍경이었다. 개나리와 벚꽃의 개화 시기는 한 달 정도 차이가 있기 때문이다. 2014년 한국농림기상학호지에 발표된 논문에 따르면 최근 60년 동안 개나리의 벚꽃 개화 시기가 한 달에서 일주일로 좁혀졌다. 상황이 이렇다 보니 벚꽃 개화 시기 예측도 점점 더 어려워질 수밖에 없다. 단순 기온 변화만이 아닌 지구 가열에 의한 변화 양상도 중요한 변수가 됐기 때문이다.
예측 정확도를 높이기 위해 생물 자체의 특성을 반영한 ‘생물계절모형’도 쓰이고 전국 시민들을 통해 수집된 빅데이터도 쓰이고 심지어는 인공지능도 쓰이고 있다. 그러나 지구 자체의 커다란 변화를 예측할 수 없다면 내년 예측의 정확도를 높이는 것도 쉽지만은 않아 보인다.
매력적인 벚꽃 시 수학 문제
코로나19도 지구 가열도 마음을 심란하게 하는 이 봄, 마지막으로 잠시나마 적적한 마음을 떠나 집중해 볼 만한 벚꽃 수학 문제를 내며 마무리하자. 일본 에도 시대부터 전해지는 벚꽃 시 문제다. 답이 궁금하다면 미국수학협회 홈페이지에서 ‘Cherry Blossom Poetry’를 검색해 확인할 수 있다.
“어느 봄날, 한 아이가 벚나무 아래서 벚꽃잎을 줍고 있었습니다. 그 근처에 시인이 소리 내 자신의 시를 읽고 있었죠. 아이는 시인이 시를 읽는 동안 잎 하나당 한 단어씩 벚꽃잎을 셌습니다. 17개 글자로 이뤄진 시를 읽었을 때는 아이에게 3장의 벚꽃잎이 남았고, 28개 글자로 이뤄진 시를 읽은 뒤에는 5장이 남았으며, 31개 글자의 시를 읽었을 때는 8장이 남았습니다. 아이가 주운 벚꽃잎은 최소 몇 장이었을까요?”
박현선 기자 | tempus1218@donga.com
동아사이언스 <수학동아>에서 수학 기사를 쓴다. 사람들이 싫어하는 ‘수학’이란 학문을 어떻게 하면 즐겁게 전할 수 있을지 고민하며 나날을 보내고 있다.
추천 콘텐츠