[VOL.4] [김학수의 사람 人] "빅데이터 메타분석을 통해 손흥민, 김연아, 류현진 등 스타플레이어들에 대해 다양하고 새로운 정보를 얻을 수 있다" 국내 최대 빅데이터 분석업체 데이터앤리서치 임경오 센터장
김학수 기자
|
2022-09-07 10:43
김학수 기자 홍수가 날 때 넘쳐 나는 흙탕물 속에선 정작 식수를 구하는 게 어렵다. 물밀 듯이 몰려드는 수 많은 정보 속에서 필요한 정보를 찾는 것은 ‘홍수 속에서 식수’를 찾는 일과 비슷하다. 그렇기에 빅 데이터를 받아 들 때는 마치 금속 탐지기로 모래 속에서 보물을 찾은 느낌이다. 빅 데이터는 어렵게 찾을수록 가치가 높아지며 쉽게 찾을수록 가치가 낮은 이유이기도 하다.
다들 빅 데이터(Big Data)를 가지려고 애쓴다. 빅 데이터에서 중요한 건 ‘빅’도 아니고, ‘데이터’도 아니다. 빅 데이터는 눈에 쉽게 보이거나 잡히는 대상물이 아니다. 끊임없이 지식과 정보에 대한 관심을 갖고, 모으고, 분석해야 만날 수 있다. 빅 데이터의 진정한 효용은 매일 빠른 속도로 유입되는 엄청난 양의 다양한 데이터 속에서 필요한 것만을 추출해 가치를 만드는 것이다.
요즘 빅 데이터는 정치, 경제, 사회, 문화, 스포츠 등 각 분야에 다양하게 적용돼 새로운 사업 영역을 창출하는 미래의 신사업으로 각광받고 있다. 이미 주요 기업들은 빅 데이터로 고객들의 니즈를 파악해 새로운 상품을 만드는데 활용하기도 하며, 기업 운영 전략에도 긴요하게 쓰이고 있다. 그래서 미국 서부 개척기 당시 금맥 노다지를 찾으려는 대량의 사람들이 몰려드는 것과 같이 빅 데이터를 마치 황금 덩어리 마냥 캐기 위한 일단의 사람들이 모여드는 것이다.이런 빅데이터를 갖고 사업을 하는 이들이 점차 많아지고 있다.
임경오 데이터앤리서치 센터장(61)도 그런 이들 가운데 하나이다. 빅 데이터를 활용해 각종 핫한 이슈를 만들어내고 여론조사를 실시해 언론사에 기사를 공급하는 빅 데이터 전문가이다. 그는 원래 언론사에서 오랫동안 경제신문에서 경제부 관련 기자 일을 했다. 기자 경험을 바탕으로 빅 데이터 사업에 전문적으로 뛰어든 것은 3년 정도됐다.
간단한 전화여론조사부터 시작해 키워드 검색어를 통해 복잡한 정보 속에서 의미있고 유효한 데이터를 추출하는 등 다양한 빅 데이터를 만들어낸다.
매일 2건 정도의 빅 데이터 뉴스를 생산한다. 그날 그날 이슈가 되는 키워드를 빅 데이터 프로그램에 입력해 나온 결과물을 기사로 작성, 신문과 방송·통신·인터넷 매체 등 각종 언론사에 배포한다. 기사를 만드는 과정은 키워드 검색어를 각종 국가, 공공기관, 기업체 홈페이지 등 정보망, 뉴스 블로그, 카페, 커뮤니티, 4대 SNS(트위터, 인스타그램, 페이스북, 유튜브), 네이버 및 다음 지식인 등과 연관된 23만여개 빅 데이터 프로그램을 통해 분석한다. 데이터앤리서치는 국내 최대의 빅데이터 분석 프로그램을 갖추고 있는 것으로 평가받는다. 임 센터장과의 인터뷰를 통해 빅데이터 운영 상황 등을 알아봤다.
◇ 빅데이터에서 새로운 세상이 보인다
빅데이터 메타분석은 중요하고 의미있는 정보를 만들어 낸다. 데이터앤리서치는 최근 식품 관련 기사를 통계로 내놓아 언론사에 배포했다. 스타벅스의 이용율 분석을 통해 작년 2분기 77만건의 언급량이 올해는 같은 기간 70만건으로 7만건이 줄었다는 사실이 밝혀졌다. 이를 통해 전 세계적인 원자재 폭등으로 인해 국내서는 가격이 비싼 스타벅스 대신 메가커피나 백다방이 새롭게 뜨는 것을 확인할 수 있었다. 러시아의 우크라이나 침공의 영향으로 전반적으로 세계적인 고물가가 심화되고 있는데 스타벅스 이용율 분석을 통해 커피전문시장의 변화를 확인할 수 있었던 것이다.
-스타벅스 이용율 분석은 구체적으로 무엇을 얘기해주나.
“스타벅스는 그동안 국내외에서 고속 성장을 이루며 세계 최대 커피 체인점으로 자리를 잡았다. 하지만 지난 1년간 각종 블로그나 SNS에서 노출빈도를 통해 관심이 점차 식어져 가고 있음을 알 수 있었다. 빅데이터 메타분석은 빈도나 경향성을 분석하는데 매우 효과적이다. 대중들은 스타벅스 커피값이 비싸다는 점을 느끼며 값이 상대적으로 싼 브랜드 커피로 이동하고 있다는 것을 유추할 수 있었다. 상당히 의미있는 변화라고 본다.”
-이재용 삼성전자 부회장에 대한 사면 또는 가석방에 대한 여론조사도 실시했다고 하는데.
“이재용 삼성전자 부회장에 대한 사면 또는 가석방에 대한 빅데이터 여론조사를 실시해 보니 국민 63%가 찬성하고 있는 것으로 나타나 이를 기사화해 여러 언론기관 등에 배포했다. 이재용 부회장은 여론조사 결과기사가 나간 뒤 올 여름 정부로부터 공식 사면 결정을 받았다.”
-빵집 브랜드 조사에선 어떤 분석 결과가 나왔나.
“빵집 브랜드 조사 결과는 최근 여론이 바뀌는 트렌드를 확인할 수 있었다. 국내 최고의 빵집 브랜드 ‘파리바게트’에 대한 관심이 전반적으로 줄고 ‘성심당’, ‘이성당’, ‘태극당’ 과 같은 지방빵 브랜드가 점차 관심을 모으고 있다는 것이다. 이는 고급빵에 대한 수요가 전반적으로 늘어나고 있는 것으로 풀이했다. 물론 ‘파리바게트’ 제품 중에서도 파리크라상과 같은 것은 여전히 대중들에게 인기가 높았다. ”
◇ 빅데이터 메타분석, 전문성과 정보력이 필요하다
빅데이터를 통해 추출된 정보를 분석해 기사를 만들어내는 것은 아무나 할 수 있는 건 아니다. 정보를 분석할 수 있는 전문가적인 능력을 바탕으로 이를 정리해 기사로 엮어내야 하기 때문이다. 임 센터장이 빅데이터 전문가로 자리를 잡을 수 있었던 것은 경제지 기자로서 오랜 경험이 적지않은 도움이 됐다.
헤럴드 경제 신문에서 1989년부터 2003년까지 정보 과학부, 산업부, 부동산부, 증권부 등에서 전문 기자로 활동한 그는 각종 기업 정보를 분석해 밀도높고 전문성 있는 경제 기사를 많이 다루었던 경험을 갖고 있다. 이 같은 경제 전문지 기자 경험을 토대로 주로 경제 분야를 전문적으로 기업 정보 등과 연관된 데이터를 생산해 배포하고 있는 것이다.
-어떻게 빅데이터 전문가가 됐나.
“정보화 시대가 가속화하며 컴퓨터 코딩 작업에 관심을 갖고 수년전 학원에 등록, 기본적인 교육을 받은 뒤 본격적으로 빅데이터 분야에 뛰어들었다. 오랜 경제기자 경험을 갖고있었던 만큼 정보와 빅 데이터를 연결하는 일은 쉽게 접목이 가능했다. ”
-주제나 이슈 검색어 선정을 할 때 어떻게 하나.
“새로운 빅 데이터 자료를 얻기 위해선 검색어 선정이 가장 중요하다. 프로그램 오류나 시스템의 오작동의 원인이 될 수 있는 의미없는 정보인 ‘가비지(Garbage)’를 배제하고 원하는 정보를 추출할 수 있는 검색어를 입력해야 한다는 것이다. 많은 정보 분석을 하다보면 중복 단어들이 겹치며 잘못된 정보를 산출할 수 있기 때문이다.”
-구체적인 예를 들어달라.
“아파트 브랜드 ‘LG 자이’같은 경우 ‘자이언츠’ 등과 같은 ‘자이’라는 말이 겹치는 가비지를 제외하고 상황에 맞는 키워드를 설정, 빅데이터 프로그램에 입력시켜야 올바르고 의미있는 정보를 유출해낼 수 있다. 힐스테이트, 프루지오 같은 아파트 브랜드와 쿠팡과 같은 배송회사 브랜드는 중복되는 단어가 없어 검색하기가 상대적으로 쉽다. ”
◇ 빅데이터를 통해 경제, 사회, 문화, 스포츠 등에 걸쳐 다양한 정보사업 창출
현재 데이터앤리서치는 중앙선관위원회에 등록된 정식 여론조사기관이다. 공공기관이나 각 기업 등의 의뢰를 받아 각종 여론조사를 실시하고 빅데이터 분석을 통해 뜨거운 이슈 등을 다루고 있다. 정치 이슈도 취급하지 있지만 지나친 편향성으로 인해 객관적인 조사가 어려울 게 가장 큰 애로라고 한다. 중립적인 호감도가 수치화로 잘 드러나지 않기 때문이라는 것이다.
이에 반해 경제, 사회적인 이슈는 조사 대상이 비교적 명확하고 특정 성향이 비교적 잘 보이기 때문에 객관성이 높아 효율성 높은 결과 추출이 가능하다고 한다.
-앞으로의 사업 계획은.
“문화, 스포츠 등으로 빅데이터 분야를 확대해 나갈 계획이다. 대중들의 관심을 끌 스포츠 분야에서 인터넷 스포츠 전문 미디어 마니아타임즈와 손을 잡고 다양한 스포츠 이슈들을 다룰 계획이다. 예를들면 손흥민, 김연아, 류현진 등 현재 최고의 스타플레이어들과 관련한 여론 조사와 트렌드 등을 주기적으로 발표하겠다. 재미있는 스토리가 많이 나올 것으로 기대한다. 또 프로스포츠팀이나 기업들과 제휴해 스포츠마케팅에 필요한 여러 정보 등을 제공해 주고 싶다. ”
-빅데이터 자료가 딥러닝이나 인공지능으로 활용될 수 있는데.
“결과적으로 빅데이터는 앞으로 딥러닝이나 인공지능에서 핵심적인 운영 자산이 될 것이다. 많은 자료를 축적해 나가 경제, 문화, 스포츠에서 경쟁력 있는 컨텐츠 생태계를 만들 생각이다. ”