데이터의 진심을 향한 여정
페블러스(Pebblous) 이주행 대표
Vol.254 August
반가운 얼굴을 만났다.
4년 전 ETRI 웹진에서 스타트업 창업자로 만난 페블러스 이주행 대표를.
모래알처럼 흩어져 쥐기 힘든 데이터를 조약돌처럼 손에 꼭 잡히는
유의미한 데이터로 고객들에게 제공하고 싶다는 그 마음은 여전했다.
안녕하세요. 데이터의 진심을 추구하는 페블러스 대표 이주행입니다. 페블러스는 데이터와 사람의 간격을 좁히는 일을 하고 있어요.
데이터는 디지털 기기에 흔적을 남기는 모든 것이라고 볼 수 있는데요. 이 데이터들은 그 자체로서 인사이트가 있지는 않아요. 하지만 AI 기술을 통해 데이터는 가치가 생기죠. 엄청나게 많은 데이터 속에서 AI 기술로 필요한 엑기스만 뽑아주거든요.
AI 산업이 급격하게 발전하면서 고품질 데이터에 대한 수요도 폭발적으로 증가했어요. AI는 데이터를 통해 학습하기 때문이죠. 페블러스는 AI가 학습하는 데이터의 질을 높여주는 일을 하고 있어요. 그리고 데이터가 세상을 균형감 있게 반영하고 있는지 점검해 주죠.
이를테면 흑인이라든지, 소수자라든지, 약한 사람들의 이야기는 데이터로 존재하지 않을 수도 있잖아요. 이렇게 누락된 데이터로 학습된 AI는 편향이 생기겠죠. 이런 문제들을 데이터 품질 문제라고 할 수 있는데요, 이 품질을 개선하는 기술을 개발해 ‘데이터 클리닉’과 ‘페블로스코프’라는 기술을 제공하고 있어요. 글로벌 SaaS1) 공급이 가능하죠. 현재 현대자동차, LG전자, 삼성 E&A, ETRI, 지자체 등 다양한 고객에게 솔루션과 컨설팅을 해드리고 있고, 여러 프로젝트도 수행하고 있어요.
1) SaaS(Software as a Service): 소프트웨어를 서비스 형태로 제공하는 방식을 의미한다. 인터넷을 통해 소프트웨어를 구독형으로 제공하는 방식이다.
처음에는 구체적인 청사진이 없었어요. 하지만 자신감과 겸손한 마음은 늘 있었죠. 저 멀리 있는 별을 보고, 사막에 갇히더라도 꿋꿋하게 걸어 나가겠다는 다소 추상적인 결심으로 4년이 흘렀네요.
그동안 다양한 어려움들을 겪으면서 맷집이 세졌어요. 계속해서 업의 본질이 무엇인지 이해해 나가는 중이에요. 데이터의 진심을 향한 여정은 변함없어요. 첫 IR2) 때 제시한 두 가지 아이템인 ‘데이터 클리닉’과 ‘데이터 캔버스’를 순차적으로 세상에 내놓고 있으니까요.
2) IR(Investor Relations): 투자자들을 대상으로 기업 설명과 홍보를 통해 투자 유치를 이끌어 내는 활동을 의미한다.
첫 번째로는 창업 동기를 잊지 않았는지 계속 점검했어요. 23년간 ETRI라는 온실 속에서 지내봤으니, 온실 밖에서도 잘 살아갈 수 있는 경험이 필요하겠다 싶었어요. 이 경험이 없다면 70세가 되고 80세가 됐을 때 후회할 것 같다는 생각이 들었거든요. 그래서 창업에 도전하게 된 건데, 이 창업의 동기를 잊지 않으려고 해요.
두 번째로 결국 사업가는 파는 사람이잖아요. 고객이 꼭 필요하죠. 그래서 ‘고객의 입장에서 생각하고 있는가?’를 많이 생각했어요. 더불어 글로벌 1등이 될 야심이 있는지도 자문했죠. 이왕 사업을 시작했으니 대덕 연구단지에서 나온 기업이 세계 1등이 될 수 있다는 것을 증명하고 싶었거든요. 이 꿈을 이루기 위해선 저 혼자만으론 부족해요. 자연스럽게 함께하고 있는 팀원을 잘 설계하고 있는지 계속 생각했죠.
개인적인 동기에서 시작된 사업이지만 질문은 점점 확장됐어요. 세상에 대한 공헌을 어떻게 할 수 있는가에 대해서도 자문하게 됐거든요. 데이터를 이해할 수 있는 능력인 ‘데이터 문해력’을 높이는 데 공헌해야겠다 생각하고 있어요.
ETRI 연구원으로 23년 동안 있으면서 폭넓지만 깊게 연구 주제를 다뤘어요. 컴퓨터 그래픽스, 캐드, 로보틱스, 컴퓨터 비전, AI, AR, VR까지 다 다뤄봤거든요. 폭넓게 다뤘다고 해서 대충 다룬 것이 아니고, 논문부터 기술 개발까지 깊이 있는 연구를 했기 때문에 그 경험들 자체가 참 귀하고 도움이 많이 되고 있어요. 더불어 연구하면서 쌓아온 다양한 학술단체나 협회 같은 관계들이 있어서 사업에 도움이 되고 있고요.
앞으로는 데이터 품질 자체가 중요해질 거예요. 초고난이도 합성 데이터의 확보와 활용도 중요해질 거고요. 초고난이도 합성 데이터는 실제보다 더 정밀하게 설계된 가상 데이터를 말하는데요, AI에 겪어보지 못하는 상황까지 학습시킬 수 있는 데이터죠.
데이터는 양보다 질이 더 중요하기 때문에, 데이터를 읽고 해석하는 데이터 문해력(Data Literacy)도 중요해질 거라고 봐요. 더불어 전체와 부분을 동시에 볼 줄 아는 안목도 중요해지겠죠. 대규모 데이터와 특수성을 반영한 데이터 속에서 균형 잡힌 시각으로 데이터를 읽고, 해석해야 하니까요.
그래서 저희는 데이터 클리닉의 다음 버전으로 데이터 에이전트를 생각하고 있어요. 에이전트는 자율적으로 움직이는 AI예요. 어찌 보면 데이터 관리사와 같은 개념인데요. 데이터를 등록해 놓으면 주기적으로 데이터 품질 평가를 하고, 적합한 시기에 적절한 데이터를 제안해 주는 기술인 거죠.
빠르게 발전한 기술 덕분에 데이터를 축적하고 분석하는 것이 편리해졌어요. 그래서 ‘데이터로서의 나’를 측정하고 관리하기 좋은 세상이 됐죠. 이것을 잘 활용하셨으면 좋겠어요. 가장 쉬운 방법은 데이터를 의도적으로 축적해 보시라는 거예요.
예전에는 사진을 많이 찍어도 나중에 언제 보겠어? 그런 생각이 들곤 했었잖아요. 그런데 지금은 그냥 많이 쌓아두셨으면 좋겠어요. 애플 휴대전화만 봐도 중요한 순간들을 요약해서 알려주잖아요. 키워드별로 사진을 분류해서 보여주기도 하고요. 차곡차곡 쌓아온 나만의 데이터들이 훗날 나를 설명해 주는 자산이 될 거예요.
다섯 가지 정도 말씀드릴 수 있을 것 같아요. 첫째, 큰 변화가 생길 수 있으니 가족들과 미리 상의할 것, 둘째, 건강과 멘탈이 충분히 강한지 점검할 것, 셋째, 내가 매력적인 사람인지 돌아볼 것, 넷째, 기술이 아니라 시장이 있는지 검증할 것, 다섯째, 함께 할 창업 멤버가 있는지 확인할 것. 이 다섯 가지를 창업 전에 점검해 보라고 말씀드리고 싶네요.
페블러스는 아직 진행형이에요. 자동차, 조선, 반도체처럼 한국에서 만든 SaaS 솔루션이 글로벌 1등이 될 수 있음을 증명하고 싶어요. 데이터 클리닉과 데이터 아트랩, 데이터 매거진을 넘어 개인이 자신의 삶을 데이터로 조망하고 가꿀 수 있는 ‘데이터 캔버스’ 기술을 성공시키고 싶어요. 이 일들을 하나하나 성취해 나가려면 건강도 잘 챙겨야겠죠. 몸과 마음도 잘 관리해서 회사를 잘 성장시켜 나가고 싶어요.