민·관·산·학 19개 기관, "AI 데이터 활용하자" 협의회 출범
AI 학습 데이터 신규 서비스 개발 등 활용 단계까지 확대 목적
(내외방송=김승섭 기자) 민·관·산·학 19개 기관으로 구성된 'AI 데이터 활용협의회'가 출범했다.
25일 협의회에 참여한 핀테크 O2O전문 기술기업 원투씨엠에 따르면 협의회는 지난 18일 서울 마곡 LG 사이언스파크 ISC에서 출범식을 갖고 본격적인 활동에 들어갔으며, 앞으로 AI 학습 데이터를 신규 서비스 개발 등 활용 단계까지 확대하는 것을 목적으로 하고 있다.
특히, 'AI 데이터 활용협의회'는 데이터 품질관리 전문기관인 TTA와 170종 데이터의 활용성 검토에 참여한 기업·기관을 중심으로 구성됐다.
협의회는 AI 데이터를 지속 개선할 방침이며 과학기술정보통신부와 지능정보원(NIA)은 2020년에 구축한 170종의 데이터를 출범일 기준 60종을 시작으로 6월 말까지 순차적 개방할 예정이다.
또 협의회는 데이터 활용 관련 피드백을 통해 추후 데이터 품질 개선, 추가 과제 기획 등도 추진한다.
'AI 데이터 활용협의회' 출범식 및 간담회에 참석한 기업들은 그동안 써 본 공공 AI 데이터에 대한 평가와 건의사항을 임혜숙 과기정통부 장관에게 전달했다.
출범식에서 AI 허브를 통해 공개된 AI 학습용 데이터는 총 4억 8000만건(8대 분야 170종)이다. 과기정통부는 AI 알고리즘을 보유한 20여곳의 기업 및 연구기관에게 먼저 데이터를 제공해 테스트하도록 했다.
과기정통부는 지난 2017년부터 기업·연구자·개인이 시간 및 비용 문제로 개별적으로 구축하기 어려운 AI 학습용 데이터를 구축·개방했다.
지난해 부터는 디지털뉴딜의 데이터댐 구축 프로젝트의 일환으로 AI 학습용 데이터 규모를 확대했다.
출범일 공개된 데이터는 텍스트뿐만 아니라 각 지역의 사투리 음성과 해상·선박의 이미지 등 다양한 형태로 구성됐다.
이에 대해 원투씨엠 관계자는 이날 내외방송과의 통화에서 "자체 개발한 에코스(echoss) 플랫폼의 빅데이터 선형 분석 예측 AI알고리즘을 이미 상용화했다"며 "이를 적용한 이미지 데이터 분석 및 예측 기술 체제를 이번 프로젝트에 적용해 참여한다"고 전했다.
신성원 원투씨엠 부대표는 "AI학습 데이터 사업을 추진되면서 이제는 글로벌 협력 체제에 대해서도 고려할 필요가 있다"며 "학습 데이터 자체는 이를 글로벌 무대에 공개할 것인가는 여러 측면의 정책적 고려가 필요하지만, 이를 활용한 응용 서비스나, 융합 데이터 스왑 등 다양한 방식의 글로벌 협업 체계가 도입됐으면 한다"고 밝혔다.