누구나 인공지능 응용 서비스를 개발할 수 있도록 '인공지능 허브' 지원을 다각도로 확대한다(지능정보사회추진단, 인공지능정책팀)
누구나 인공지능(AI) 응용 서비스를 개발할 수 있도록 ‘인공지능 허브’지원을 다각도로 확대한다
- ① 인공지능 학습용 데이터 대폭 확대, ② 개방형 경진대회 추진, ③ 고성능 클라우드 컴퓨팅 지원 확대 -
□ 과학기술정보통신부(장관 유영민, 이하 ‘과기정통부’)는 국내 인공지능(AI) 중소‧벤처기업의 경쟁력을 높일 수 있도록 ‘인공지능 허브’를 확대 구축한다.
ㅇ ‘인공지능 허브’란 누구나 인공지능 기술‧서비스 개발에 필요한 필수 요소를 자유롭게 활용할 수 있는 개발 환경을 제공하기 위해 시작한 사업으로서, 지난해 1월부터 구축‧운영되었다.
- 정부는 지난 해 8월 국가 차원의 전략적 투자가 필요한 혁신성장 전략투자 분야로 인공지능을 선정하면서, 핵심 사업인 인공지능 허브에 대한 투자를 대폭 확대*하기로 하였다.
* 인공지능 허브 투자 규모 : (’18년) 92.56억원 → (’19년) 310억원
ㅇ 지난해까지는 인공지능 개발 필수 요소 중 학습용 데이터 위주로 개방‧제공이 되었다면, 올해부터는 학습용 데이터 제공을 대폭 확대하는 동시에 개방형 경진대회를 통한 인공지능 알고리즘* 개발‧제공과 고성능 컴퓨팅 지원이 보강될 예정이다.
* 알고리즘(algorithm)은 주어진 문제를 논리적으로 해결하기 위해 필요한 방법을 프로그래밍 언어 등을 이용해 서술한 것을 말함
< ① 인공지능 학습용 데이터 >
□ 인공지능 학습용 데이터는 인공지능 학습에 활용할 수 있는 형태의 데이터로, 인공지능 기술 및 서비스 개발을 위한 필수 요소이다. 하지만 데이터 구축에 많은 시간과 비용이 소요되어 중소‧벤처기업이 자체적으로 확보하기에는 어려움이 많았다.
□ 이에 과기정통부는 ’17년부터 인공지능 학습용 데이터 구축을 시작하였고, ’18.1월부터 일반상식, 이미지, 특허, 법률 등 4종의 학습용 데이터를 제공했다. 금년 1월 중에 ’18년에 구축을 추진한 관광, 농업, 헬스케어 분야 데이터를 추가해 7종으로 확대하고, 4월에는 한국어 음성‧대화 등 4종을 추가 개방할 예정이다.
□ 금년에는 학습용 데이터의 제공 종류와 규모를 글자체‧동작‧엑스레이 이미지 등 10종(최소 2,500만건)으로 대폭 확대하고, 개방 시기도 차년도 1월에서 해당연도 7월, 12월로 앞당길 예정이다.
ㅇ 또한 민간 중심으로 인공지능 학습용 데이터가 자생적으로 생성‧확장하는 생태계가 구축될 수 있도록, 대중이 데이터 구축에 참여하는 방식(크라우드 소싱)의 데이터 확산 체계 마련, 학습용 데이터 구축 도구 공개, 인공지능 응용 시범 서비스 등 새로운 서비스도 지속 검토‧도입할 계획이다.
’18.1월~12월 주요 실적 (인공지능 학습용 데이터)
ㅇ (이용 실적) ’18.1월부터 공개한 4종 750만건 데이터를 730여개의 중소‧벤처기업, 개발자 등이 약 1,000번(약 1억건의 데이터) 다운로드
ㅇ (성공 사례) ㈜포티투마루는 인공지능 허브에서 제공되는 일반상식분야 학습용 데이터를 활용하여 질의응답 소프트웨어(딥시멘틱 QA) 개발 및 상용화에 성공
- 아마존 챌린지 대회에서 우수상 수상, 기계독해 분야의 글로벌 경진대회(SQUAD2.0)에서 구글과 함께 공동 1위 수상 뿐 아니라, 국제적인 투자유치에도 성공하였음
< ② 개방형 경진대회를 통한 알고리즘 개발‧제공 >
□ 국내 중소‧벤처기업과 연구자 등이 보다 쉽고 효율적으로 인공지능 서비스를 개발할 수 있도록 인공지능 기술 공개를 두 가지 방식으로 확대한다.
□ 첫 번째, 실시간으로 우수 알고리즘을 공개 경쟁하고, 알고리즘 개발 이력과 우수 인재 순위가 공개되는 형태의 온라인 인공지능 경진대회 플랫폼을 새롭게 구축하여 운영한다.
ㅇ 올해 첫 회를 맞이하는 온라인 인공지능 경진대회는 누구나 손쉽게 접속하여 자율적인 형태로 기술력을 겨룰 수 있는 혁신의 장으로, 민간 또는 지자체, 他 정부 부처도 과제를 직접 등록하고 우수 연구자에게 직접 포상할 수 있는 플랫폼으로 활용할 계획이다.
ㅇ 올해에는 도전 문제들을 우수하게 해결하는 20개팀을 발굴(4월경 공고, 7월경 선발)하고, 이후 5개월간(7~11월) 인공지능 서비스 개발‧상용화를 위한 사업화비(평균 1.6억원, 총 32억원)를 지원할 예정이다.
□ 둘째로, 과기정통부가 국책 연구과제로 지원한 기술을 연구자들이 이용하기 쉬운 형태(오픈 API*)로 개방하는 범위를 점차 확대한다.
* API(Application Programming Interface) : 특정 프로그램을 레고 블럭처럼 재조합하여 활용할 수 있도록 제공하는 프로그래밍 인터페이스
ㅇ ’18.1월부터 한국어 질문 분석, 음성처리 등 14종을 개방하였고, 금년 1월 중에는 대화처리 등 9종을 추가 개방하고, 차년도 1월에는 질의응답후보추론, 발음평가 등 5종을 추가 개방할 예정이다.
< ③ 고성능 컴퓨팅 >
□ 고성능 컴퓨팅 환경은 대량의 학습 데이터를 빠르게 학습하여 인공지능 기술 및 서비스 개발 시기를 앞당기는데 필수적이나, 비용이 많이 소요되는 문제가 있다.
□ 이에 자체 컴퓨팅 환경이 열악한 인공지능 중소‧벤처기업 등을 대상으로 클라우드 기반의 컴퓨팅 자원 지원을 대규모로 확대한다. 특히, 딥러닝에 특화된 컴퓨팅 자원(GPU*)을 제공함으로써 신속한 인공지능 기술 및 서비스 개발을 촉진할 것이다.
* GPU(Graphic Processor Unit)는 수천 개의 소형 코어로 구성되어 딥러닝과 같은 분야에 방대한 데이터를 효율적으로 병렬처리가 가능
ㅇ 올해에는 중소‧벤처기업, 연구‧공공기관, 대학 등의 신청을 받아 200여개 기관을 선정(3월 예정)하고 이후 9개월간(4~12월) 컴퓨팅 자원을 지원할 예정이다.
□ 장석영 과기정통부 정보통신정책실장은 “국내 인공지능 산업의 경쟁력을 키우기 위해서는 국내 개발자들이 인공지능 서비스와 제품을 제약 없이 개발할 수 있는 환경 조성이 중요하다”며 “앞으로도 기술력 있는 국내 중소·벤처기업이 역량을 확보해 세계로 진출할 수 있도록 생태계 마련에 힘쓰겠다”고 밝혔다.
□ 과기정통부는 인공지능 학습용 데이터 구축, 클라우드 컴퓨팅 제공, 경진대회 등 사업 수행에 필요한 사항에 대해서도 사업자 공모 등을 진행할 예정으로, 사업의 신청·접수기간 등 세부적인 내용과 절차, 일정 등 자세한 내용은 1월 22일 AI허브(aihub.or.kr) 또는 한국정보화진흥원 누리집(www.nia.or.kr), 정보통신산업진흥원 누리집(www.nipa.kr)를 통해 확인할 수 있다.
참고 1-1 ’19년도 인공지능 학습용 데이터 셋 지원 및 개방 계획(안) 분야 구 축 내 용 활용서비스 (예시) 번역 말뭉치 o 한국어 인공지능 번역 기술개발 및 성능강화를 위한 한국어-영어 병렬 말뭉치 데이터 120만 문장 구축 한국어-영어 AI번역시스템 등 사물 이미지 o 한국형 객체, 장소, 상황 인지기술 개발 및 성능강화를 위한 사물/거리/간판/심볼 이미지 데이터 360만장 구축 국내 사물인식 및 안내 서비스 등 글자체 이미지 o 한글 광학글자인식(OCR) 성능개선을 위한 한글 글자체(손글씨 및 인쇄체) 이미지 500만장 구축 자동 한글 인식 서비스 등 인도보행 영상 o 시각장애인, 전동휠체어 등의 보행지원기술 개발을 위한 국내 인도‧횡단보도 보행 영상 및 인도위 객체(사람, 자전거, 가로수, 펜스 등) 라벨링 데이터 6만건(500시간) 구축 장애인 길안내, 자율전동 휠체어 등 복합영상 o 감성인식 AI개발을 위해 동영상에서 인물의 표정, 음성, 발화 내용, 상황 등의 감정이 포함된 다중영상 데이터 9만건(50시간) 구축 인간의 감정, 상황 이해 로봇 등 사람동작 영상 o 사람의 동작‧자세‧행동 인식기술 개발을 위해 다양한 조건에서 사람 동작 영상 데이터 50만건 구축 가정, 공공시설 등의 서비스 로봇 등 안면 이미지 o 다양한 각도, 조도 등의 환경 하에서 안면인식‧식별 성능강화를 위한 한국인 얼굴 이미지 데이터 1,400만장 구축 한국인 얼굴 인식 AI시스템, 범죄자 탐지 위험물 이미지 o 위험물‧도구 자동판별 기술개발 및 성능개선을 위한 위험물, 범죄 도구, 반입금지물품 등의 X-ray 이미지 40만장 구축 공항,항만,철도,주요 시설 AI보안 검사 질병진단 이미지 o 국내에서 유병률, 중증도 등이 높은 주요 질환관련 진단 이미지(X-ray, MRI, 초음파 영상 등) 및 진단결과 데이터 1만장 구축 주요질병 자동검진 AI의사 이상행동 영상 o 이상행동 지능형 탐지기술 성능 강화를 위한 주‧야간 적용가능한 이기종(가시광선, 적외선) 영상 데이터 11만건(300시간) 구축 지능형 CCTV, AI안전감시
□ 개 요
ㅇ 중소·벤처기업 등에게 AI 제품·서비스 개발의 성능 향상에 필수적인 AI 학습용 데이터 셋 구축 지원 및 개방을 통해 AI 활용 확산 촉진
□ ’19년도 구축 지원 및 개방(안)
참고 1-2 ’17~’18년도 인공지능 학습용 데이터 셋 개방 현황
구 분 |
분야 |
구 축 내 용 |
활용서비스 (예시) |
‘17년 구축 (‘18.1월 개방)
750만건 |
특허 |
o 국내 출원‧등록된 전기‧전자분야의 특허정보, 심사정보, 특허전문기술용어 데이터 100만건 |
유망기술 예측, |
법률 |
o 국가법령 중 교통사고, 층간소음, 창업 인허가 분야의 관련 법령, 조문, 판례, 법률용어 데이터 11만건 |
법률정보추천, 법률상담 챗봇 등 | |
한국형 이미지 |
o 한국인 안면 이미지 600만장(200명) 및 한국음식 이미지 데이터 15만장(150종) 등 615만장 |
본인확인 기술, | |
일반상식 |
o 한국어 위키백과에서 AI 서비스 개발에 활용도가 높은 일반상식 데이터 15만건 |
인공지능 비서, | |
‘18년 구축 (‘19.1월 개방)
850만건 |
관광 |
o 주요 관광지역 시설, 식당의 이미지에 각종 다국어(한,영,중,일) 정보(명칭, 위치, 메뉴, 관광정보 등)를 결합한 데이터셋 150만건 |
관광정보 검색, |
농업 |
o 국내 농작물의 영농정보, 상담정보, 지원사업정보 등의 지식베이스 및 농작물 병충해 이미지 데이터 5만건 |
병충해 자동진단 AI 등 | |
헬스케어 |
o 안저 이미지에 주요 질환(녹내장, 황반변성, 당뇨망막증 등)의 전문의 검사소견을 결합한 데이터셋 3천장 |
안저질환검사 및 예측 등 | |
특허 |
o 전기‧전자, 기계, 화학 분야의 등록된 특허 청구항 정보, 특허전문기술용어 데이터 70만건 |
유망기술 예측, | |
법률 |
o 이혼, 한부모가족, 학교폭력, 퇴직금개 분야 법령정보(법령, 판례, 사례, 용어 등) 데이터 10만건 |
법률정보 추천, | |
한국형 이미지 |
o 한국인 안면이미지 600만장(200명) 및 국산차량 이미지 15만장(100종) 등 615만장 |
본인확인 기술, | |
‘18~’19년 구축 (‘19.4월 개방 예정)
250만건 |
한국어 음성 |
o 한국어 음성 인식 성능을 향상시키기 위해 자유연속발화, 소음 환경 등을 고려한 음성 데이터 150만건(1,000시간) |
가상비서, 음성인식 서비스 등 |
한국어 대화 |
o 중소상인 비즈니스에 적용가능한 한국어 챗봇 구축을 위한 한국어 표준 대화 시나리오 데이터 50만건 |
소상공인 챗봇 서비스 등 | |
복합영상 |
o 영상에서 인물의 표정, 음성(억양), 발화 내용 등의 |
인간의 감정, 상황 이해 AI 서비스 등 | |
기계독해 |
o 지문으로부터 AI가 학습을 통해 질의에 대한 답변을 추론하는 딥러닝 기반 기계독해(MRC) 데이터 50만건 |
질의응답 AI 서비스 등 |
참고 2 |
|
클라우드 컴퓨팅 지원 계획 |
□ 개 요
ㅇ 컴퓨팅 환경이 열악한 중소·벤처기업 등에 막대한 계산을 효율적으로 처리할 수 있는 GPU 기반의 고성능 클라우드 컴퓨팅 자원 제공
* 딥러닝과 같은 학습기반의 인공지능은 많은 연산을 통해 최상의 모델을 도출함에 따라 막대한 계산을 감당할 GPU(그래픽처리장치) 기반 컴퓨팅 파워가 필요
- 고성능 컴퓨팅 인프라 지원을 통해 중소·벤처기업, 스타트업에 신속한 제품·서비스를 개발할 수 있도록 지원
□ ’18년 지원 주요내용
ㅇ (지원대상) 컴퓨팅 환경이 열악한 중소·벤처기업, 스타트업 등
* GPU 클라우드 서비스 지원대상에서 대기업, 중견기업은 제외
ㅇ (지원내용) 민간의 GPU 기반 클라우드 컴퓨팅을 임대하여 제공
- GPU 서버 1식, 인공지능 개발용 공개 소프트웨어 및 서비스 개발 환경 등
- GPU 기반 클라우드 컴퓨팅 사용방법 등의 교육을 통해 응용서비스 개발 지원
- 인공지능 제품개발 시 기술적 문제 자문
ㅇ (선정방법) 공모를 통해 신청한 기업의 개발내용, 활용방법 등 신청사항을 심사하여 대상기업 선정(’19년 200개 기업 지원 예정)
ㅇ (지원일정) 사업지원 대상 선정(’19.3월), 이용(4월~12월)
ㅇ (지원환경) 인공지능 개발환경과 컴퓨팅 인프라 지원 내용
- 인공지능 개발 프레임워크 : TensorFlow, Caffe2, Theano, PyTorch 등
- CPU : 서버용 14Core 2.6Ghz 이상
- GPU : 배정밀도(64bit) 5TFLOPS, 단정밀도(64bit) 10TFLOPS 2식 이상
- Memory : 서버당 512GB, Disk : SSD 1TB 이상
* 개발 프레임워크와 제공 서비스는 수요에 따라 변경 가능
참고 3-1 |
|
개방형 경진대회 플랫폼 운영 계획 |
□ 개 요
ㅇ AI 우수(특화) 알고리즘 개발을 통한 기술혁신을 가속화할 수 있도록 도전적‧창의적 문제해결의 場인 챌린지 온라인 플랫폼 구축‧운영
- 정부에서 제시한 도전적인 문제를 해결하는 우수(특화) 알고리즘을 개발하는 중소·벤처기업 등에게 인센티브(포상금 등)를 제공
민간의 혁신이 활발한 미국도 연방정부가 중심이 되어 ’12년부터 개방형 경진대회 플랫폼(Challege.gov)을 통해 AI 개발 및 확산에 기여
- 100여개 이상의 정부부처 및 연방기관이 도전형 과제를 819개 제안(’18.2기준), 25만명이상 참가, 약 1억달러(’12~’16) 포상금 수여 |
□ 주요내용
ㅇ (문제발굴) 전문가로 구성된 문제발굴위원회가 공공·산업데이터를 활용하여 지정한 20개 과제에 대한 문제해결 알고리즘 개발 경연
- 기업에서 개발한 알고리즘을 활용하여 지정과제를 수행한 결과를 평가하여 상위 기업(사업화 지원기업의 1.5배수)의 사업화 계획 평가를 통해 사업화 지원기업 선정
* 기 구축된 범용 AI 학습용 데이터 셋(법령, 특허, 교통, 교육 등)을 활용하여 출제
ㅇ (문제해결) 누구나 경진대회 과제를 직접 등록․참여할 수 있고 이를 해결하기 위한 AI 알고리즘을 학습할 수 있는 환경 제공
* GPU 기반 클라우드 컴퓨팅 지원사업과 연계하여 AI 프레임워크, CPU, GPU, SSD, Memory 등 인공지능 시스템 개발을 위한 개발환경 제공
ㅇ (사업화 지원) 알고리즘 개발성과와 사업계획서를 평가하여 사업화 지원 대상을 선정, 사업화 지원
* 사업화지원금 : 인건비, 시제품 제작비, 재료비, 지재권 취득비, 마케팅비, 출장비 등
ㅇ (우수 아이디어) 제안한 데이터 품질과 문제 우수성(문제정의, 해결목표, 평가방법 등)을 심사하여 우수 제안에 대해, 선발 및 포상
* 제안 아이디어는 추후 경진대회 과제로 활용되며 최우수 아이디어 기준 300만원 내외 포상
참고 3-2 |
|
인공지능 소프트웨어 개방 계획 |
□ 개 요
ㅇ 정부의 AI SW 연구개발 결과물을 중소·벤처기업이 활용하여 지능화 제품·서비스 개발에 활용할 수 있도록 오픈 API* 형태로 개방
* 오픈 API(Application Programming Interface) : 특정 프로그램을 레고 블럭처럼 재조합하여 활용할 수 있도록 제공하는 응용 프로그래밍 인터페이스
□ 주요내용
ㅇ (제공형태) 오픈 API를 대표적인 웹 서비스 방식으로 개발·제공
- 개발자가 오픈 API를 호출하고 데이터를 입력하면 이를 전달받은 API 서버에서 연산을 수행한 후에 분석결과를 사용자에 전달
ㅇ (활용방법) 개발자는 여러 종의 API를 조합하여 지능형 검색, 자동 질의응답, 상담 솔루션 등 다양한 응용서비스 개발에 활용
< 인공지능 SW 오픈 API 개방(’17~’18년) 및 추가 구축(’19년) 계획(안) >
구 분 |
세부기술 |
’17년 개방(14종) |
’18년 개방(9종) |
’19년 계획(5종) |
언어 처리 |
한국어 언어분석 |
6종 형태소 분석, 개체명 인식, 동음이의어 분석, 다의어 분석, 의존구문 분석, 의미역 인식 |
- |
- |
한국어 어휘관계 분석 |
4종 어휘 간 유사도 분석, 어휘정보, 동음이의어 정보, 다의어 정보 |
- |
- | |
한국어 질문분석 |
1종 한국어 질문분석 |
- |
- | |
질의응답 |
- |
1종 한국어 위키백과 질답 QA |
1종 정답후보추론 | |
대화처리 |
- |
1종 도메인 지식별 대화처리 |
- | |
음성 처리 |
한국어 음성인식 |
2종 한국어 및 영어 음성인식 |
6종 중국어,일어,스페인어,불어,독어,러시아어 음성인식 |
2종 한국어 발음 평가, 발화분석 |
외국어 음성인식 |
1종 영어 발음 평가 |
- |
- | |
영상 처리 |
영상이해 |
- |
1종 명사 이해 |
2종 영상분석, 이미지 생성 등 |
참고 4 |
|
「인공지능(AI) 오픈 이노베이션 허브」이용 방법 |
< 인공지능(AI) 오픈 이노베이션 허브 포털(aihub.or.kr) 화면 >
□ 이용방법 및 준수사항
ㅇ (이용대상) 국내 기업 및 대학, 연구기관, 개인 등 누구나 계정을 발급받아 포털에서 제공한 서비스를 활용 가능
ㅇ (준수사항) 제공한 데이터를 활용하여 제품·서비스 개발 및 연구개발(R&D)에 활용한 논문, 제품 등 결과물에 데이터의 출처 명시
- 다운로드를 받은 데이터 셋은 제 3자에게 재배포 불가능
□ 이용절차
출처-과학기술정보통신부
'오늘의이야기 > 시사' 카테고리의 다른 글
'19년 2월~4월 전국 아파트 112,648세대 입주 예정 (0) | 2019.01.22 |
---|---|
학교 미세먼지 저감을 위한 기술개발사업 추진(원천기술과) (0) | 2019.01.22 |
신속, 정확한 위치파악으로 긴급구조 골든타임 확보(네트워크진흥팀) (0) | 2019.01.22 |
2019년도 과기정통부 R&D 사업 설명회 개최(연구개발정책과) (0) | 2019.01.22 |
과기정통부 제1차관, 과학기술 석학 및 과학문화현장 소통 (0) | 2019.01.22 |