'#인공지능 허브' 태그의 글 목록 :: 의미있는 나의이야기

 

누구나 인공지능 응용 서비스를 개발할 수 있도록 '인공지능 허브' 지원을 다각도로 확대한다(지능정보사회추진단, 인공지능정책팀)

 

 

누구나 인공지능(AI) 응용 서비스를 개발할 수 있도록 ‘인공지능 허브’지원을 다각도로 확대한다

 

 

 

- ① 인공지능 학습용 데이터 대폭 확대, ② 개방형 경진대회 추진, ③ 고성능 클라우드 컴퓨팅 지원 확대 -


 

 


□ 과학기술정보통신부(장관 유영민, 이하 ‘과기정통부’)는 국내 인공지능(AI) 중소‧벤처기업의 경쟁력을 높일 수 있도록 ‘인공지능 허브’를 확대 구축한다.
 
 ㅇ ‘인공지능 허브’란 누구나 인공지능 기술‧서비스 개발에 필요한 필수 요소를 자유롭게 활용할 수 있는 개발 환경을 제공하기 위해 시작한 사업으로서, 지난해 1월부터 구축‧운영되었다.
 
  - 정부는 지난 해 8월 국가 차원의 전략적 투자가 필요한 혁신성장 전략투자 분야로 인공지능을 선정하면서, 핵심 사업인 인공지능 허브에 대한 투자를 대폭 확대*하기로 하였다.
 
   * 인공지능 허브 투자 규모 : (’18년) 92.56억원 → (’19년) 310억원
 
 ㅇ 지난해까지는 인공지능 개발 필수 요소 중 학습용 데이터 위주로 개방‧제공이 되었다면, 올해부터는 학습용 데이터 제공을 대폭 확대하는 동시에 개방형 경진대회를 통한 인공지능 알고리즘* 개발‧제공과 고성능 컴퓨팅 지원이 보강될 예정이다.
 
   * 알고리즘(algorithm)은 주어진 문제를 논리적으로 해결하기 위해 필요한 방법을 프로그래밍 언어 등을 이용해 서술한 것을 말함
 


 
< ① 인공지능 학습용 데이터 >
 
□ 인공지능 학습용 데이터는 인공지능 학습에 활용할 수 있는 형태의 데이터로, 인공지능 기술 및 서비스 개발을 위한 필수 요소이다. 하지만 데이터 구축에 많은 시간과 비용이 소요되어 중소‧벤처기업이 자체적으로 확보하기에는 어려움이 많았다.
 




 □ 이에 과기정통부는 ’17년부터 인공지능 학습용 데이터 구축을 시작하였고, ’18.1월부터 일반상식, 이미지, 특허, 법률 등 4종의 학습용 데이터를 제공했다. 금년 1월 중에 ’18년에 구축을 추진한 관광, 농업, 헬스케어 분야 데이터를 추가해 7종으로 확대하고, 4월에는 한국어 음성‧대화 등 4종을 추가 개방할 예정이다.
 
□ 금년에는 학습용 데이터의 제공 종류와 규모를 글자체‧동작‧엑스레이 이미지 등 10종(최소 2,500만건)으로 대폭 확대하고, 개방 시기도 차년도 1월에서 해당연도 7월, 12월로 앞당길 예정이다.
 
 ㅇ 또한 민간 중심으로 인공지능 학습용 데이터가 자생적으로 생성‧확장하는 생태계가 구축될 수 있도록, 대중이 데이터 구축에 참여하는 방식(크라우드 소싱)의 데이터 확산 체계 마련, 학습용 데이터 구축 도구 공개, 인공지능 응용 시범 서비스 등 새로운 서비스도 지속 검토‧도입할 계획이다.
 


  ’18.1월~12월 주요 실적 (인공지능 학습용 데이터)
 
  ㅇ (이용 실적) ’18.1월부터 공개한 4종 750만건 데이터를 730여개의 중소‧벤처기업, 개발자 등이 약 1,000번(약 1억건의 데이터) 다운로드
 
  ㅇ (성공 사례) ㈜포티투마루는 인공지능 허브에서 제공되는 일반상식분야 학습용 데이터를 활용하여 질의응답 소프트웨어(딥시멘틱 QA) 개발 및 상용화에 성공
 
   - 아마존 챌린지 대회에서 우수상 수상, 기계독해 분야의 글로벌 경진대회(SQUAD2.0)에서 구글과 함께 공동 1위 수상 뿐 아니라, 국제적인 투자유치에도 성공하였음
 
< ② 개방형 경진대회를 통한 알고리즘 개발‧제공 >
 
□ 국내 중소‧벤처기업과 연구자 등이 보다 쉽고 효율적으로 인공지능 서비스를 개발할 수 있도록 인공지능 기술 공개를 두 가지 방식으로 확대한다.
 
□ 첫 번째, 실시간으로 우수 알고리즘을 공개 경쟁하고, 알고리즘 개발 이력과 우수 인재 순위가 공개되는 형태의 온라인 인공지능 경진대회 플랫폼을 새롭게 구축하여 운영한다.
 
 ㅇ 올해 첫 회를 맞이하는 온라인 인공지능 경진대회는 누구나 손쉽게 접속하여 자율적인 형태로 기술력을 겨룰 수 있는 혁신의 장으로, 민간 또는 지자체, 他 정부 부처도 과제를 직접 등록하고 우수 연구자에게 직접 포상할 수 있는 플랫폼으로 활용할 계획이다.
 
 ㅇ 올해에는 도전 문제들을 우수하게 해결하는 20개팀을 발굴(4월경 공고, 7월경 선발)하고, 이후 5개월간(7~11월) 인공지능 서비스 개발‧상용화를 위한 사업화비(평균 1.6억원, 총 32억원)를 지원할 예정이다.
 
□ 둘째로, 과기정통부가 국책 연구과제로 지원한 기술을 연구자들이 이용하기 쉬운 형태(오픈 API*)로 개방하는 범위를 점차 확대한다.
 
   * API(Application Programming Interface) : 특정 프로그램을 레고 블럭처럼 재조합하여 활용할 수 있도록 제공하는 프로그래밍 인터페이스
 
 ㅇ ’18.1월부터 한국어 질문 분석, 음성처리 등 14종을 개방하였고, 금년 1월 중에는 대화처리 등 9종을 추가 개방하고, 차년도 1월에는 질의응답후보추론, 발음평가 등 5종을 추가 개방할 예정이다.
 


 
< ③ 고성능 컴퓨팅 >
 
□ 고성능 컴퓨팅 환경은 대량의 학습 데이터를 빠르게 학습하여 인공지능 기술 및 서비스 개발 시기를 앞당기는데 필수적이나, 비용이 많이 소요되는 문제가 있다.
 
□ 이에 자체 컴퓨팅 환경이 열악한 인공지능 중소‧벤처기업 등을 대상으로 클라우드 기반의 컴퓨팅 자원 지원을 대규모로 확대한다. 특히, 딥러닝에 특화된 컴퓨팅 자원(GPU*)을 제공함으로써 신속한 인공지능 기술 및 서비스 개발을 촉진할 것이다.
 
   * GPU(Graphic Processor Unit)는 수천 개의 소형 코어로 구성되어 딥러닝과 같은 분야에 방대한 데이터를 효율적으로 병렬처리가 가능
 
 ㅇ 올해에는 중소‧벤처기업, 연구‧공공기관, 대학 등의 신청을 받아 200여개 기관을 선정(3월 예정)하고 이후 9개월간(4~12월) 컴퓨팅 자원을 지원할 예정이다.
 
□ 장석영 과기정통부 정보통신정책실장은 “국내 인공지능 산업의 경쟁력을 키우기 위해서는 국내 개발자들이 인공지능 서비스와 제품을 제약 없이 개발할 수 있는 환경 조성이 중요하다”며 “앞으로도 기술력 있는 국내 중소·벤처기업이 역량을 확보해 세계로 진출할 수 있도록 생태계 마련에 힘쓰겠다”고 밝혔다.
 
□ 과기정통부는 인공지능 학습용 데이터 구축, 클라우드 컴퓨팅 제공, 경진대회 등 사업 수행에 필요한 사항에 대해서도 사업자 공모 등을 진행할 예정으로, 사업의 신청·접수기간 등 세부적인 내용과 절차, 일정 등 자세한 내용은 1월 22일 AI허브(aihub.or.kr) 또는 한국정보화진흥원 누리집(www.nia.or.kr), 정보통신산업진흥원 누리집(www.nipa.kr)를 통해 확인할 수 있다.
 

 

 

참고 1-1

 

 19년도 인공지능 학습용 데이터 지원 개방 계획()



  중소·벤처기업 등에게 AI 제품·서비스 개발의 성능 향상에 필수적인 AI 학습용 데이터 구축 지원 개방 통해 AI 활용 확산 촉진
 
19년도 구축 지원 개방()

분야

구 축 내 용

활용서비스

(예시)

번역

말뭉치

o 한국어 인공지능 번역 기술개발 및 성능강화를 위한 한국어-영어 병렬 말뭉치 데이터 120만 문장 구축

한국어-영어 AI번역시스템 등

사물

이미지

o 한국형 객체, 장소, 상황 인지기술 개발 및 성능강화를 위한 사물/거리/간판/심볼 이미지 데이터 360만장 구축

국내 사물인식 및 안내 서비스 등

글자체

이미지

o 한글 광학글자인식(OCR) 성능개선을 위한 한글 글자체(손글씨 및 인쇄체) 이미지 500만장 구축

자동 한글 인식 서비스 등

인도보행

영상

o 시각장애인, 전동휠체어 등의 보행지원기술 개발을 위한 내 인도‧횡단보도 보행 영상 및 인도위 객체(사람, 자전거, 가로수, 펜스 등) 라벨링 데이터 6만건(500시간) 구축

장애인 길안내, 자율전동 휠체어 등

복합영상

o 감성인식 AI개발을 위해 동영상에서 인물의 표정, 음성, 발화 내용, 상황 등의 감정이 포함된 다중영상 데이터 9만건(50시간) 구축

인간의 감정, 상황 이해 로봇 등

사람동작

영상

o 사람의 동작‧자세‧행동 인식기술 개발을 위해 다양한 조건에서 사람 동작 영상 데이터 50만건 구축

가정, 공공시설 등의 서비스 로봇 등

안면

이미지

o 다양한 각도, 조도 등의 환경 하에서 안면인식‧식별 성능강화를 위한 한국인 얼굴 이미지 데이터 1,400만장 구축

한국인 얼굴 인식 AI시스템, 범죄자 탐지

위험물

이미지

o 험물‧도구 자동판별 기술개발 및 성능개선을 위한 위험물, 범죄 도구, 반입금지물품 등의 X-ray 이미지 40만장 구축

공항,항만,철도,주요 시설 AI보안 검사

질병진단

이미지

o 국내에서 유병률, 중증도 등이 높은 주요 질환관련 진단 이미지(X-ray, MRI, 초음파 영상 등) 및 진단결과 데이터 1만장 구축

주요질병 자동검진 AI의사

이상행동

영상

o 이상행동 지능형 탐지기술 성능 강화를 위한 주‧야간 적용가능한 이기종(가시광선, 적외선) 영상 데이터 11만건(300시간) 구축

지능형 CCTV, AI안전감시

 

 

 

참고 1-2

 

 17~18년도 인공지능 학습용 데이터 개방 현황

 

구 분

분야

구 축 내 용

활용서비스

(예시)

17년 구축

(18.1

개방)

 

750만건

특허

o 국내 출원‧등록된 전기‧전자분야의 특허정보, 심사정보, 특허전문기술용어 데이터 100만건

유망기술 예측,
특허가치 평가  등

법률

o 국가법령 중 교통사고, 층간소음, 창업 인허가 분야의 관련 법령, 조문, 판례, 법률용어 데이터 11만건

법률정보추천,

법률상담 챗봇 등

한국형

이미지

o 한국인 안면 이미지 600만장(200) 및 한국음식 이미지 데이터 15만장(150) 등 615만장

본인확인 기술,
식단추천 등

일반상식

o 한국어 위키백과에서 AI 서비스 개발에 활용도가 높은 일반상식 데이터 15만건

인공지능 비서,
교육용 챗봇

18년 구축

(19.1

 개방)

 

850만건

관광

o 주요 관광지역 시설, 식당의 이미지에 각종 다국어(,,,) 정보(명칭, 위치, 메뉴, 관광정보 등)를 결합한 데이터셋 150만건

관광정보 검색,
AI 관광 가이드 등

농업

o 국내 농작물의 영농정보, 상담정보, 지원사업정보 등의 지식베이스 및 농작물 병충해 이미지 데이터 5만건

병충해 자동진단 AI

헬스케어

o 안저 이미지에 주요 질환(녹내장, 황반변성, 당뇨망막증 등) 전문의 검사소견을 결합한 데이터셋 3천장

안저질환검사 및 예측 등

특허

o 전기‧전자, 기계, 화학 분야의 등록된 특허 청구항 정보, 특허전문기술용어 데이터 70만건

유망기술 예측,
특허가치 평가 등

법률

o 이혼, 한부모가족, 학교폭력, 퇴직금개 분야 법령정보(법령, 판례, 사례, 용어 등) 데이터 10만건

법률정보 추천,
법률상담 챗봇 등

한국형

이미지

o 한국인 안면이미지 600만장(200) 및 국산차량 이미지 15만장(100) 등 615만장

본인확인 기술,
차량 추적 등

18~19년 

구축

(19.4

개방 예정)

 

250만건

한국어 음성

o 한국어 음성 인식 성능을 향상시키기 위해 자유연속발화, 소음 환경 등을 고려한 음성 데이터 150만건(1,000시간)

가상비서, 음성인식 서비스 등

한국어 대화

o 중소상인 비즈니스에 적용가능한 한국어 챗봇 구축을 위한 한국어 표준 대화 시나리오 데이터 50만건

소상공인 챗봇 서비스 등

복합영상

o 영상에서 인물의 표정, 음성(억양), 발화 내용 등의
감정이 포함된 멀티모달 영상 데이터 3.5만건(20시간)

인간의 감정, 상황 이해 AI 서비스 등

기계독해

o 지문으로부터 AI가 학습을 통해 질의에 대한 답변을 추론하는 딥러닝 기반 기계독해(MRC) 데이터 50만건

질의응답 AI 서비스 등

 

 

  

참고 2

 

 클라우드 컴퓨팅 지원 계획


 

  컴퓨팅 환경이 열악한 중소·벤처기업 등에 막대한 계산을 효율적으로 처리할 있는 GPU 기반의 고성능 클라우드 컴퓨팅 자원 제공

  * 딥러닝과 같은 학습기반의 인공지능은 많은 연산을 통해 최상의 모델을 도출함에 따라 막대한 계산을 감당할 GPU(그래픽처리장치) 기반 컴퓨팅 파워가 필요

  - 고성능 컴퓨팅 인프라 지원을 통해 중소·벤처기업, 스타트업에 신속한 제품·서비스를 개발 있도록 지원

 

18 지원 주요내용

  (지원대상) 컴퓨팅 환경이 열악한 중소·벤처기업, 스타트업

   * GPU 클라우드 서비스 지원대상에서 대기업, 중견기업은 제외

  (지원내용) 민간의 GPU 기반 클라우드 컴퓨팅을 임대하여 제공

  - GPU 서버 1, 인공지능 개발용 공개 소프트웨어 서비스 개발 환경

  - GPU 기반 클라우드 컴퓨팅 사용방법 등의 교육을 통해 응용서비스 개발 지원

  - 인공지능 제품개발 기술적 문제 자문

  (선정방법) 공모를 통해 신청한 기업의 개발내용, 활용방법 신청사항을 심사하여 대상기업 선정(19 200 기업 지원 예정)

  (지원일정) 사업지원 대상 선정(19.3), 이용(4월~12)

  (지원환경) 인공지능 개발환경과 컴퓨팅 인프라 지원 내용

  - 인공지능 개발 프레임워크 : TensorFlow, Caffe2, Theano, PyTorch

  - CPU : 서버용 14Core 2.6Ghz 이상

  - GPU : 배정밀도(64bit) 5TFLOPS, 단정밀도(64bit) 10TFLOPS 2 이상

  - Memory : 서버당 512GB, Disk : SSD 1TB 이상

   * 개발 프레임워크와 제공 서비스는 수요에 따라 변경 가능

 

참고 3-1

 

 개방형 경진대회 플랫폼 운영 계획

 

 

  AI 우수(특화) 알고리즘 개발을 통한 기술혁신을 가속화 있도록 도전적‧창의적 문제해결의 챌린지 온라인 플랫폼 구축‧운영

 

  - 정부에서 제시한 도전적인 문제를 해결하는 우수(특화) 알고리즘을 개발하는 중소·벤처기업 등에게 인센티브(포상금 ) 제공

 

 민간의 혁신이 활발한 미국도 연방정부가 중심이 되어 ’12년부터 개방형 경진대회 플랫폼(Challege.gov)을 통해 AI 개발 및 확산에 기여

 

 - 100여개 이상의 정부부처 및 연방기관이 도전형 과제를 819개 제안(18.2기준), 25만명이상 참가, 1억달러(12~16) 포상금 수여

 

주요내용

 

  (문제발굴) 전문가로 구성된 문제발굴위원회가 공공·산업데이터를 활용하여 지정한 20 과제 대한 문제해결 알고리즘 개발 경연

 

   - 기업에서 개발한 알고리즘을 활용하여 지정과제를 수행한 결과를 평가하여 상위 기업(사업화 지원기업의 1.5배수) 사업화 계획 평가를 통해 사업화 지원기업 선정

 

   * 기 구축된  범용 AI 학습용 데이터 셋(법령, 특허, 교통, 교육 등)을 활용하여 출제

 

 

  (문제해결) 누구나 경진대회 과제를 직접 등록․참여할 있고 이를 해결하기 위한 AI 알고리즘을 학습할 있는 환경 제공

 

   * GPU 기반 클라우드 컴퓨팅 지원사업과 연계하여 AI 프레임워크, CPU, GPU, SSD, Memory 등 인공지능 시스템 개발을 위한 개발환경 제공

 

  (사업화 지원) 알고리즘 개발성과 사업계획서 평가하여 사업화 지원 대상을 선정, 사업화 지원

   * 사업화지원금 : 인건비, 시제품 제작비, 재료비, 지재권 취득비, 마케팅비, 출장비 등

 

  (우수 아이디어) 제안한 데이터 품질 문제 우수성(문제정의, 해결목표, 평가방법 ) 심사하여 우수 제안에 대해, 선발 포상

   * 제안 아이디어는 추후 경진대회 과제로 활용되며 최우수 아이디어 기준 300만원 내외 포상

 

참고 3-2

 

 인공지능 소프트웨어 개방 계획

 

  정부의 AI SW 연구개발 결과물 중소·벤처기업이 활용하여 지능화 제품·서비스 개발에 활용할 있도록 오픈 API* 형태로 개방

  * 오픈 API(Application Programming Interface) : 특정 프로그램을 레고 블럭처럼 재조합하여 활용할 수 있도록 제공하는 응용 프로그래밍 인터페이스

 

주요내용

  (제공형태) 오픈 API 대표적인 서비스 방식으로 개발·제공

  - 개발자가 오픈 API 호출하고 데이터를 입력하면 이를 전달받은 API 서버에서 연산을 수행한 후에 분석결과를 사용자에 전달

  (활용방법) 개발자는 여러 종의 API 조합하여 지능형 검색, 자동 질의응답, 상담 솔루션 다양한 응용서비스 개발에 활용

< 인공지능 SW 오픈 API 개방(17~’18) 및 추가 구축(19) 계획() >

구 분

세부기술

17년 개방(14)

18년 개방(9)

19년 계획(5)

언어

처리

한국어

언어분석

6

형태소 분석, 개체명 인식, 동음이의어 분석, 다의어 분석, 의존구문 분석, 의미역 인식

-

-

한국어

어휘관계 분석

4

어휘 간 유사도 분석, 어휘정보, 동음이의어 정보, 다의어 정보

-

-

한국어

질문분석

1

한국어 질문분석

-

-

질의응답

-

1

한국어 위키백과 질답 QA

1

정답후보추론

대화처리

-

1

도메인 지식별 대화처리

-

음성

처리

한국어

음성인식

2

한국어 및 영어 음성인식

6

중국어,일어,스페인어,불어,독어,러시아어 음성인식

2

한국어 발음 평가,

발화분석

외국어 음성인식

1

영어 발음 평가

-

-

영상

처리

영상이해

-

1

명사 이해

2

영상분석, 이미지 생성 등

 

 

참고 4

 

「인공지능(AI) 오픈 이노베이션 허브」이용 방법

 

< 인공지능(AI) 오픈 이노베이션 허브 포털(aihub.or.kr) 화면 >

그림입니다. 원본 그림의 이름: Ai허브.jpg 원본 그림의 크기: 가로 1009pixel, 세로 846pixel

 

 

이용방법 준수사항

  (이용대상) 국내 기업 대학, 연구기관, 개인  누구나 계정을 발급받아 포털에서 제공한 서비스를 활용 가능

  (준수사항) 제공한 데이터를 활용하여 제품·서비스 개발 연구개발(R&D) 활용한 논문, 제품 결과물에 데이터의 출처 명시

  - 다운로드를 받은 데이터 셋은 3자에게 재배포 불가능

 

 

이용절차

그림입니다. 원본 그림의 이름: CLP000010a40003.bmp 원본 그림의 크기: 가로 675pixel, 세로 585pixel

 

출처-과학기술정보통신부

 

 

 

+ Recent posts