과기정통부, 초거대 AI용 데이터 확대…데이터 라벨링 사업 추진

2023.04.19 13:51:26

과학기술정보통신부는 단순·반복 작업 중심의 기존 데이터 라벨링 물량을 축소하고 챗GPT와 같은 초거대 AI 모델 지원을 목표로 데이터 라벨링 사업을 추진하겠다고 밝혔다.


데이터 라벨링은 인공지능이 인식할 수 있는 형태의 데이터로 컴퓨터에 입력하는 작업으로, 정부는 2017년부터 언어, 이미지, 영상, 음성 등 분야에서 AI 학습 데이터를 구축 중이다.


올해는 모두 2,805억원을 투입해 헬스케어, 교통·물류, 재난·안전·환경, 농·축·수산, 제조, 로보틱스, 문화·관광, 스포츠, 교육, 법률, 금융, 지식재산 등 분야에서 신규 데이터 150종을 구축할 예정이다. 이 가운데 데이터 34종은 '초거대AI 지원 데이터'로 구분해 구축하기로 했다.


이미지 데이터 48종은 생성형 AI 학습에 활용할 수 있도록 이미지를 묘사·설명하는 캡션 정보를 추가 입력한다.


문화관광, 스포츠, 법률 등 특화 분야에서 인공지능 도입을 목표로 관련 데이터 구축 비중을 지난해 19%에서 올해 25%로 높이기로 했다.


아울러 법률안 검토 보고서 요약 데이터, 119 신고 접수 음성 데이터 등 국회·소방과 같은 공공분야에서 보유한 데이터의 민간 이용 확산을 지원한다.


올해 사업 주관기관 114곳을 선정할 예정이며, 데이터 1종당 구축 비용으로 연간 최대 17억원 지원한다.


과기정통부는 이달 말부터 지난해 데이터 라벨링 사업을 통해 구축한 데이터 310종을 품질검증을 거쳐 순차적으로 개방한다고 밝혔다.

 

오토메이션월드 김진희 기자 |

김진희 기자 jjang@hellot.net
Copyright ⓒ 첨단 & automationasia.net



상호명(명칭) : ㈜첨단 | 등록번호 : 서울,아54000 | 등록일자 : 2021년 11월 1일 | 제호 : 오토메이션월드 | 발행인 : 이종춘 | 편집인 : 임근난 | 본점 : 서울시 마포구 양화로 127, 3층, 지점 : 경기도 파주시 심학산로 10, 3층 | 발행일자 : 2021년 00월00일 | 청소년보호책임자 : 김유활 | 대표이사 : 이준원 | 사업자등록번호 : 118-81-03520 | 전화 : 02-3142-4151 | 팩스 : 02-338-3453 | 통신판매번호 : 제 2013-서울마포-1032호 copyright(c)오토메이션월드 all right reserved