헬로티 이동재 기자 | 디지털 휴먼, 버추얼 인플루언서 등에 AI 기반 음성기술 적용 메타버스 분야 협력을 통한 신규 사업모델 확보, 추가 성장 기회 창출 셀바스AI가 엔진비주얼웨이브와 ‘디지털 휴먼 관련 메타버스 사업’을 위한 업무협약을 체결했다고 22일 밝혔다. 엔진비주얼웨이브는 최근 선풍적 인기를 끈 넷플릭스 시리즈 '지옥'의 VFX(시각특수효과)를 총괄했다. 양사는 이번 협약을 통해 디지털 휴먼 상용화 서비스 및 VFX 콘텐츠 제작 등 메타버스 관련 사업을 추진한다. 셀바스 AI는 음성합성, 음성인식 솔루션 및 인공지능 융복합 기술을 엔진비주얼웨이브가 진행 중인 버추얼 인플루언서, 가상 아나운서, 아바타 키오스크 등 메타버스 관련 서비스에 적용할 예정이다. 셀바스 AI의 음성기술이 적용된 디지털 휴먼은 내년 1분기에 공개 예정이다. 셀바스 AI는 22년 이상 쌓아온 인공지능 기반 딥러닝 기술 · 음성합성 및 음성인식 기술력을 통해 디지털 휴먼 시장을 적극 공략하고 있다. 시장 내 경쟁력 확보를 위해 다양한 연구·개발을 진행하고, 여러 메타버스 서비스 기업들과 제휴를 통해 ‘디지털 휴먼’ 제작 프로젝트도 추진 중이다. 엔진비주얼웨이브는 디지털 휴먼 개발
헬로티 함수미 기자 | 셀바스 AI가 ‘리얼타임 인터랙션 디지털 휴먼’으로 메타버스 첫 프로젝트를 시작한다. 셀바스 AI는 메타버스 플랫폼 전문기업 핑거아이즈와 ‘메타버스 플랫폼 사업 협력’을 위한 업무협약을 체결했다고 16일 밝혔다. 핑거아이즈는 MMORPG 개발 및 서비스 경험을 바탕으로 VR·AR·XR·MR 등의 기술력이 적용된 멀티 플랫폼용 메타버스 플랫폼을 개발 중이다. 셀바스 AI는 메타버스 사업을 본격화하기 위해 음성기술 기반 ‘메타버스 랩’을 신설했다. 22년 이상 쌓아온 인공지능 기반 딥러닝 기술 및 음성인식, 음성합성 기술력과 노하우를 기반으로 국내 최초로 리얼타임 상호작용이 가능한 ‘디지털 휴먼’ 제작 프로젝트를 추진 중이다. ‘디지털 휴먼’은 메타버스 내 2D, 3D Model, Brand Voice뿐 아니라 극사실적인 실시간 소통이 가능하다. 특히 회사는 메타버스에서 필수 요소인 ▲디지털 휴먼과의 극사실적인 실시간 소통 ▲3D 디지털 휴먼의 음성과 동기화된 표정 ▲음성합성 기술로 생성한 음성을 말하는 입술의 움직임을 최대한 사람과 비슷하게 구현한다는 계획이다. 회사 측은 현재 시장에서 언급중인 디지털 휴먼은 대부분 쌍방향 소통이 거의
헬로티 함수미 기자 | 한국전자통신연구원(ETRI)은 대화를 하면서 언어를 쉽게 익힐 수 있는 인공지능 기술을 개발했다고 밝혔다. 국내 연구진이 자유롭게 대화하면서 음성을 인식하고 발음을 평가하는 대화형 교육 시스템 원천기술을 개발했다. 이로써 외국인들이 가장 배우기 어려운 언어 중 하나인 한국어를 더욱 효과적으로 학습하는데 큰 도움이 될 전망이다. ETRI가 개발한 대화형 외국어 교육 시스템은 다양한 상황별 주제를 영어나 한국어로 대화를 나누는 방식으로 이뤄진다. 말을 정확히 인식하는 것은 물론, 발음과 강세 표현까지 세부적인 평가가 이뤄져 외국어를 혼자서도 효과적으로 학습할 수 있도록 돕는다. 이르테크는 연구진이 개발한 기술을 이전받아 올해 7월, 한국어 교육 서비스 코코아(KOKOA) 앱을 출시했다. 해당 앱은 출시 2개월 만에 1만 명 이상 외국인이 내려받을 정도로 파급력이 높았다. 해당 앱은 교재형 학습 콘텐츠를 기반으로 챗봇과 함께 대화를 연습할 수 있도록 이뤄져 있다. 교재는 생활 한국어 등으로 이뤄진 유·무료 초급자용 90개 단원으로 구성되어 있다. 향후에는 캐릭터 콘텐츠와 단계별 학습자료를 추가해 더 재미있고 심도 있는 서비스가 이뤄지도록 할
헬로티 함수미 기자 | 셀바스 AI가 AI 의료 음성인식 솔루션 ‘셀비 메디보이스(Selvy MediVoice)’ 클라우드 서비스 사이트를 새롭게 오픈했다고 밝혔다. 셀비 메디보이스 클라우드 서비스는 초기 서비스 도입 비용 부담 없이 하나의 라이선스로 모든 기능을 의료진당 월정액으로 언제, 어디서나 편리하게 이용할 수 있다. 셀비 메디보이스 사용으로 의무기록 입력 속도와 정확성이 증가하고 있으며, EMR, PACS 등 병원 시스템에 자동 저장되어 업무 효율은 개선, 수정작업은 간소화되는 등 시간 단축을 시켜준다. 또한 간편한 방법으로 병원 데이터를 보관 및 백업할 수 있으며, 병원 인프라가 변경되더라도 시스템 재구축 및 DB 이관 등의 과정이 필요 없다. ‘셀비 메디보이스’는 인공지능 기반의 음성인식 엔진을 탑재한 국내 최초 AI 의료 음성인식 솔루션이다. 영상의학과, 핵의학과, 소화기내과 등 분과별 의학용어를 학습해 98% 이상의 높은 인식 성능을 자랑한다. AI 의료 음성인식 솔루션 ‘셀비 메디보이스’를 통해 의료진들은 엑스레이, MRI, CT, PET-CT와 같은 다양한 의료 영상 판독 과정에서 실시간으로 음성인식, 자동 텍스트 변환, 의무기록 저장,
헬로티 함수미 기자 | 셀바스 AI는 2021년 2분기 별도 기준 매출액 43억 원을 달성하며 전년 동기 대비 58% 성장했다고 17일 공시를 통해 밝혔다. 영업이익은 9억 원으로 흑자전환했으며, 2017년 이후 4년 만에 분기 영업이익률 20%를 돌파했다. 연결기준으로도 매출액 110억 원, 영업이익 16억 원을 기록하며 지난해 같은 기간 대비 대폭 성장했다. 상반기 누적 실적 성적도 별도기준 매출액과 영업이익은 84억 원, 14억 원으로 각각 52% 상승, 흑자전환을 기록했다. 연결 실적 역시 매출액은 196억 원으로 28% 올랐고, 영업이익은 3억 원을 달성하며 흑자로 전환했다. 셀바스 AI에 따르면 ▲음성인식을 비롯한 HCI 분야의 안정적 매출 성장 ▲다양한 AI 융합 제품의 신규 매출 성장이 호실적에 기여했다고 밝혔다. 음성인식 솔루션은 국내 최고의 음성 인식률로 통신, 금융, 유통 등 고객 접점 서비스가 필요한 분야를 넘어 의료, 자동차 분야까지 적용 범위가 확대되고 있다. 특히 전체 매출의 70% 이상이 솔루션과 제품 매출로 구성되어 실적의 안정성과 지속 성장성, 수익성 개선을 모두 갖춘 선순환 효과가 지속되고 있다. 한국신용정보원 자료에 의하면
헬로티 함수미 기자 | 딥브레인AI는 자사의 논문이 국제 컴퓨터 비전 학회 2021과 인터스피치 2021에 각각 한 편씩 채택됐다고 17일 밝혔다. 이번 최상위 국제 인공지능 학회의 논문 채택으로 세계적인 인공지능 기술력을 다시 한번 입증했다고 딥브레인AI는 전했다. 국제 컴퓨터 비전 학회 논문에는 세계 최대 규모의 한국인 딥페이크 탐지 데이터세트 구축 과정에 대한 상세한 설명이 담겼다. 단일 딥페이크 탐지 데이터세트를 학습한 인공지능은 현실 세계의 딥페이크에 대응하기 어렵고, 서로 다른 특징을 갖는 다양한 데이터세트에 대한 학습이 필요하다는 점을 실험을 통해 보여준다. KoDF(Korean DeepFake Detection Dataset)라고 이름 붙인 이 데이터세트는 총 403명, 약 24만 개의 원본 및 딥페이크 동영상을 포함하며, 참가자들의 명시적인 이용 동의를 받아 수집됐다. 딥페이크 동영상은 6종의 최신 딥 러닝 동영상 합성 기술을 사용해 만들어졌으며, 딥페이크 탐지를 어렵게 만드는 적대적 공격 기법을 적용한 데이터를 포함한다. 인터스피치 논문에는 음성 합성을 위한 적대 생성 신경망 기반의 보코더 기술에서 다중 해상도 판별자의 역할이 중요하다는 점
헬로티 함수미 기자 | 셀바스 AI는 한양대학교병원 영상의학과 및 핵의학과에서 AI 의료 음성인식 솔루션 ‘셀비 메디보이스(Selvy MediVoice)'를 도입했다고 밝혔다. 셀비 메디보이스는 인공지능 기반의 음성인식 엔진을 탑재한 국내 최초 AI 의료 음성인식 솔루션이다. 분과별 의학용어를 학습해 98% 이상의 높은 인식 성능을 보이며, 실 데이터 기반의 딥러닝을 통해 의료진 각각의 발음 특성을 학습해 사용할수록 인식률은 향상된다. 또한 음성으로 말하는 의학용어 중 한국어, 영어, 숫자, 기호 등이 혼용된 문장도 오타 없이 정확하게 인식한다고 셀바스 AI는 밝혔다. 디지털 기반 스마트병원 추진 전략 아래 인공지능 의료 솔루션을 적극적으로 도입 중인 한양대학교병원은 영상의학과뿐만 아니라 핵의학과에서도 셀비 메디보이스 사용을 결정했다. 해당 과 의료진들은 엑스레이, MRI, CT, PET-CT와 같은 다양한 의료 영상 판독 과정에서 직접 ‘셀비 메디보이스’를 통해 실시간으로 음성인식, 자동 텍스트 변환, 의무기록 저장, 병원 정보시스템 자동 등록이 가능하다. 셀비 메디보이스는 의무기록을 음성인식으로 실시간으로 작성할 수 있어 의사 1명당 평균 의무기록지 작성
헬로티 김진희 기자 | 과거 속도 경쟁에 치중했던 엘리베이터 산업은 인공지능을 비롯한 4차산업혁명 기술의 발달과 함께 e-모빌리티로 진화하면서 새로운 사업 기회가 확대되고 있다. 음성과 휴대전화를 통해 접촉 없이 엘리베이터를 이용하는 것은 물론 자율주행 로봇이 스스로 엘리베이터를 타고 고객이 원하는 곳까지 택배·음식을 배달하는 고객 접점의 서비스를 비롯해 데이터 분석을 통한 운행 효율 증대 및 선제적 유지 관리와 보안에 이르기까지 다양한 부문에 IT 기술이 적용되고 있다. 현대엘리베이터와 KT가 지난 29일 광화문 KT 사옥에서 ‘엘리베이터 DX(디지털 혁신) 확장 사업을 위한 양해 각서(MOU)’를 체결했다고 밝혔다. 양 사가 보유한 기술 교류를 통해 엘리베이터와 인공지능(AI), 음성 인식, 자율주행 로봇을 연계한 신사업을 추진하기로 했다. 현대엘리베이터 송승봉 대표이사는 “엘리베이터와 IT 기술 융합으로 고객에게 효율성과 편리성·안전성을 제공하는 미래 엘리베이터(Vertical e-Mobility) 제품 및 서비스 개발을 추진하고 있다”며 “이는 그간 정체했던 승강기 산업에 새로운 전환점이 될 것”이라고 말했다. KT 박종욱 경영기획부문장은 “업계 1위
[헬로티] LG CNS가 AI 영어 학습 서비스 'AI 스피크 튜터'로 일본 교육 시장에 진출한다. ▲LG CNS 직원이 일본에서 출시한 'AI 스피크 튜터'를 선보이고 있다. AI튜터는 국내 약 60만 명의 사용자가 이용하고 있는 AI 기반 스마트폰 앱이다. LG 계열사 및 대기업을 포함한 약 150개 기업에서 임직원 영어교육 프로그램으로 활용하고 있다. LG CNS는 자체 개발한 AI 회화 알고리즘과 음성 인식 기술을 바탕으로 일본을 비롯해 해외 시장 공략을 본격화할 방침이다. 이에 12일인 오늘 일본 현지 기업 이온과 손잡고 일본판 AI 튜터인 AI 스피크 튜터를 출시했다. 이온은 KDDI 그룹의 자회사로 일본에서 250여개의 직영 어학원을 운영하는 일본의 유명 어학업체다. KDDI 그룹은 일본의 2위 통신회사다. 이온은 기존 수강생을 대상으로 AI 스피크 튜터를 선공개한다. 다음달부터는 일반인도 ‘AI 스피크 튜터’를 스마트폰 어플리케이션 스토어에서 다운로드 받아 사용할 수 있다. LG CNS는 일본 시장 공략을 위해 현지화 전략을 펼쳤다. 기존의 AI튜터 학습 콘텐츠를 단순히 일본어로 번역한 게 아닌 일본의 다양한 특성을 반영해
[헬로티] 셀바스 AI가 사업분야 진출 확대를 통해 2021년 높은 성장을 예고했다. ▲셀바스 AI 통합 인공지능 브랜드 Selvy 대화형 음성인식 키오스크, 자동차용 음성인식 기술이 대중화되며 말 그대로 기기와 인간이 대화하는 시대가 도래함에 따라, AI과 음성인식 관련 전문 기술력을 보유한 셀바스 AI 사업의 성장세가 눈에 띈다. 특히 음성인식 기술이 인공지능과 결합하며 음성비서, 컨택센터, 의료 분야를 넘어 자동차 분야까지 활용도가 확대됨에 따라 관련 매출액은 지난해 대비 30% 이상 고성장할 것으로 기대된다. 셀바스 AI는 HCI 분야 연구 · 개발 업력 22년 차의 국내 1호 인공지능 전문 상장기업이다. HCI는 ‘Human Computer Interaction’의 약자로 인간과 컴퓨터의 상호작용을 어떻게 하면 더 쉽고 편하게 할 수 있는가를 연구하는 학문이자 기술이다. HCI 기술의 필요성이 하드웨어 기기를 넘어 서비스, 소프트웨어 분야로 확대됨에 따라 셀바스 AI의 HCI 기술 및 AI 기술을 융·복합한 인공지능 제품에 대한 중요성 및 활용성이 더욱 커지고 있다. HCI 분야의 핵심은 음성인식, 음성
[헬로티] 아틀라스랩스는 통화 데이터를 실시간 텍스트로 기록해주는 인공지능(AI) 전화 ‘스위치’가 정식 출시된다고 밝혔다. ▲AI 전화 '스위치' 화면 통화 내역을 손쉽게 녹음하고 텍스트로 저장할 수 있는 AI 전화 ‘스위치(Switch)’의 iOS 버전을 공식 런칭한다고 5일 밝혔다. 앱스토어를 통해 다운로드 받을 수 있으며 안드로이드 버전도 잇따라 출시할 예정이라고 전했다. 이번 스위치 iOS 정식 버전은 기본 전화 기능은 물론 전화 녹음, 통화 내용의 실시간 대화형 문자 기록, 통화 기록 조회 및 분석까지 지원한다. 단순히 통화 내용을 녹음하는 것에 그치는 것이 아닌, 효율적인 전화 업무를 돕는 음성 데이터까지 하나의 앱으로 관리할 수 있다. 모바일 앱과 연동되는 웹 서비스 ‘스위치 커넥트(Switch Connect)’를 활용한 PC에서의 통화 관리 기능도 추가됐다. 스위치 앱과 웹 서비스가 실시간으로 연동돼 태그, 메모, 즐겨찾기, 통화 내용 검색 및 재생, 전화 녹음 음성 및 텍스트 파일 다운로드 등의 기능을 이용할 수 있다. 아틀라스랩스는 AI 전화라는 새로운 지평을 연 스위치의 정
[헬로티] 안양창조산업진흥원(원장 김흥규)에서 청년창업기업 생태계 완성을 위한 ‘2020 청년창업 스케일업 안양’ 지원을 통해 육성중인 브이에스커뮤니티(대표 이환행)가 ‘음성인식 AI스피커 기반 맞춤형 도서 추천 서비스’를 개발하여 출시에 임박했다. 브이에스커뮤니티는 ‘도서정보 알림톡’ 서비스를 국내 최초로 개발하여 약450개 이상의 공공도서관에 서비스를 제공하는 도서 서비스 전문기업으로, 이번에 개발한 서비스는 사용자와 같은 성별, 세대들이 이용한 도서정보를 빅데이터로 분석하여 스마트TV 또는 연결된 차량 등에서 음성명령으로 추천받을 수 있다. ▲ 브이에스커뮤니티에서 제공하는 서비스 이미지 음성AI 서비스는 단말로 음성 명령을 인식해 각종 서비스에 접목할 수 있는 장점 때문에 이미 8년 전부터 구글, 아마존과 같은 글로벌 자이언트 기업들은 물론 삼성전자, 현대기아차그룹, 네이버, 카카오, SK텔레콤, KT 등 국내 선두 기업들이 연계 서비스가 가능한 콘텐츠 확보 및 생태계 조성에 활발한 동향을 보일만큼 유망한 사업 분야로 관련 시장이 가파르게 성장 중이다. 이환행 브이에스커뮤니티 대표는 &ld
[헬로티] 셀바스 AI의 음성합성 기술이 현대오토에버의 홈 IoT 플랫폼 서비스 중 하나인 ‘보이스홈(Voice-Home)’에 사용된다. 보이스홈을 통해 셀바스 AI의 기술은 현대건설이 시공한 힐스테이트 리버시티에 상용화되며 향후 ‘홈 IoT 통합 솔루션’으로 거듭날 전망이다. ▲ 셀바스 AI의 음성합성 기술이 현대오토에버의 보이스홈(Voice-Home)’에 사용된다. (사진 : 셀바스 AI) 보이스홈에 적용 된 셀바스 AI의 음성합성 기술은 세대 보일러 온도와 지역 미세먼지 상태 확인, 음성 알람 기능, 조명 및 난방, 에어컨 등 빌트인 기기의 서비스 알림 제어 기능에 사용된다. 또, 외출 시 엘리베이터 호출 및 ‘외출 모드’ 설정에 따른 조명, 빌트인 에어컨, 대기 전력차단용 콘센트 제어, 가스 밸브 차단 등 진행 상태 등도 음성으로 안내 받을 수 있다. 셀바스 AI의 음성합성 기술 ‘Selvy TTS’는 보이스홈 적용 핵심 기술 중 하나로 문자정보를 분석하여 자연스러운 사람의 음성으로 바꾸어 들려주는 기술이다. Selvy TTS 는 인공지능 기반 딥러닝 기술
[첨단 헬로티] 반도체 및 전자부품을 공급하는 공인 유통기업 마우저 일렉트로닉스가 NXP 반도체의 i.MX RT106L과 i.MX RT106F를 공급한다고 밝혔다. 솔루션별 EdgeReady 장치에는 다양한 사물 인터넷(IoT)과 스마트 산업 설계에서 각기 우수한 로컬 명령 음성 애플리케이션과 얼굴 인식을 위한 실시간 응답을 제공하기 위해 최대 600 MHz로 작동하는 Arm Cortex-M7 코어가 탑재되어 있다. 개발자들은 마우저 일렉트로닉스에서 공급하는 i.MX RT106L 크로스오버 프로세서를 통해 다양한 IoT, 스마트 소매 및 스마트 산업 기기에 원거리 로컬 명령 기반 음성 제어 기능을 쉽고 저렴하게 추가할 수 있다. i.MX RT106L 프로세서는 아날로그 프론트엔드 DSP, 미디어 플레이어 및 스트리밍 기기를 포함하는 자동 음성 인식 솔루션과 로컬 명령 및 웨이크 워드용 자동 음성 인식 엔진을 위한 NXP의 턴키 솔루션 세트를 제공한다. 이 프로세서는 OEM이 낮은 대기 시간의 개인 음성 제어 기능을 지원하는 제품의 신속 개발을 지원하는 완전하게 통합된 하드웨어 및 소프트웨어 솔루션인 로컬 음성 제어용 SLN-LOCAL-IOT 솔루션에 통합되어
[첨단 헬로티] 네이버가 세계적인 수준의 자체 음성 기술 연구 성과를 바탕으로, 한 단계 진화한 음성인식 엔진 ‘NEST’(Neural End-to-end Speech Transcriber)를 공개했다. ‘NEST’는 제한된 데이터 학습만으로도, 복잡하고 다양한 장문의 음성 표현을 정확하게 인식하고, 텍스트로 변환할 수 있는 기술이다. 대량의 정제된 데이터를 사전에 학습하지 않고도, 예상치 못한 표현에 대해 정확한 음성인식이 가능한 것이 장점이다. 음향 정보와 언어 정보를 별도로 학습하는 기존의 모델링 방식을 통합 모델링 방식(end-to-end)으로 개선해, 학습에 필요한 데이터의 양과 시간은 기존의 1/10 수준으로 단축시키면서도, 인식의 정확도는 오히려 높였다. 네이버의 새로운 음성인식 기술은 AI가 전화로 코로나19의 능동감시자를 확인하는 ‘클로바 케어콜’ 서비스에 적용되어 있으며, 지난 1월에는 네이버 동영상 뉴스의 자동 자막 서비스에도 도입된 바 있다. 네이버는 'NEST' 기술을 적용한 자동 자막을 다양한 동영상 및 오디오 서비스로 확대하고, 동영상 검색 및 에디터에도 해당 기술을