-
[매일경제] 2월 21일 기사 및 용어정리 (데이터라벨링 기업 / AI 학습용 데이터 / 크라우드소싱이란 / 추가경정예산이란)나의/시사공부 2021. 2. 21. 16:13반응형
매일경제를 읽으며 관심있는 기사내용을 요약 및 용어정리합니다
데이터 일꾼 공급하는 스타트업에…지원자 16만명 몰렸다
www.mk.co.kr/news/it/view/2020/06/653363/
1) 2017년 문을 연 데이터 라벨링 기업 `크라우드웍스`에 데이터 라벨러로 일하길 희망하는 지원자가 끊임없이
몰려들고 있다.
- 크라우드웍스는 크라우드 소싱 방식으로 지원자를 모집하는 데이터 가공 회사이다.
- 2017년 첫해 8000만원 수준이던 매출은 이듬해 8억원이 됐고 2019년 29억원,
올해는 100억원을 넘을 것으로 회사 측은 보고 있다.
크라우드 소싱이란 (crowdsourcing)
크라우드소싱은 외부자원인 대중들의 참여를 유도하고 지원하여 비즈니스로 활용하는 방법을 의미한다.
대중들의 아이디어를 모집하는 신사업 아이템 공모전이 그 예시가 된다.
2) 정부가 3차 추가경정예산 2925억원을 포함해 올해 총 3315억원을 데이터 라벨링 사업에 투입하기로 하면서
관련 생태계가 급성장할 것으로 전망된다.
- 한국정보화진흥원(NIA)에 따르면 정부는 3년간 총 21종, 4650만건을 공개했고, 개발자 4만4000여 명이
데이터 1만7000여 건을 활용해 지능화 서비스를 개발했다.
- 오는 7월 정부가 3년 간 AI 학습용 데이터를 대거 공개할 예정이며 데이터 관련 창업이 크게 늘어날 것으로 전망된다.
추가경정예산이란
기획재정부는 5월부터 각 부처의 의견을 듣고 다음 해에 꼭 추진해야 할 정책과 사업들을 점검한 뒤 9월 말까지
이듬해 예산안을 마련해 국회에 보고한다.
국회는 이를 바탕으로 본예산을 확정한다.
재정부는 확정된 본예산에 따라 각 부처에 돈을 나눠주고 쓰게 하는 예산 집행을 진행한다.
추가경정예산이란 국가 경제에 예상 못한 큰 일 닥쳤을 때 본예산에 금액 더해 추가예산을 짜는 것을 의미한다.
3) 최근 2~3년 AI 학습용 데이터를 가공하는 데이터 라벨링 등에 특화한 스타트업과
이를 활용해 신규 사업을 확장하는 기업들이 늘고 있다.
- 크라우드웍스를 비롯해 테스트웍스, 에이모, 셀렉트스타 등 80여 개 기업이 크라우드 소싱 방식으로
데이터 라벨링 사업을 하고 있다.
- 이상혁 엠폴시스템 본부장은 국내에는 실제 AI 알고리즘보다 응용 소프트업체가 많기 때문에 정부 계획처럼
정제된 데이터셋이 많이 공개된다면 초기 개발에 활용할 수 있어 기업의 신규사업 확장에 큰 도움이 될 것이라고 평가했다
AI 학습용 데이터와 빅데이터의 차이
빅데이터가 유동인구 데이터 등 일정한 모양의 데이터를 분석해 통찰력을 얻는 방식이라면,
AI 학습용 데이터는 다양한 모양의 데이터셋을 AI가 인식할 수 있도록 정제하는 방식이다.AI 학습용 데이터란
AI 학습용 데이터는 머신러닝, 딥러닝 등 AI 모델 학습을 위해 활용되는 데이터를 총칭한다.
원본 데이터와 원본 데이터에 활용 목적에 따라 표시 작업을 한 라벨링 데이터가 포함되며원본 데이터는 하나지만 라벨링 데이터는 사용 목적에 따라 다양한 형식으로 가공이 가능하다.
[활용]
AI 학습용 데이터는 목적에 따라 학습 데이터, 검증데이터, 평가 데이터로 구분해 활용된다.
학습 데이터는 알고리즘이 학습할 데이터로 모델 학습에 주가 되는 역할을 하며
검증 데이터는 학습 중간에 모델의 예측·분류 정확도를 계산하는 역할을 한다.
또 평가 데이터는 모델이 학습 과정에서 경험하지 못했던 데이터로 학습후 훈련한 모델의 성능을 평가하는 과정에서
사용된다.
출처 : 애플경제(http://www.apple-economy.com)
데이터 라벨링이란
4차 산업혁명 시대 새로운 일자리로 주목받는
데이터 라벨링이란 이미지, 영상, 텍스트 등의 데이터에 사람이 데이터 가공 도구를 활용하여
인공지능이 학습할 수 있도록 다양한 정보를 목적에 맞게 입력, 가공하는 것을 의미한다.
blog.testworks.co.kr/data-labeling/
[블랙올리브] Bounding Box 데이터 라벨링 작업 예시
반응형'나의 > 시사공부' 카테고리의 다른 글
[매일경제] 3월 12일 기사 요약 및 용어정리 (명목금리와 실질금리란 / 쿠팡 IPO 최고실적 / 실질금리와 금 값 / 스냅챗 주가상승 ) (0) 2021.03.12 [매일경제] 3월 3일 기사 요약 (통신 3사 원스토어 지분투자 / 데브온 NCD) (0) 2021.03.03 [매일경제] 2월 18일 기사요약 및 용어정리 (타다 금지법 / 모빌리티 서비스 사업) (0) 2021.02.18 [매일경제] 2월 17일 기사 및 용어정리 (삼성전자 인공지능 반도체 개발 / HBM-PIM) (1) 2021.02.17 [매일경제] 2월 16일 기사 및 용어정리 (주택 담보 대출 금리 / 코픽스 / 가중평균금리/ 실세금리 / 국고채금리 /여신상품 / 수신상품) (0) 2021.02.15