2025.09.05 (금)

  • 구름많음동두천 29.3℃
  • 맑음강릉 33.1℃
  • 구름많음서울 29.7℃
  • 구름조금대전 30.6℃
  • 구름조금대구 30.8℃
  • 맑음울산 31.3℃
  • 구름조금광주 30.5℃
  • 맑음부산 31.2℃
  • 맑음고창 31.0℃
  • 맑음제주 31.5℃
  • 구름많음강화 28.8℃
  • 구름조금보은 27.9℃
  • 맑음금산 29.4℃
  • 구름조금강진군 30.8℃
  • 맑음경주시 31.7℃
  • 구름조금거제 30.6℃
기상청 제공
검색창 열기

IT·통신

더 많은 데이터 줄게, 더 똑똑해져라! 인공지능 학습용 데이터, 역대 최대 규모로 개방한다.

-‘22년도 구축 데이터 310종, 오늘부터 7월말까지 매달 약 80여종씩 순차개방
-기존 6대 분야에서 제조‧로보틱스 등 14대 분야 691종으로 데이터 다양화
-AI허브(aihub.or.kr)에 회원가입만 하면 국민 누구나 활용할 수 있어

과학기술정보통신부(장관 이종호, 이하 ‘과기정통부’)와 한국지능정보사회진흥원(원장 황종성, 이하 ‘지능정보원’)은 ’22년도에 「인공지능 학습용 데이터 구축사업」을 통해 구축한 학습용 데이터셋 310종을 오늘부터 7월말까지 ‘AI허브(aihub.or.kr)’를 통해 순차적으로 개방한다고 밝혔다.

 

 동 사업은 전문영역부터 일상생활까지 전분야로 확산되고 있는 인공지능 기술개발과 지능화 서비스 확산을 선도하기 위한 국가 핵심 데이터 인프라 사업이다. 기업, 연구자, 개발자는 물론 인공지능 개발 등에 관심 있는 우리 국민이라면 누구나 ‘AI허브’를 통해 학습용 데이터를 활용할 수 있다.

 

 과기정통부와 지능정보원은 2020년부터 본격적으로 민간‧공공 수요 등에 맞춰 매년 약 2백 종의 데이터를 구축해 왔다. 전년도 구축 데이터는 당해연도 품질검증 등을 거쳐 개방하는데, 지금까지 개방된 데이터는 한국어, 이미지‧영상, 헬스케어 등 6대 분야 381종, 약 11억 건에 이른다. 지난해 7월에는 190종의 데이터를 개방하면서, ‘AI허브’ 연간 방문자 수가 최초로 1백만 명을 돌파했다.

 

  올해 개방하는 데이터는 310종으로 역대 최대 규모이다. 지난해 구축 분야를 6대 분야에서 제조‧로보틱스‧교육‧금융‧스포츠 등의 14대 분야로 확장하면서 사업 규모를 크게 늘렸기 때문이다. 이번에 310종 약 15억 건의 데이터 개방을 완료하면 ‘AI허브’ 이용자들은 총 691종, 약 26억 건의 데이터를 활용할 수 있게 된다. 특히 올해는 대규모 개방인 점을 고려하여, 이용자들이 더 많은 데이터를 조금이라도 빨리 활용할 수 있도록 품질검증 등을 먼저 마친 데이터를 우선 개방한다. 이에 따라 초기 개방 시점은 지난해 보다 3개월 앞당겨진다. 매달 약 80여 종 내외를 개방하여 7월말까지 전체 310종의 개방을 완료할 계획이다.

 

 

 이번 1차 개방에는 자연어 기반 질의‧검색‧생성 데이터, 고서(古書)한자‧한글 등 광학인식(OCR) 데이터, 안전환경 조성을 위한 실내외 군중 특성 데이터, 소방대원 행동 모션 3차원(3D) 객체 데이터 등 자연어와 인공지능 비전 분야에서 광범위하게 활용될 수 있는 약 70종의 데이터가 포함되어 있다. 

 

  한편 ‘AI허브’에 공개되는 데이터들은 국제 표준에 맞는 품질기준을 달성하고 개인정보 비식별화를 거친 경우에 한하며, 기업‧기관들이 실제 사용하고 있는 인공지능 모델에 직접 데이터를 학습시켜 유효성, 정확성 등을 확인하는 활용성 검토를 받는다. 또한 개방 이후 약 3개월 동안은 사용자들로부터 데이터 품질 요구사항, 오류 등의 의견을 반영하여 데이터 품질 제고를 위한 보완 과정을 거칠 예정이다.

 

 엄열 인공지능정책관은 “챗GPT 등 초거대 인공지능의 등장으로 인공지능 산업이 빠르게 발전하고 있다.”며 “우리 기업들과 연구자들이 새로운 데이터 확보에 어려움을 겪지 않도록 기존의 라벨링 데이터(지도학습용) 중심의 사업을 개편하여 초거대 인공지능 학습에 필요한 대규모 비라벨링 데이터와 한번에 여러가지 유형을 학습시킬 수 있는 다중임무형 라벨링 데이터 등 다양한 유형의 데이터를 지속 확보해 나갈 예정”이라고 밝혔다.


농업

더보기
콩 개화기 이후 병해충 관리 힘써야
농촌진흥청(청장 이승돈)은 꼬투리가 자라고 콩알이 차오르는 생육 후기에 수량과 품질에 큰 영향을 주는 병해충 특징을 소개하며, 철저한 관리가 필요하다고 당부했다. 9월 기온은 평년보다 높고 강수량이 많을 것으로 전망됐다. 이러한 기상 조건은 콩 생육 후기와 맞물려 병해충 발생을 유발할 수 있다. 특히 탄저병, 미라병, 자주무늬병과 같은 주요 병과 노린재류 해충은 심하면 수량을 크게 떨어뜨리기 때문에 사전 방제가 관건이다. (병 관리) 자주무늬병은 잎이 진한 보라색으로 변하며, 크기와 형태가 일정하지 않은 병반이 나타난다. 감염된 종자는 자줏빛을 띤다. 주로 온습도가 높은 환경에서 발생하며, 초기 발생 시 등록된 약제를 살포하면 피해를 줄일 수 있다. 탄저병은 줄기나 꼬투리에 불규칙한 갈색 반점이 생기며, 콩알이 작아지고 변색한다. 심하면 썩거나 콩알이 맺히지 않아 수확량이 감소한다. 항공방제 전용 약제가 등록돼 있어 무인 항공기 방제가 가능하다. 미라병은 따뜻하고 습한 환경에서 발생해 잎과 꼬투리, 줄기 등 다양한 부위에 감염된다. 줄기에는 작은 검은 점이 한 줄로 생기고, 종자는 회백색으로 변하면서 갈라지거나 모양이 길게 변한다. (해충 관리) 노린재류는

축산

더보기
축산물품질평가원, 한우 생산성·유전능력 분석 서비스 매뉴얼 발간
축산물품질평가원(원장 박병홍)은 9월 3일, 과학적 사양관리를 통한 한우 생산성 향상을 위해 ‘한우 생산성·유전능력 분석 서비스 이용 매뉴얼’을 새롭게 발간했다. 매뉴얼은 한우 개체별 수익성과 유전능력 정보를 농가에서 데이터를 기반으로 분석하고 활용하는 방법을 담고 있어 현장 활용도가 높을 것으로 기대된다. 농가는 생산성 분석을 통해 개체별 수익, 출하 시기별 월평균 수익 등을 확인할 수 있어 소의 적정 출하 시기를 파악해 수익을 극대화할 수 있다. 또한, 유전능력 분석으로 사육·출하 개체의 도체중, 근내지방도 등 핵심 형질별 유전능력을 실시간 비교하고 개량이 필요한 부분을 파악해 사육 기간 단축을 통한 경영비 절감 효과 또한 얻을 수 있다. 축산물품질평가원은 이번 매뉴얼이 농가의 데이터 기반 경영을 확대해 단기적으로는 생산비 절감과 소득 증대 효과를, 장기적으로는 개량 효과를 극대화할 것이라 기대하고 있다. ‘한우 생산성·유전능력 분석 서비스 이용 매뉴얼’은 ‘축산물 원패스’ 누리집에서 내려받을 수 있다. * 축산물 원패스 누리집 바로가기:www.ekape.or.kr/kapecp 축산물품질평가원 박병홍 원장은 “한우산업의 지속 가능한 발전을 위해서는 데이터

식품

더보기
국산콩으로 농가는 살리고 어르신 건강은 지킨다!
농림축산식품부(장관 송미령)와 한국농수산식품유통공사(aT, 사장 홍문표)는 4일 전북 전주시 평화사회복지관을 찾아 사단법인 식생활교육국민네트워크(상임대표 권순실)가 진행하는 ‘국산콩 활용 고령층 영양개선 캠페인’ 현장을 점검하고 참가자들을 격려했다. 이번 캠페인은 고령층의 단백질 등 필수 영양소 섭취 부족 문제를 개선하고, 국산콩 소비를 확대하기 위해 8월부터 전국 복지관, 경로당, 마을 회관 등에서 추진되고 있다. 참가자들은 국산콩과 수입콩의 차이를 이해하고 국산콩 제품의 조리 체험, 두부·된장·두유·콩밥 등 다양한 국산콩 레시피를 일상 식단에 활용하는 방법을 배운다. 아울러 aT도 풀무원식품, 이롬, 맑은물에, 건국유업 등 주요 국산콩 식품제조 업체와 함께 국산콩 두유, 두부, 과자류 등 시식·시음 물품도 제공해 참가자들이 손쉽게 국산콩 제품을 접하고 건강한 식생활을 이어가도록 지원하고 있다. 현장을 찾은 aT 문인철 수급이사는 “국산콩은 어르신의 건강을 지켜주는 든든한 영양 보물창고”라며, “오늘 교육처럼 콩을 맛보고 배우며 생활 속에서 실천하는 노력이 어르신들의 건강과 농가의 희망을 함께 키워 나가는 길”이라고 말했다. 한편 농식품부와 aT는 10월까

산림

더보기
기후변화 재난, 산림유량관측망 구축으로 대비한다
산림청 국립산림과학원(원장 김용관)은 극한 호우에 따른 산지재난에 대응하기 위해 2031년까지 8년간 전국 400개소에 산림유량관측망을 구축한다고 밝혔다. 산림유량관측망은 산지 유출수의 변화를 실시간으로 관측하는 시스템으로, 기후변화에 대응해 홍수, 가뭄, 산사태 등 물 관련 산지재난의 발생 특성을 분석, 예측하는 기능을 수행한다. 국립산림과학원 생활권도시숲연구센터 연구진은 최근 우리나라 산림유역에 적합한 홍수도달시간 산정식을 개발해 산지 홍수 예측 정확도를 높였다. 홍수도달시간은 가장 높은 강우량 시점에서 수위가 가장 높아진 시점까지 걸리는 시간으로, 일반적으로 짧을수록 재해에 취약하다. 특히 산지에서 실시간 유량변화를 확보하는 것은 지역의 산지재난 발생 위험성을 해석하는 데 중요하다. 이번에 새롭게 추진되는 산림유량관측망 구축은 한국형 실시간 정밀 유량관측을 가능하게 해, 산지재난 대응의 정확도를 높이는 기반이 될 것으로 기대된다. 해당 연구결과는 산림과학 국제학술지인 「Forests」에 2024년 게재되어 학술적 가치를 인정받았다. 산림청 국립산림과학원 생활권도시숲연구센터 박찬열 센터장은 “산림유량관측망 구축으로 산지재난을 보다 정밀하게 관측할 수 있을