제조 현장에 인공지능(AI) 활용이 확산하면서 산업 데이터 플랫폼 시장도 커지고 있다. 생산 설비와 센서에서 발생하는 방대한 데이터를 저장하는 것을 넘어 AI가 분석할 수 있는 형태로 관리하는 기술이 중요해졌기 때문이다.
AI 제조 솔루션 기업 세인티(Sainti Inc.)도 최근 산업 데이터 AI 플랫폼 'SM-DataCore'를 선보이며 시장 공략에 나섰다.
11일 과학기술정보통신부의 ‘2025 데이터산업현황조사’에 따르면 2025년 국내 데이터산업 시장 규모는 33조2269억원으로 추정된다. 전년보다 5.2% 커진 수준이다. 제조 현장에서도 데이터 활용 수요가 뚜렷하다.
중소벤처기업부와 스마트제조혁신추진단의 ‘2024년 스마트제조혁신실태조사’에 따르면 스마트제조혁신을 추진하는 주요 목적은 생산 효율성 향상(56.5%), 품질 관리 개선(37.1%), 비용 절감(22.7%) 순이었다.
스마트공장은 생산 설비와 센서, 제어장치에서 나오는 데이터를 실시간으로 모은다. 온도, 압력, 진동, 전력 사용량, 불량률 같은 값은 모두 시간과 함께 쌓인다. 이런 데이터는 일반 업무용 데이터와 성격이 다르다. 초 단위, 때로는 그보다 짧은 주기로 계속 들어오고, 조회 역시 특정 시간 구간을 기준으로 이뤄진다.
기존 관계형 데이터베이스(RDBMS)는 거래·고객·문서처럼 구조화된 업무 데이터를 처리하는 데 강점이 있다. 반면 제조 설비 데이터는 쓰기 빈도가 높고 시간순 누적량이 크다. 이 때문에 시간을 축으로 데이터를 저장·조회하도록 설계된 시계열 데이터베이스(TSDB)가 산업 데이터 처리의 핵심 인프라로 자리 잡고 있다.
시계열 데이터베이스는 대량의 센서 데이터를 빠르게 적재하고, 압축해 저장 공간을 줄이며, 특정 시간대의 이상 징후를 빠르게 찾아내는 데 특화돼 있다. 설비 예지보전, 품질 분석, 에너지 관리, 공정 최적화 같은 제조 AI 서비스도 이 기반 위에서 작동한다.
세인티가 공개한 SM-DataCore는 고성능 시계열 데이터베이스와 지능형 산업 데이터 관리 플랫폼을 결합한 제품이다. 회사는 이 플랫폼을 단순 저장소가 아니라 AI 분석을 위한 산업 데이터 허브로 설명한다.
세인티에 따르면 SM-DataCore는 기존 시계열 데이터베이스 대비 최대 10배 빠른 읽기·쓰기 성능을 제공한다. 압축 기술을 통해 저장 공간을 최대 10분의 1까지 줄이고, 수집 포인트 10만개 이상인 하이 카디널리티 환경에서도 안정적인 성능을 내도록 설계했다는 설명이다. 해당 성능 수치는 회사 발표 기준으로, 실제 현장 성능은 적용 환경에 따라 달라질 수 있다.
차별점으로 내세운 부분은 에이전틱 AI 기반 분석이다. 현장 담당자가 복잡한 SQL을 직접 작성하지 않아도 자연어로 데이터를 조회하고 분석할 수 있도록 한 것이 핵심이다. 예컨대 “지난 3개월간 3번 설비의 진동 이상이 발생한 시점과 생산 불량률을 비교해 달라”는 식의 질의가 가능하다는 설명이다.
국내 시계열 데이터베이스 분야에서는 마크베이스가 대표 기업으로 꼽힌다. 마크베이스는 산업용 IoT 데이터를 초고속으로 저장·조회·분석하는 데 초점을 맞춘 시계열 DBMS를 개발해왔다. 회사는 자사 제품이 TPCx-IoT 성능 평가에서 2019년 이후 상위 성능을 기록해왔다고 소개한다.
마크베이스는 제조·에너지·통신 등 대량 센서 데이터가 발생하는 산업 현장을 주요 시장으로 삼고 있다. 공식 자료에 따르면 롯데칠성음료는 음료 제조 공정의 센서 데이터를 저장·분석하는 데 마크베이스를 활용하고 있으며, 초당 최대 20만 데이터 포인트를 처리하는 사례도 제시돼 있다.
최근에는 AI 에이전트 시대에 맞춘 데이터베이스를 강조하고 있다. 마크베이스가 내세우는 방향도 세인티와 크게 다르지 않다. 빠른 저장 성능만으로는 충분하지 않고, AI가 곧바로 활용할 수 있는 데이터 원천을 제공해야 한다는 것이다.
해외에서는 아비바(AVEVA)의 PI 시스템이 산업 데이터 히스토리언 분야에서 오랜 기반을 갖고 있다. AVEVA PI System은 실시간 운영 데이터를 수집, 저장, 정규화, 시각화하는 운영 데이터 관리 소프트웨어다. 제조, 에너지, 유틸리티 등 규제와 보안 요구가 높은 산업 현장에서 활용돼 왔다.
인플럭스DB도 널리 알려진 시계열 데이터베이스다. InfluxData는 인플럭스DB가 고속·고해상도 데이터 스트림을 낮은 지연시간으로 저장·분석하도록 설계됐다고 설명한다. 오픈소스 기반과 클라우드 서비스를 함께 제공하는 점이 강점이다.
클라우드 진영에서는 AWS의 아마존 타임스트림이 있다. AWS는 타임스트림을 대규모 데이터 적재와 저지연 쿼리를 위한 완전관리형 시계열 데이터베이스로 제공하고 있다. 클라우드 기반 제조 데이터 분석을 원하는 기업에는 선택지 중 하나다.
산업 데이터 플랫폼 경쟁은 이제 저장 속도만의 싸움이 아니다. 데이터를 얼마나 표준화하고, 현장 맥락과 연결하며, AI 분석으로 이어지게 하느냐가 관건이다.
산업통상부도 제조 AI 확산에 속도를 내고 있다. 2024년 ‘AI 자율제조 얼라이언스’를 출범시키고 200대 선도 프로젝트를 추진하겠다고 밝혔다. 민관 합동 투자 규모는 2조5000억원 이상으로 제시됐다. 제조 AI가 정책 과제로 올라선 만큼, 현장 데이터를 다루는 플랫폼 수요도 함께 커질 가능성이 높다.
제조 현장의 데이터는 많지만 바로 쓸 수 있는 데이터는 많지 않다. 설비마다 형식이 다르고, 공장마다 기준도 다르다. 데이터가 있어도 품질과 맥락이 부족하면 AI 모델은 제대로 작동하기 어렵다. 산업 데이터 플랫폼 기업들이 저장소를 넘어 데이터 정리, 표준화, 자연어 분석, AI 에이전트 연계를 강조하는 이유다.
업계 관계자는 “제조 AI의 성능은 결국 현장 데이터의 품질에 달려 있다”며 “설비 데이터가 빠르게 쌓이더라도 형식이 제각각이고 맥락이 정리돼 있지 않으면 AI 분석에 바로 쓰기 어렵다”고 말했다.
이어 “앞으로는 데이터를 얼마나 많이 저장하느냐보다 이를 표준화하고, 현장 업무와 연결해 AI가 활용할 수 있게 만드는 역량이 플랫폼 경쟁의 기준이 될 것”이라고 했다.

