DATA PIPELINE ARCHITECTURE

AI 리스크 데이터 파이프라인 구축

비정형 텍스트(Text)의 정량 데이터(DB) 전환 및 자산화

AS-IS (기존의 한계)
  • 텍스트(Text) 위주 보고로 데이터 활용 및 분석 불가
  • 현장 경험이 축적되지 않고 휘발성 정보로 소멸
  • 사후 보고 중심의 'Club' 성격, 미래 리스크 예측 불가능
TO-BE (솔루션)
  • 현장 데이터를 실시간 DB(자산)로 영구 축적
  • AI 기반 44종 공종/리스크 자동 라벨링(Labeling)
  • 축적된 데이터를 통한 리스크 시뮬레이션/예측 기반 마련
Data Processing Workflow
📝
데이터 수집 (Input)
모바일 접근성 극대화
현장 입력 장벽 제거
⚙️
데이터 정제 (Preprocessing)
비정형 텍스트를
분석 가능한 코드로 변환
알고리즘 분석 (Analysis)
발생가능성 x 영향도
리스크 스코어링
📊
인사이트 시각화 (Viz)
대시보드 연동을 통한
선제적 의사결정 지원
Key Performance Indicators
100% 데이터 자산화 경험(Text) → 지식(DB) 전환
44 Types 표준 분류 체계 AI 학습용 데이터셋 확보
99% 정보 지연(Latency) 해소 주 단위 → 실시간 동기화
Prediction 예측 모델 기반 사후약방문 → 선제대응
Core Logic & Value
A
비정형 데이터의 정량화
(Data Labeling)
현장의 비정형 텍스트(Text)를 Gemini LLM이 분석하여 44개 표준 공종 코드로 자동 매핑합니다. 휘발되던 현장 경험을 AI 학습이 가능한 정형 데이터셋(Dataset)으로 실시간 변환합니다.
B
리스크 평가 알고리즘
(Scoring Model)
단순 보고를 넘어, 영향도(Impact)와 발생 가능성(Probability) 기반의 자체 평가 로직을 적용하여 리스크를 점수화합니다. 정량적 데이터를 근거로 고위험 이슈를 식별합니다.
C
데이터 기반 의사결정
(Data-Driven Decision)
경험과 감에 의존하던 리스크 관리를 데이터 기반 체계로 전환했습니다. 축적된 리스크 패턴 데이터를 시각화하여, 사후 대응이 아닌 선제적 예측 관리가 가능합니다.