DATA PIPELINE ARCHITECTURE
AI 리스크 데이터 파이프라인 구축
비정형 텍스트(Text)의 정량 데이터(DB) 전환 및 자산화
AS-IS (기존의 한계)
텍스트(Text) 위주 보고로
데이터 활용 및 분석 불가
현장 경험이 축적되지 않고
휘발성 정보로 소멸
사후 보고 중심의 'Club' 성격,
미래 리스크 예측 불가능
TO-BE (솔루션)
현장 데이터를 실시간
DB(자산)로 영구 축적
AI 기반
44종 공종/리스크
자동 라벨링(Labeling)
축적된 데이터를 통한
리스크 시뮬레이션/예측 기반 마련
Data Processing Workflow
📝
데이터 수집 (Input)
모바일 접근성 극대화
현장 입력 장벽 제거
⚙️
데이터 정제 (Preprocessing)
비정형 텍스트를
분석 가능한 코드로 변환
⚡
알고리즘 분석 (Analysis)
발생가능성 x 영향도
리스크 스코어링
📊
인사이트 시각화 (Viz)
대시보드 연동을 통한
선제적 의사결정 지원
Key Performance Indicators
100%
데이터 자산화
경험(Text) → 지식(DB) 전환
44 Types
표준 분류 체계
AI 학습용 데이터셋 확보
99%
정보 지연(Latency) 해소
주 단위 → 실시간 동기화
Prediction
예측 모델 기반
사후약방문 → 선제대응
Core Logic & Value
A
비정형 데이터의 정량화
(Data Labeling)
현장의 비정형 텍스트(Text)를 Gemini LLM이 분석하여 44개 표준 공종 코드로 자동 매핑합니다. 휘발되던 현장 경험을 AI 학습이 가능한
정형 데이터셋(Dataset)
으로 실시간 변환합니다.
B
리스크 평가 알고리즘
(Scoring Model)
단순 보고를 넘어, 영향도(Impact)와 발생 가능성(Probability) 기반의
자체 평가 로직
을 적용하여 리스크를 점수화합니다. 정량적 데이터를 근거로 고위험 이슈를 식별합니다.
C
데이터 기반 의사결정
(Data-Driven Decision)
경험과 감에 의존하던 리스크 관리를
데이터 기반 체계
로 전환했습니다. 축적된 리스크 패턴 데이터를 시각화하여, 사후 대응이 아닌
선제적 예측 관리
가 가능합니다.