조달청 가격조사 PoC v0.1

조달청 가격조사 자동화 PoC

종합쇼핑몰 MAS 물품을 민간 시장가와 자동 비교해 우대가격 유지의무 위반을 탐지합니다.

활성계약 218건 인덱스 · AI 속성추출 218

1
수집
민간몰 가격·옵션 자동 수집
2
매칭
같은 상품 자동 식별
3
분석
AI가 가격·옵션 은폐 판단
4
증거
위반 의심 → 증거 보관

품목 선택 → 실제 동작 확인

PoC 우선순위 품목

6개

가격조사 자동화 PoC 핵심 대상 품목

43212105
27건
레이저프린터
전자/정보/통신/영상 › 프린터, 스캐너 및 소모품
27/27
추출 속성 ▾
제조사명 모델명/모델번호 인쇄 방식 (흑백/컬러) 인쇄 속도 (ppm 숫자만) 인쇄 해상도 (dpi) 양면인쇄 (자동양면/수동양면/미지원) 급지함 용량 (매 숫자만) 네트워크 (유선LAN/WiFi/없음) 스캐너 여부 (true/false) 팩스 지원 (true/false)
52141502
19건
가정용전자레인지
전자/정보/통신/영상 › 전자제품 및 주변기기
19/19
추출 속성 ▾
제조사명 모델명/모델번호 용량 (리터 숫자만) 출력 (W 숫자만) 종류 (전자레인지/오븐겸용/그릴겸용) 내부 재질 무게 (kg 숫자만) 외형 치수 (WxDxH mm)
43211503
50건
노트북컴퓨터
전자/정보/통신/영상 › 컴퓨터/노트북/태블릿
50/50
추출 속성 ▾
CPU 메모리용량 저장장치종류 저장장치용량 화면크기 해상도 운영체제 무게(kg) 그래픽카드 배터리(Wh)
43211902
45건
액정모니터
전자/정보/통신/영상 › 컴퓨터 주변기기
45/45
추출 속성 ▾
제조사명 모델명/모델번호 화면 크기 (인치 숫자만) 패널 종류 (IPS/VA/TN) 해상도 (예: 1920x1080) 주사율 (Hz 숫자만) 밝기 (nit 숫자만) 응답속도 (ms 숫자만) 입력 포트 (HDMI, DP 등) 스피커 내장 (true/false)
24112401
50건
도구보관캐비닛
사무/교육/가구 › 일반가구
50/50
추출 속성 ▾
제조사명 모델명/모델번호 본체 재질 (스틸/SUS 등) 외형 치수 (WxDxH mm) 선반 수 (숫자만) 서랍 수 (숫자만) 문 종류 (여닫이/미닫이 등) 잠금 장치 (열쇠/디지털/없음) 적재 하중 (kg 숫자만)
49201603
27건
레그프레스머신
운동기구 › 하체근력강화기
27/27
추출 속성 ▾
제조사명 모델명/모델번호 기구 종류 외형 치수 (LxWxH mm) 본체 무게 (kg 숫자만) 최대 하중 (kg 숫자만) 웨이트 스택 (kg 숫자만) 프레임 재질

종합쇼핑몰 분류 체계

대분류 › 중분류 › 품목

전체 분류 안에서 PoC 대상 품목 위치

📁 전자/정보/통신/영상
📂 컴퓨터 주변기기
📂 프린터, 스캐너 및 소모품
📁 전기/기계/설비
📂 냉난방기 및 보일러
📂 공기정화장비
📁 사무/교육/가구
📁 섬유/의류/생활
📂 주방기구 및 용품
📂 청소장비 및 용품
📁 소방/안전/의료
📂 의료기기 및 용품
📁 운동기구
📂 하체근력강화기

기타 PoC 품목

10개 · 우선순위 외 추가 품목

📋 방법론 검증 근거 — 왜 이 방식이 최적인가

핵심 결론·전체 아키텍처 (단계별 A/B/C 비교는 각 기능 화면에서)

펼치기 ▾
핵심 결론

사전학습 모델 추론 + 검색증강(RAG) — 모델 학습(파인튜닝) 없음

  • AI는 '학습'이 아니라 '추론'에만 사용 — 최신 사전학습 LLM이 분류·매칭·추출·판단에 충분(PoC 실증)
  • 도메인 특화는 파인튜닝 대신 RAG(벡터DB 지식)+규칙+사람검수로 — 모델은 그대로, 지식만 갱신
  • 학습 GPU·재학습 파이프라인·SPOF 제거 → 인프라 단순·저렴·안정
단계별 방안 비교 결과

상세 비교(A/B/C·비용·모델)는 해당 기능 화면에서 확인하실 수 있습니다.

  • 민간가격 수집 → A(가격 신호 수집) + C(의심 건만 옵션 검증) 하이브리드 수집 화면
  • 상품 동일성 매칭 → 다신호 매칭: 검색어 정규화 → 임베딩 유사도 → 모델일치/소모품 규칙 보정 수집 화면 · 후보 매칭
  • 규격서 속성 추출 → 규칙(0원) + 사전학습 LLM(추론) 하이브리드 — 파인튜닝 없이 프롬프트로 물품 상세 · 규격서
  • 옵션가 은폐·위반 판단 → 사전학습 sLLM 스크리닝 → 의심 건만 browser-use로 최종가 확정 수집 화면 · 판정
실제 구축 아키텍처 (2-Zone 망분리) — 보안·인프라 상세
   민간 온라인몰(다나와·에누리·네이버)            나라장터/MAS(품목·계약가)
            │ 인터넷 수집                                  │ 기준정보
            ▼                                              ▼
 ╔════════════════════ 외부 분석존 (G-Cloud · CSAP) ════════════════════╗
 ║ ① 수집   API 수집 + 브라우저 자동화 팜 + 프록시/봇차단 대응          ║
 ║ ② 정제   ETL 정규화·표준화(물품식별번호 매칭)                       ║
 ║ ③ 매칭   임베딩 매칭(사전학습) + 규칙   │  가격 이상탐지(통계·규칙)  ║
 ║ ④ LLM    ★사전학습 추론(학습X): 규격서추출·동일성·옵션은폐·협상지원  ║
 ║          + RAG(조달 지식 벡터DB) + Few-shot                        ║
 ║ 데이터   운영DB·벡터DB·시계열DB·데이터레이크·이미지                 ║
 ╚═══════════════════════════════╤═════════════════════════════════════╝
                  결과·증거 ──[망연계 / Data Diode 단방향]──▶
 ╔════════════════════ 내부 업무존 (조달청 내부망) ═════════════════════╗
 ║ 조사·환수 업무화면·결재  │  확정 DB  │  WORM 증거+TSA  │  MAS 연계   ║
 ╚══════════════════════════════════════════════════════════════════════╝
   [공통] WAF·IPS·DDoS·KMS / 모니터링·드리프트 / DR     ✗제외: 학습GPU·재학습