📁 Govern HWPX MOC

1. 프로젝트 목적 (Purpose)

  • HWPX Native Control: 개방형 문서 표준인 HWPX(Hancom Word Processor XML)를 코드로 직접 분석하고 수정하여, 한글 소프트웨어 없이도 대량의 정부 서식을 가공하거나 데이터를 추출.
  • Structural Automation: [[05 Projects/Beompis_G-Format_Protocol|Beompis G-Format]]으로 작성된 내용을 정규 HWPX 문서의 내부 XML 구조에 직접 주입하여 완벽한 공공 기관용 보고서 생성.

2. 주요 기술 및 기능

  • HWPX Structure Parser: HWPX 파일(ZIP 압축) 내의 content.hwpml, settings.xml 등을 파싱하여 텍스트, 표, 이미지 데이터를 추출.
  • XML-based Document Injection: AI가 생성한 텍스트를 특정 태그(Section, Paragraph) 위치에 정교하게 삽입하여 서식 유지.
  • Compatibility Bridge: 레거시 HWP 자료를 현대적인 HWPX로 일괄 전환하거나 데이터베이스로 마이그레이션.

3. 기술 스택

  • Language: Python (lxml, zipfile, pandas).
  • Format: HWPX (OWPML – Open Word-Processor Markup Language) 표준 준수.

4. 리소스 및 경로

  • Source Code Path: F:/dev/govern-hwpx
  • Related Project: [[05 Projects/Beompis_Preview_MOC|Beompis Preview Engine]]

Status Note: HWPX 내부 XML 구조 분석 및 텍스트 치환 자동화 엔진 구축 완료. 공공 서식 자동화 및 대규모 문서 데이터 추출의 핵심 백엔드 유틸리티로 운용 중.

#

No responses yet

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다