Hugging Face 플랫폼 완벽 가이드 - AI모델 공유의 허브

Hugging Face는 전 세계 AI 개발자들이 모델, 데이터셋, 애플리케이션을 공유하고 협업할 수 있는 오픈소스 플랫폼입니다.

현대 제조업에서 AI 기술의 도입은 선택이 아닌 필수가 되었습니다. 예방정비 시스템을 통한 설비 고장 예측, 공급망 최적화를 통한 비용 절감, 품질 관리 자동화 등 다양한 영역에서 AI가 혁신적인 변화를 만들어내고 있습니다. 이러한 변화의 중심에는 Hugging Face라는 강력한 플랫폼이 있으며, 초급 개발자도 쉽게 접근할 수 있는 도구들을 제공하고 있습니다.

이번 글에서는 Ollama 툴을 기반으로 하여 Hugging Face를 활용한 실제 제조업 환경에서 활용 가능한 AI 솔루션을 개발하는 방법을 단계별로 설명합니다.

Hugging Face는 AI를 경험하고 구축하는 모든 개발자의 커뮤니티 공간입니다.

[ 차례 ]

1. Hugging Face 플랫폼 이해하기

Hugging Face란?

Hugging Face는 전 세계 AI 개발자들이 모델, 데이터셋, 애플리케이션을 공유하고 협업할 수 있는 오픈소스 플랫폼입니다.

특히 자연어 처리(NLP), 컴퓨터 비전, 오디오 처리 등 다양한 AI 분야의 최신 모델들을 손쉽게 활용할 수 있도록 도와줍니다. GitHub가 코드 공유의 허브라면, Hugging Face는 AI 모델 공유의 허브라고 할 수 있습니다. 제조업 분야에서는 설비 데이터 분석, 텍스트 기반 품질 보고서 분석, 음성 인식을 통한 작업 지시 등에 활용될 수 있습니다.

Hugging Face 오픈 플랫폼 공식 홈페이지 ❘ https://huggingface.co/

핵심 구성 요소

Models Hub

전 세계 개발자들이 공유한 수십만 개의 사전 훈련된 모델들이 저장되어 있습니다.

대부분의 AI모델을 연구하고 개발된 회사나 단체는 Hugging Face를 통해 개발자들로부터의 피드백을 원하고 있고, 모델이 출시되기전 Hugging Face에 제일 먼저 업로드하는 것이 일반화 되어있습니다. 최근에 등장한 GPT-OSS모델도 Hugging Face에 공개되어 있습니다.

BERT, GPT, T5와 같은 대형 언어 모델부터 ResNet, YOLO 같은 컴퓨터 비전 모델까지 다양하게 제공됩니다. 제조업에서는 설비 고장 예측을 위한 시계열 분석 모델, 품질 검사를 위한 이미지 분류 모델 등을 찾을 수 있습니다. 모든 모델은 표준화된 인터페이스를 통해 쉽게 사용할 수 있도록 설계되어 있습니다.

Datasets

AI 모델 훈련에 필요한 다양한 데이터셋을 제공합니다.

데이터셋의 구성은 중소 제조기업에서 보유한 데이터셋을 활용하는 것이 제일 좋은 방법이기는 합니다. 다만 해당 데이터를 얻기도 힘들 뿐더러 모델을 테스트하기에는 데이터의 의미를 파악하기도 힘들게 산재되어 있는 것이 사실입니다. Hugging Face에서 제공되는 데이터셋은 AI모델로 사전 테스트된 데이터라고 보시면 좋을 듯합니다. 이러한 데이터 셋은 중소기업에서 제공되는 다양한 형태의 데이터셋에 대한 정제 및 필터링과 관련된 권고사항으로 분석해서 이해하는 것이 좋을 듯 합니다.

허깅 페이스에 있는 데이터 셋은 텍스트, 이미지, 오디오, 비디오 등 여러 형태의 데이터를 포함하며, 모두 연구 및 상업적 용도로 활용 가능한지 명시되어 있습니다. 제조업 관련 데이터셋으로는 설비 센서 데이터, 품질 검사 이미지, 작업 지시서 텍스트 등이 있습니다.

Spaces

개발한 AI 모델을 웹 애플리케이션 형태로 배포하고 시연할 수 있는 플랫폼입니다.

Gradio나 Streamlit을 사용해 인터랙티브한 데모를 만들 수 있으며, 다른 사용자들과 공유하거나 프로토타입을 빠르게 테스트할 수 있습니다. 제조업 환경에서는 품질 검사 시스템의 프로토타입을 만들어 현장 직원들에게 시연하는 용도로 활용할 수 있습니다.

제조업에서의 활용 가능성

Hugging Face의 다양한 AI 모델들은 제조업의 핵심 과제들을 해결하는 데 직접적으로 활용될 수 있습니다.

예방정비 분야에서는 시계열 예측 모델을 활용해 설비의 고장 시점을 예측하고, 최적의 정비 일정을 수립할 수 있습니다. 컴퓨터 비전 모델을 사용하면 제품 표면의 결함을 자동으로 감지하고 분류할 수 있어 품질 관리 효율성을 크게 향상시킬 수 있습니다. 자연어 처리 모델은 작업 지시서, 품질 보고서, 고객 불만사항 등의 텍스트 데이터를 분석해 인사이트를 도출하는 데 사용됩니다. 이러한 모델들을 Ollama와 연계하면 로컬 환경에서도 안전하고 효율적으로 운영할 수 있습니다.

2. 계정 생성 및 기본 설정

Hugging Face 계정 생성

Hugging Face 계정 생성은 매우 간단하며 무료로 제공됩니다.

huggingface.co 웹사이트에 접속한 후 우상단의 'Sign Up' 버튼을 클릭합니다. 이메일 주소, 사용자명, 비밀번호만 입력하면 기본 계정이 생성되며, 이메일 인증을 완료하면 모든 기능을 사용할 수 있습니다. GitHub 계정이 있다면 OAuth를 통해 더욱 간편하게 가입할 수 있으며, 이 경우 GitHub의 프로필 정보가 자동으로 연동됩니다.

기업 환경에서는 회사 이메일을 사용해 계정을 생성하고, 팀원들과 조직을 구성해 프로젝트를 공동으로 관리하는 것을 권장합니다.

프로필 설정 및 보안

계정 생성 후에는 프로필 정보를 상세히 입력하는 것이 중요합니다.

프로필 사진, 자기소개, 소속 기관 등을 명시하면 다른 개발자들과의 협업 시 신뢰성을 높일 수 있습니다. 특히 제조업 분야에서 활동한다면 관련 경험이나 관심 분야를 명시해두는 것이 좋습니다. 보안 설정에서는 2단계 인증(2FA)을 반드시 활성화해야 하며, 이는 기업 데이터 보안을 위해 필수적입니다. Access Token 생성 시에는 최소한의 권한만 부여하고, 정기적으로 토큰을 교체하는 보안 정책을 수립하는 것이 중요합니다.

보안 설정에서 2단계 인증(2FA)를 활성화하기 위해서는 'Microsoft Authentication'앱이 필요하므로, 참고해주세요.

Access Token 생성 및 관리

API를 통해 Hugging Face의 기능을 활용하려면 Access Token이 필요합니다.

프로필 설정 페이지에서 'Access Tokens' 탭으로 이동한 후 'New token' 버튼을 클릭합니다. 토큰의 이름을 지정하고 필요한 권한을 선택할 수 있으며, 읽기 전용(read), 쓰기 가능(write), 저장소 관리(repo) 등의 옵션이 있습니다.

제조업 환경에서는 보안을 고려해 읽기 전용 토큰을 기본으로 사용하고, 모델 업로드나 수정이 필요한 경우에만 제한적으로 쓰기 권한을 부여하는 것이 좋습니다. 생성된 토큰은 안전한 곳에 보관하고, 코드에 직접 하드코딩하지 않고 환경변수나 설정 파일을 통해 관리해야 합니다.

3. Hugging Face 라이브러리 설치 및 환경 구축

Python 환경 준비

Hugging Face를 효과적으로 활용하기 위해서는 먼저 적절한 Python 환경을 구축해야 합니다.

Python 3.8 이상의 버전을 권장하며, 가상환경(virtual environment)을 사용해 프로젝트별로 독립적인 패키지 환경을 구성하는 것이 중요합니다. 제조업 환경에서는 여러 AI 프로젝트를 동시에 진행하는 경우가 많으므로, 각 프로젝트마다 별도의 가상환경을 만들어 패키지 충돌을 방지해야 합니다. conda나 venv를 사용할 수 있으며, conda는 데이터 사이언스 패키지들이 미리 포함되어 있어 초보자에게 더 편리합니다.

다음은 conda를 사용한 환경 구축 예시입니다.

# conda를 사용한 가상환경 생성 (Python 3.9 버전)
conda create -n manufacturing_ai python=3.9
conda activate manufacturing_ai

# 또는 venv를 사용한 가상환경 생성
python -m venv manufacturing_ai
source manufacturing_ai/bin/activate  # Linux/Mac
# manufacturing_ai\Scripts\activate  # Windows

Hugging Face 라이브러리 설치

Hugging Face의 핵심 라이브러리들을 설치합니다.

transformers 라이브러리는 사전 훈련된 모델들을 사용하기 위한 핵심 패키지이며,
datasets는 데이터셋 다운로드 및 처리를 위한 패키지입니다.
accelerate는 모델 훈련 및 추론을 가속화하는 도구이며,
tokenizers는 텍스트 전처리를 위한 패키지입니다.
제조업 데이터 분석을 위해서는 추가로 pandas, numpy, scikit-learn 등의 데이터 분석 라이브러리도 함께 설치하는 것이 좋습니다.
PyTorch나 TensorFlow 같은 딥러닝 프레임워크도 필요에 따라 설치할 수 있습니다.

# 핵심 Hugging Face 라이브러리 설치
pip install transformers datasets accelerate tokenizers

# 딥러닝 프레임워크 설치 (PyTorch 예시)
pip install torch torchvision torchaudio

# 데이터 분석을 위한 추가 라이브러리
pip install pandas numpy scikit-learn matplotlib seaborn

# 제조업 특화 라이브러리 (시계열 분석 등)
pip install scipy statsmodels plotly

# Ollama와의 연동을 위한 라이브러리
pip install ollama requests

Ollama 설치 및 설정

Ollama는 로컬 환경에서 대형 언어 모델을 효율적으로 실행할 수 있게 해주는 도구입니다.

Ollama 툴은 이미 이전 글에서 설치 및 설정과 관련되어 자세하게 다루었으니 아래의 링크를 참조하시면 좋을듯 합니다.

로컬AI 모델을 활용하기 위한 Ollama툴 설치 및 활용 : [AI코딩.07] 로컬 AI 모델 - Ollama와 Code Llama 활용법
Ollama툴에서 모델의 양자화를 위한 방법 : [로컬AI] Ollama모델의 Q4 양자화 모델 설치 및 실행

제조업 환경에서는 데이터 보안이 중요하므로, 클라우드가 아닌 로컬에서 모델을 실행하는 것이 매우 유용합니다. Ollama 설치는 운영체제별로 다르며, 공식 웹사이트(ollama.ai)에서 설치 파일을 다운로드할 수 있습니다. Linux 환경에서는 curl 명령어로 쉽게 설치할 수 있으며, Windows와 macOS에서는 GUI 설치 프로그램을 제공합니다.

설치 후에는 터미널에서 ollama 명령어를 사용해 모델을 다운로드하고 실행할 수 있습니다.

# Linux/macOS에서 Ollama 설치
curl -fsSL https://ollama.ai/install.sh | sh

# 설치 확인
ollama --version

# 소형 모델 다운로드 및 실행 (예: Llama 2 7B)
ollama pull llama2:7b

# 중형 모델 다운로드 (예: Mistral 7B)
ollama pull mistral:7b

# 모델 목록 확인
ollama list

# 모델 실행 테스트
ollama run llama2:7b "제조업에서 예방정비의 중요성에 대해 설명해주세요."

환경 설정 파일 구성

효율적인 개발을 위해 환경 설정 파일을 구성하는 것이 중요합니다.

.env 파일을 생성해 API 키, 모델 경로, 데이터베이스 연결 정보 등을 관리하면 보안성과 유지보수성을 높일 수 있습니다. requirements.txt 파일을 작성해 프로젝트에 필요한 모든 패키지와 버전을 명시하면, 다른 개발자나 배포 환경에서 동일한 환경을 쉽게 구축할 수 있습니다. config.yaml 파일을 사용해 모델 설정, 하이퍼파라미터, 파일 경로 등을 관리하면 코드 수정 없이도 설정을 변경할 수 있어 매우 유용합니다. 제조업 환경에서는 여러 현장이나 라인별로 다른 설정이 필요한 경우가 많으므로, 설정 파일을 통한 관리가 특히 중요합니다.

# .env 파일 예시
HUGGINGFACE_TOKEN=your_token_here
OLLAMA_HOST=localhost:11434
DATA_PATH=/path/to/manufacturing/data
MODEL_CACHE_DIR=/path/to/model/cache

# requirements.txt 파일 생성
pip freeze > requirements.txt

# config.yaml 파일 예시 내용
model:
  name: "llama2:7b"
  max_tokens: 512
  temperature: 0.1

data:
  input_path: "/data/manufacturing"
  output_path: "/output/predictions"
  
maintenance:
  prediction_horizon: 7  # days
  threshold: 0.8

4. 모델 검색 및 다운로드 마스터하기

Hugging Face Hub에서 모델 검색하기

Hugging Face Hub는 수십만 개의 모델이 등록되어 있어 원하는 모델을 효율적으로 찾는 것이 중요합니다.

모델 검색 시에는 태스크 유형(Task), 라이선스(License), 모델 크기(Model Size), 언어(Language) 등의 필터를 활용할 수 있습니다. 제조업 분야에서는 주로 시계열 예측(Time Series Forecasting), 텍스트 분류(Text Classification), 이미지 분류(Image Classification), 객체 탐지(Object Detection) 등의 태스크가 필요합니다.

검색 결과에서는 모델의 다운로드 수, 좋아요 수, 최근 업데이트 일자 등을 확인해 인기도와 활성도를 파악할 수 있습니다. 모델 카드를 통해 성능 지표, 사용 방법, 제한사항 등의 상세 정보를 확인한 후 선택하는 것이 중요합니다.

아래의 예시는 Python언어에서 Hugging Face API를 통해서 실제 프로그램 안에서 모델을 검색하고, 데이터를 변환하는 예시를 보여줍니다.

from huggingface_hub import HfApi, ModelFilter
import pandas as pd

# HfApi 인스턴스 생성
api = HfApi()

# 제조업 관련 모델 검색 (시계열 예측)
models = api.list_models(
    filter=ModelFilter(
        task="time-series-forecasting",
        library="transformers",
    ),
    limit=20
)

# 검색 결과를 DataFrame으로 변환
model_data = []
for model in models:
    model_data.append({
        'model_id': model.modelId,
        'downloads': model.downloads,
        'likes': model.likes,
        'tags': model.tags,
        'library': model.library
    })

df = pd.DataFrame(model_data)
print("제조업 활용 가능한 시계열 예측 모델들:")
print(df.head())

모델 크기별 선택 가이드

모델 크기는 성능과 리소스 사용량 사이의 트레이드오프를 결정하는 핵심 요소입니다.

소형 모델(1B 이하 파라미터)은 CPU에서도 빠르게 실행되며 메모리 사용량이 적어 엣지 디바이스나 실시간 처리가 필요한 환경에 적합합니다. 제조업 현장의 IoT 센서 데이터 실시간 분석이나 작업자의 스마트폰에서 동작하는 품질 검사 앱 등에 활용할 수 있습니다.

중형 모델(1B-10B 파라미터)은 일반적인 GPU 환경에서 좋은 성능을 제공하며, 대부분의 제조업 AI 태스크에 적합한 균형점을 제공합니다. 예방정비 시스템의 핵심 모델이나 품질 관리 시스템의 주요 분석 엔진으로 사용하기에 적절합니다. 모델 선택 시에는 정확도뿐만 아니라 추론 속도, 메모리 사용량, 배포 환경의 제약사항도 함께 고려해야 합니다.

일반적으로 소형 모델은 원하는 결과치를 보여주기 어려우며 주로 20B~30B정도의 파라미터를 보유한 모델을 사용하고 있습니다.

로컬 다운로드 및 캐싱

Hugging Face 모델을 로컬에 다운로드하면 네트워크 연결 없이도 사용할 수 있어 제조업 현장처럼 인터넷 연결이 제한적인 환경에서 매우 유용합니다.

transformers 라이브러리는 자동으로 모델을 캐싱하므로, 한 번 다운로드한 모델은 재사용할 수 있습니다. 캐시 디렉토리는 환경변수로 설정할 수 있으며, 여러 프로젝트에서 공통으로 사용하는 모델들은 중앙 집중식으로 관리하는 것이 효율적입니다. 대용량 모델의 경우 다운로드 시간이 오래 걸릴 수 있으므로, 사전에 필요한 모델들을 미리 다운로드해두는 것이 좋습니다.

다음은 제조업에서 자주 사용되는 모델들을 미리 다운로드하는 스크립트 예시입니다.

from transformers import AutoModel, AutoTokenizer
import os

# 캐시 디렉토리 설정
cache_dir = "/opt/models/huggingface_cache"
os.environ['TRANSFORMERS_CACHE'] = cache_dir

# 제조업 활용 모델들 사전 다운로드
models_to_download = [
    "microsoft/DialoGPT-medium",  # 대화형 AI (작업 지시)
    "bert-base-uncased",          # 텍스트 분류 (품질 보고서 분석)
    "facebook/timesformer-base-finetuned-k400",  # 비디오 분석
    "microsoft/resnet-50",        # 이미지 분류 (품질 검사)
]

print("제조업 특화 모델 다운로드 시작...")
for model_name in models_to_download:
    try:
        print(f"다운로드 중: {model_name}")
        model = AutoModel.from_pretrained(model_name, cache_dir=cache_dir)
        tokenizer = AutoTokenizer.from_pretrained(model_name, cache_dir=cache_dir)
        print(f"완료: {model_name}")
    except Exception as e:
        print(f"오류 발생 ({model_name}): {str(e)}")

print("모든 모델 다운로드 완료!")

Ollama와 Hugging Face 모델 연동

Ollama에서 Hugging Face 모델을 사용하려면 적절한 모델 형식으로 변환하거나, Ollama에서 지원하는 모델을 선택해야 합니다. Ollama는 GGUF 형식의 모델을 지원하며, 많은 인기 모델들이 이미 Ollama 형식으로 변환되어 제공됩니다.

제조업에서 자주 사용되는 Llama 2, Mistral, CodeLlama 등의 모델들은 Ollama를 통해 쉽게 설치하고 사용할 수 있습니다. Python에서 Ollama API를 호출해 모델을 사용할 수 있으며, 이를 통해 제조업 데이터 분석 파이프라인에 언어 모델을 통합할 수 있습니다.

다음은 Ollama와 연동한 제조업 데이터 분석 예시입니다.

import ollama
import json

class ManufacturingAIAssistant:
    def __init__(self, model_name="llama2:7b"):
        self.model_name = model_name
        self.client = ollama.Client()
    
    def analyze_maintenance_report(self, report_text):
        """정비 보고서 분석"""
        prompt = f"""
        다음은 제조 설비의 정비 보고서입니다. 
        중요한 이슈를 식별하고 예방정비 관점에서 권고사항을 제시해주세요.
        
        보고서: {report_text}
        
        분석 결과를 JSON 형식으로 제공해주세요:
        - issues: 발견된 문제점들
        - recommendations: 권고사항들
        - urgency_level: 긴급도 (1-5)
        """
        
        response = self.client.generate(
            model=self.model_name,
            prompt=prompt
        )
        return response['response']
    
    def predict_supply_demand(self, historical_data):
        """공급망 수요 예측"""
        prompt = f"""
        제조업 공급망 분석 전문가로서 다음 데이터를 분석해주세요.
        
        과거 데이터: {historical_data}
        
        향후 1개월간의 수요 패턴을 예측하고 재고 관리 전략을 제안해주세요.
        """
        
        response = self.client.generate(
            model=self.model_name,
            prompt=prompt
        )
        return response['response']

# 사용 예시
assistant = ManufacturingAIAssistant()

# 정비 보고서 분석
maintenance_report = """
설비명: 프레스 기계 #3
점검일: 2024-08-10
상태: 진동 수치가 평소보다 15% 증가
오일 누수: 경미한 누수 확인
온도: 정상 범위 내
"""

analysis = assistant.analyze_maintenance_report(maintenance_report)
print("정비 보고서 분석 결과:")
print(analysis)

5. 데이터셋 활용의 모든 것

제조업 관련 데이터셋 찾기

Hugging Face Datasets Hub에는 제조업 분야에 활용할 수 있는 다양한 데이터셋이 공개되어 있습니다.

직접적인 제조업 데이터셋뿐만 아니라 시계열 데이터, 이미지 분류, 텍스트 분석 등 제조업 AI 프로젝트에 응용할 수 있는 범용 데이터셋도 많이 제공됩니다.

예방정비 모델 개발을 위해서는 센서 데이터, 설비 로그, 고장 이력 등이 포함된 시계열 데이터셋을 찾아야 하며,품질 관리를 위해서는 제품 이미지와 결함 분류 정보가 포함된 이미지 데이터셋이 필요합니다.

데이터셋 선택 시에는 라이선스를 반드시 확인해야 하며, 상업적 사용이 가능한지, 데이터 출처가 신뢰할 만한지, 데이터 품질이 프로젝트 요구사항에 적합한지 등을 검토해야 합니다. 또한 데이터셋의 크기, 형식, 전처리 수준도 고려하여 프로젝트 일정과 리소스에 맞는 데이터셋을 선택하는 것이 중요합니다.

5.2 커스텀 데이터셋 생성 및 업로드

실제 제조업 환경에서는 자체 수집한 데이터를 활용해야 하는 경우가 많습니다.

설비 센서 데이터, 품질 검사 이미지, 작업 지시서, 정비 보고서 등의 자체 데이터를 Hugging Face 형식으로 변환하여 활용할 수 있습니다. 데이터셋 생성 시에는 적절한 전처리, 레이블링, 검증 과정을 거쳐야 하며, 데이터 프라이버시와 보안 정책을 준수해야 합니다. 특히 제조업 데이터는 영업기밀이나 개인정보가 포함될 수 있으므로, 데이터 익명화나 민감정보 제거 과정이 필요할 수 있습니다.

데이터셋을 Hugging Face Hub에 업로드하면 팀원들과 쉽게 공유할 수 있으며, 버전 관리 기능을 통해 데이터의 변경 이력을 추적할 수 있습니다.

다음은 제조업 센서 데이터를 Hugging Face 데이터셋으로 변환하는 예시입니다.

제조업 센서 데이터를 Hugging Face 데이터셋으로 변환하는 코드 예시 >

from datasets import Dataset, DatasetDict
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

# 제조업 센서 데이터 시뮬레이션 생성
def create_manufacturing_dataset():
    # 시뮬레이션 데이터 생성 (실제로는 CSV 파일에서 읽어옵니다)
    np.random.seed(42)
    n_samples = 10000
    
    # 시간 시퀀스 생성
    start_date = datetime(2023, 1, 1)
    timestamps = [start_date + timedelta(hours=i) for i in range(n_samples)]
    
    # 센서 데이터 생성 (온도, 압력, 진동, RPM)
    base_temp = 75  # 기본 온도
    temp_variation = np.sin(np.linspace(0, 100*np.pi, n_samples)) * 5
    temperature = base_temp + temp_variation + np.random.normal(0, 2, n_samples)
    
    pressure = 150 + np.random.normal(0, 10, n_samples)
    vibration = np.abs(np.random.normal(0.5, 0.1, n_samples))
    rpm = 1800 + np.random.normal(0, 50, n_samples)
    
    # 고장 레이블 생성 (온도가 높고 진동이 클 때 고장 위험)
    failure_prob = ((temperature - base_temp) / 20 + vibration) / 2
    failure_labels = (failure_prob > 0.8).astype(int)
    
    # DataFrame 생성
    data = pd.DataFrame({
        'timestamp': timestamps,
        'temperature': temperature,
        'pressure': pressure,
        'vibration': vibration,
        'rpm': rpm,
        'failure_risk': failure_labels
    })
    
    # 훈련/검증/테스트 분할
    train_size = int(0.7 * len(data))
    val_size = int(0.15 * len(data))
    
    train_data = data[:train_size]
    val_data = data[train_size:train_size+val_size]
    test_data = data[train_size+val_size:]
    
    # Hugging Face Dataset 형식으로 변환
    dataset_dict = DatasetDict({
        'train': Dataset.from_pandas(train_data),
        'validation': Dataset.from_pandas(val_data),
        'test': Dataset.from_pandas(test_data)
    })
    
    return dataset_dict

# 데이터셋 생성 및 저장
manufacturing_dataset = create_manufacturing_dataset()

# 로컬에 저장
manufacturing_dataset.save_to_disk("./manufacturing_sensor_data")

# 데이터셋 정보 출력
print("제조업 센서 데이터셋 생성 완료")
print(f"훈련 데이터: {len(manufacturing_dataset['train'])} 샘플")
print(f"검증 데이터: {len(manufacturing_dataset['validation'])} 샘플")
print(f"테스트 데이터: {len(manufacturing_dataset['test'])} 샘플")

# 샘플 데이터 확인
print("\n샘플 데이터:")
print(manufacturing_dataset['train'][0])

데이터 전처리 및 변환

제조업 데이터는 다양한 형태와 품질을 가지고 있어 적절한 전처리 과정이 필수적입니다.

센서 데이터의 경우 노이즈 제거, 이상치 탐지, 결측치 처리 등이 필요하며, 시계열 특성을 고려한 정규화와 피처 엔지니어링이 중요합니다. 이미지 데이터는 해상도 조정, 색상 정규화, 데이터 증강 등의 과정을 거쳐야 하며, 텍스트 데이터는 토큰화, 불용어 제거, 정규화 등의 자연어 처리 과정이 필요합니다.

Hugging Face의 datasets 라이브러리는 이러한 전처리 작업을 효율적으로 수행할 수 있는 다양한 기능을 제공합니다. 특히 map() 함수를 사용하면 대용량 데이터셋에 대해서도 메모리 효율적으로 전처리를 수행할 수 있으며, 멀티프로세싱을 통해 처리 속도를 향상시킬 수 있습니다.

다음은 제조업 데이터의 전처리 예시입니다.

제조업 센서 데이터의 전처리 변환 코드 예시 >

import numpy as np
from datasets import load_from_disk
from sklearn.preprocessing import StandardScaler, MinMaxScaler
import pandas as pd

# 이전에 생성한 데이터셋 로드
dataset = load_from_disk("./manufacturing_sensor_data")

def preprocess_sensor_data(examples):
    """센서 데이터 전처리 함수"""
    # 이상치 제거 (IQR 방법 사용)
    def remove_outliers(data, column):
        Q1 = np.percentile(data[column], 25)
        Q3 = np.percentile(data[column], 75)
        IQR = Q3 - Q1
        lower_bound = Q1 - 1.5 * IQR
        upper_bound = Q3 + 1.5 * IQR
        
        # 이상치를 경계값으로 클리핑
        return np.clip(data[column], lower_bound, upper_bound)
    
    # 각 센서 데이터에 대해 이상치 제거
    examples['temperature'] = remove_outliers(examples, 'temperature')
    examples['pressure'] = remove_outliers(examples, 'pressure')
    examples['vibration'] = remove_outliers(examples, 'vibration')
    examples['rpm'] = remove_outliers(examples, 'rpm')
    
    return examples

def normalize_features(examples):
    """피처 정규화"""
    # 수치형 컬럼들에 대해 정규화 수행
    numeric_columns = ['temperature', 'pressure', 'vibration', 'rpm']
    
    for column in numeric_columns:
        values = np.array(examples[column])
        # Z-score 정규화
        mean_val = np.mean(values)
        std_val = np.std(values)
        examples[f'{column}_normalized'] = (values - mean_val) / std_val
        
        # Min-Max 정규화 (0-1 범위)
        min_val = np.min(values)
        max_val = np.max(values)
        examples[f'{column}_minmax'] = (values - min_val) / (max_val - min_val)
    
    return examples

def create_time_features(examples):
    """시간 기반 피처 생성"""
    import pandas as pd
    
    # timestamp를 pandas datetime으로 변환
    timestamps = pd.to_datetime(examples['timestamp'])
    
    # 시간 기반 피처 추출
    examples['hour'] = timestamps.dt.hour
    examples['day_of_week'] = timestamps.dt.dayofweek
    examples['month'] = timestamps.dt.month
    examples['is_weekend'] = (timestamps.dt.dayofweek >= 5).astype(int)
    
    # 교대 근무 시간 구분 (예: 3교대)
    examples['shift'] = np.where(timestamps.dt.hour < 8, 0,  # 야간
                        np.where(timestamps.dt.hour < 16, 1,  # 주간
                                2))  # 저녁
    
    return examples

# 전처리 적용
print("데이터 전처리 시작...")

# 1단계: 이상치 제거
dataset = dataset.map(preprocess_sensor_data, batched=True, batch_size=1000)

# 2단계: 정규화
dataset = dataset.map(normalize_features, batched=True, batch_size=1000)

# 3단계: 시간 기반 피처 생성
dataset = dataset.map(create_time_features, batched=True, batch_size=1000)

print("전처리 완료!")
print("새로운 컬럼들:")
print(dataset['train'].column_names)

# 전처리된 데이터 저장
dataset.save_to_disk("./manufacturing_sensor_data_processed")

데이터 품질 검증 및 시각화

데이터 품질 검증은 AI 모델의 성능을 좌우하는 중요한 과정입니다.

제조업 데이터의 경우 센서 오류, 통신 장애, 시스템 다운타임 등으로 인한 데이터 누락이나 왜곡이 발생할 수 있으므로, 체계적인 품질 검증이 필요합니다. 기본적인 통계 정보 확인, 결측치 분석, 데이터 분포 검토, 상관관계 분석 등을 통해 데이터의 일관성과 신뢰성을 평가해야 합니다. 시각화를 통해 데이터의 패턴, 이상치, 계절성 등을 직관적으로 파악할 수 있으며, 이는 모델 설계와 피처 엔지니어링에 중요한 인사이트를 제공합니다.

특히 시계열 데이터의 경우 트렌드, 계절성, 주기성 등을 시각적으로 확인하는 것이 중요하며, 이를 통해 적절한 예측 모델을 선택할 수 있습니다.

다음은 제조업 데이터의 품질 검증 및 시각화 예시입니다.

제조업 데이터의 품질 검증 및 시각화 코드 예시 >

import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
from datasets import load_from_disk

# 전처리된 데이터 로드
dataset = load_from_disk("./manufacturing_sensor_data_processed")

def analyze_data_quality(dataset_split):
    """데이터 품질 분석"""
    # Dataset을 pandas DataFrame으로 변환
    df = dataset_split.to_pandas()
    
    print("=== 데이터 품질 분석 리포트 ===")
    print(f"데이터 크기: {len(df):,} 행, {len(df.columns)} 열")
    print(f"메모리 사용량: {df.memory_usage(deep=True).sum() / 1024**2:.2f} MB")
    
    # 기본 통계 정보
    print("\n=== 기본 통계 정보 ===")
    numeric_cols = ['temperature', 'pressure', 'vibration', 'rpm']
    print(df[numeric_cols].describe())
    
    # 결측치 분석
    print("\n=== 결측치 분석 ===")
    missing_data = df.isnull().sum()
    missing_percent = (missing_data / len(df)) * 100
    missing_df = pd.DataFrame({
        'Missing Count': missing_data,
        'Missing Percentage': missing_percent
    })
    print(missing_df[missing_df['Missing Count'] > 0])
    
    # 데이터 타입 확인
    print("\n=== 데이터 타입 ===")
    print(df.dtypes)
    
    # 고장 위험 분포
    print("\n=== 고장 위험 분포 ===")
    failure_dist = df['failure_risk'].value_counts()
    failure_percent = df['failure_risk'].value_counts(normalize=True) * 100
    print(f"정상: {failure_dist[0]:,}건 ({failure_percent[0]:.1f}%)")
    print(f"위험: {failure_dist[1]:,}건 ({failure_percent[1]:.1f}%)")
    
    return df

def create_visualization(df):
    """데이터 시각화"""
    plt.style.use('seaborn-v0_8')
    fig, axes = plt.subplots(2, 3, figsize=(18, 12))
    fig.suptitle('제조업 센서 데이터 분석 대시보드', fontsize=16, fontweight='bold')
    
    # 1. 센서 데이터 시계열 플롯
    axes[0, 0].plot(df['temperature'][:1000], color='red', alpha=0.7)
    axes[0, 0].set_title('온도 센서 데이터 (첫 1000개 샘플)')
    axes[0, 0].set_ylabel('온도 (°C)')
    axes[0, 0].grid(True, alpha=0.3)
    
    # 2. 센서 데이터 분포
    axes[0, 1].hist(df['vibration'], bins=50, alpha=0.7, color='blue')
    axes[0, 1].set_title('진동 센서 데이터 분포')
    axes[0, 1].set_xlabel('진동 (g)')
    axes[0, 1].set_ylabel('빈도')
    axes[0, 1].grid(True, alpha=0.3)
    
    # 3. 상관관계 히트맵
    numeric_cols = ['temperature', 'pressure', 'vibration', 'rpm', 'failure_risk']
    correlation_matrix = df[numeric_cols].corr()
    sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', 
                center=0, ax=axes[0, 2])
    axes[0, 2].set_title('센서 데이터 상관관계')
    
    # 4. 고장 위험별 센서 데이터 박스플롯
    df_melted = df.melt(id_vars=['failure_risk'], 
                       value_vars=['temperature', 'pressure', 'vibration', 'rpm'],
                       var_name='sensor', value_name='value')
    sns.boxplot(data=df_melted, x='sensor', y='value', hue='failure_risk', ax=axes[1, 0])
    axes[1, 0].set_title('고장 위험별 센서 데이터 분포')
    axes[1, 0].set_ylabel('센서 값')
    
    # 5. 시간대별 고장 위험 분포
    hourly_failure = df.groupby('hour')['failure_risk'].mean()
    axes[1, 1].bar(hourly_failure.index, hourly_failure.values, alpha=0.7, color='orange')
    axes[1, 1].set_title('시간대별 고장 위험률')
    axes[1, 1].set_xlabel('시간 (24시간)')
    axes[1, 1].set_ylabel('고장 위험률')
    axes[1, 1].grid(True, alpha=0.3)
    
    # 6. 교대별 센서 성능
    shift_labels = ['야간', '주간', '저녁']
    shift_temp = df.groupby('shift')['temperature'].mean()
    axes[1, 2].bar(range(len(shift_temp)), shift_temp.values, 
                   tick_label=shift_labels, alpha=0.7, color='green')
    axes[1, 2].set_title('교대별 평균 온도')
    axes[1, 2].set_ylabel('평균 온도 (°C)')
    axes[1, 2].grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.savefig('manufacturing_data_analysis.png', dpi=300, bbox_inches='tight')
    plt.show()

# 분석 실행
df = analyze_data_quality(dataset['train'])
create_visualization(df)

print("\n데이터 품질 검증 완료!")
print("시각화 결과가 'manufacturing_data_analysis.png' 파일로 저장되었습니다.")

6. Spaces를 통한 모델 테스트 및 배포

Hugging Face Spaces 소개

Hugging Face Spaces는 AI 모델을 웹 애플리케이션 형태로 빠르게 배포하고 공유할 수 있는 플랫폼입니다.

제조업 환경에서는 개발한 AI 모델을 현장 작업자나 관리자들이 쉽게 테스트하고 활용할 수 있도록 데모 애플리케이션을 만드는 것이 매우 중요합니다. Spaces는 Gradio, Streamlit, Static HTML 등 다양한 프레임워크를 지원하며, GPU 가속도 제공하여 복잡한 모델도 실시간으로 실행할 수 있습니다.

특히 Gradio를 사용하면 Python 코드 몇 줄만으로 전문적인 인터페이스를 만들 수 있어 초보 개발자도 쉽게 활용할 수 있습니다. 제조업 특화 애플리케이션으로는 품질 검사 이미지 업로드 시스템, 설비 데이터 실시간 분석기, 예방정비 예측 도구 등을 만들 수 있으며, 이를 통해 AI 기술의 실용성을 직접 확인하고 현장 피드백을 수집할 수 있습니다.

Gradio를 활용한 제조업 AI 데모 애플리케이션

Gradio는 머신러닝 모델을 위한 사용자 친화적인 웹 인터페이스를 쉽게 만들 수 있는 Python 라이브러리입니다.

제조업에서 자주 필요한 이미지 업로드, 텍스트 입력, 파일 업로드, 실시간 차트 등의 기능을 간단하게 구현할 수 있습니다. 특히 현장 작업자들이 스마트폰이나 태블릿으로 쉽게 사용할 수 있도록 반응형 디자인이 자동으로 적용됩니다.

다음은 제조업 품질 검사를 위한 이미지 분류 애플리케이션을 Gradio로 구현하는 예시입니다. 작업자가 제품 사진을 업로드하면 AI 모델이 결함 여부를 자동으로 판단하고, 결과를 시각적으로 표시해주는 시스템입니다. 이러한 애플리케이션은 현장에서 즉시 활용할 수 있어 품질 관리 효율성을 크게 향상시킬 수 있습니다.

제조업 품질 검사를 위한 이미지 분류 어플리케이션 코드 예시 >

import gradio as gr
import torch
from transformers import AutoImageProcessor, AutoModelForImageClassification
from PIL import Image
import numpy as np
import plotly.graph_objects as go
import plotly.express as px

class ManufacturingQualityInspector:
    def __init__(self):
        # 사전 훈련된 이미지 분류 모델 로드 (실제로는 제조업 특화 모델 사용)
        self.processor = AutoImageProcessor.from_pretrained("microsoft/resnet-50")
        self.model = AutoModelForImageClassification.from_pretrained("microsoft/resnet-50")
        
        # 제조업 결함 클래스 (예시)
        self.defect_classes = {
            0: "정상 제품",
            1: "표면 스크래치",
            2: "색상 불량",
            3: "형태 변형",
            4: "크랙 발생"
        }
    
    def analyze_product_image(self, image):
        """제품 이미지 분석"""
        if image is None:
            return "이미지를 업로드해주세요.", None, None
        
        try:
            # 이미지 전처리
            inputs = self.processor(image, return_tensors="pt")
            
            # 모델 추론
            with torch.no_grad():
                outputs = self.model(**inputs)
                probabilities = torch.nn.functional.softmax(outputs.logits[0], dim=-1)
            
            # 결과 해석 (실제로는 제조업 특화 로직 적용)
            confidence = float(probabilities.max())
            predicted_class = int(probabilities.argmax())
            
            # 가상의 결함 탐지 로직 (실제 모델에서는 더 정교한 분석)
            is_defective = confidence < 0.8 or predicted_class % 2 == 1
            
            result_text = f"""
            ## 품질 검사 결과
            
            **판정**: {'불량품' if is_defective else '정상품'}
            **신뢰도**: {confidence:.2%}
            **예상 결함**: {self.defect_classes.get(predicted_class % 5, '알 수 없음')}
            
            ### 권장 조치사항:
            {self._get_recommendations(is_defective, predicted_class)}
            """
            
            # 신뢰도 차트 생성
            confidence_chart = self._create_confidence_chart(probabilities[:5])
            
            # 품질 점수 게이지 차트
            quality_score = confidence if not is_defective else 1 - confidence
            gauge_chart = self._create_quality_gauge(quality_score)
            
            return result_text, confidence_chart, gauge_chart
            
        except Exception as e:
            return f"오류가 발생했습니다: {str(e)}", None, None
    
    def _get_recommendations(self, is_defective, predicted_class):
        """권장 조치사항 생성"""
        if not is_defective:
            return "• 제품이 품질 기준을 만족합니다.\n• 정상적으로 출하 가능합니다."
        else:
            recommendations = [
                "• 해당 제품을 별도 보관하여 재검사 실시",
                "• 생산 라인의 해당 공정 점검 필요",
                "• 품질 관리 담당자에게 즉시 보고"
            ]
            
            if predicted_class % 5 == 1:  # 표면 스크래치
                recommendations.append("• 연마 공정 점검 및 도구 교체 검토")
            elif predicted_class % 5 == 2:  # 색상 불량
                recommendations.append("• 도색 시스템 및 원료 품질 확인")
                
            return "\n".join(recommendations)
    
    def _create_confidence_chart(self, probabilities):
        """신뢰도 차트 생성"""
        classes = list(self.defect_classes.values())
        probs = probabilities.numpy()
        
        fig = px.bar(
            x=classes,
            y=probs,
            title="결함 유형별 예측 확률",
            labels={'x': '결함 유형', 'y': '확률'},
            color=probs,
            color_continuous_scale='RdYlGn_r'
        )
        fig.update_layout(height=400)
        return fig
    
    def _create_quality_gauge(self, quality_score):
        """품질 점수 게이지 차트"""
        fig = go.Figure(go.Indicator(
            mode = "gauge+number+delta",
            value = quality_score * 100,
            domain = {'x': [0, 1], 'y': [0, 1]},
            title = {'text': "품질 점수"},
            delta = {'reference': 80},
            gauge = {
                'axis': {'range': [None, 100]},
                'bar': {'color': "darkblue"},
                'steps': [
                    {'range': [0, 50], 'color': "lightgray"},
                    {'range': [50, 80], 'color': "gray"}
                ],
                'threshold': {
                    'line': {'color': "red", 'width': 4},
                    'thickness': 0.75,
                    'value': 90
                }
            }
        ))
        fig.update_layout(height=400)
        return fig

# 애플리케이션 인스턴스 생성
inspector = ManufacturingQualityInspector()

# Gradio 인터페이스 구성
def create_quality_inspection_app():
    with gr.Blocks(title="제조업 품질 검사 AI 시스템") as app:
        gr.Markdown("""
        # 제조업 품질 검사 AI 시스템
        
        제품 이미지를 업로드하여 AI 기반 품질 검사를 수행합니다.
        """)
        
        with gr.Row():
            with gr.Column(scale=1):
                image_input = gr.Image(
                    type="pil",
                    label="제품 이미지 업로드"
                )
                analyze_btn = gr.Button(
                    "품질 검사 실행",
                    variant="primary",
                    size="lg"
                )
                
                gr.Markdown("""
                ### 사용 방법:
                1. 검사할 제품의 사진을 업로드하세요
                2. '품질 검사 실행' 버튼을 클릭하세요
                3. AI 분석 결과를 확인하세요
                
                ### 지원 형식:
                - JPG, PNG, WEBP
                - 최대 해상도: 2048x2048
                """)
            
            with gr.Column(scale=2):
                result_text = gr.Markdown(label="검사 결과")
                
                with gr.Row():
                    confidence_plot = gr.Plot(label="결함 유형별 확률")
                    quality_gauge = gr.Plot(label="품질 점수")
        
        # 이벤트 핸들러
        analyze_btn.click(
            fn=inspector.analyze_product_image,
            inputs=[image_input],
            outputs=[result_text, confidence_plot, quality_gauge]
        )
        
        # 샘플 이미지 버튼 추가
        gr.Examples(
            examples=[
                ["sample_images/normal_product.jpg"],
                ["sample_images/scratched_product.jpg"],
                ["sample_images/discolored_product.jpg"]
            ],
            inputs=[image_input],
            label="샘플 이미지"
        )
    
    return app

# 애플리케이션 실행
if __name__ == "__main__":
    app = create_quality_inspection_app()
    app.launch(
        server_name="0.0.0.0",
        server_port=7860,
        share=True  # 공개 링크 생성 (Hugging Face Spaces에서는 불필요)
    )

Streamlit 기반 예방정비 대시보드

Streamlit은 데이터 과학자와 엔지니어들이 데이터 애플리케이션을 빠르게 구축할 수 있는 오픈소스 프레임워크입니다.

제조업의 예방정비 시스템에서는 복잡한 시계열 데이터와 다양한 센서 정보를 종합적으로 모니터링할 수 있는 대시보드가 필요합니다. Streamlit을 사용하면 실시간 데이터 업데이트, 인터랙티브 차트, 다중 페이지 구성 등을 쉽게 구현할 수 있어 관리자들이 설비 상태를 한눈에 파악하고 의사결정을 내릴 수 있습니다.

특히 Ollama와 연동하여 자연어로 설비 상태를 질의하고 답변을 받을 수 있는 기능을 추가하면, 기술적 배경이 없는 현장 관리자도 쉽게 시스템을 활용할 수 있습니다.

다음은 예방정비를 위한 종합 대시보드 애플리케이션의 구현 예시입니다.

제조업 예방정비를 위한 종합 대시보드 어플리케이션 코드 예시 >

import streamlit as st
import pandas as pd
import numpy as np
import plotly.graph_objects as go
import plotly.express as px
from datetime import datetime, timedelta
import ollama
import json

class PredictiveMaintenanceDashboard:
    def __init__(self):
        self.ollama_client = ollama.Client()
        self.model_name = "llama2:7b"
        
    def generate_sample_data(self, days=30):
        """샘플 설비 데이터 생성"""
        np.random.seed(42)
        dates = pd.date_range(start=datetime.now() - timedelta(days=days), 
                             end=datetime.now(), freq='H')
        
        data = []
        for date in dates:
            # 여러 설비의 센서 데이터 시뮬레이션
            for equipment_id in ['PRESS_001', 'CONVEYOR_002', 'ROBOT_003']:
                base_temp = {'PRESS_001': 85, 'CONVEYOR_002': 45, 'ROBOT_003': 65}[equipment_id]
                base_vibration = {'PRESS_001': 2.5, 'CONVEYOR_002': 1.2, 'ROBOT_003': 0.8}[equipment_id]
                
                # 시간에 따른 변화 패턴 추가
                hour_factor = np.sin(date.hour * np.pi / 12) * 0.1
                day_factor = np.sin(date.day * np.pi / 15) * 0.05
                
                temperature = base_temp + np.random.normal(0, 3) + hour_factor * 10
                vibration = base_vibration + np.random.normal(0, 0.3) + day_factor * 2
                pressure = 150 + np.random.normal(0, 10)
                rpm = 1800 + np.random.normal(0, 50)
                
                # 고장 위험도 계산
                temp_risk = max(0, (temperature - base_temp - 10) / 20)
                vib_risk = max(0, (vibration - base_vibration - 1) / 3)
                failure_risk = min(1, (temp_risk + vib_risk) / 2)
                
                data.append({
                    'timestamp': date,
                    'equipment_id': equipment_id,
                    'temperature': temperature,
                    'vibration': vibration,
                    'pressure': pressure,
                    'rpm': rpm,
                    'failure_risk': failure_risk,
                    'status': 'CRITICAL' if failure_risk > 0.7 else 'WARNING' if failure_risk > 0.4 else 'NORMAL'
                })
        
        return pd.DataFrame(data)
    
    def analyze_with_ollama(self, equipment_data, query):
        """Ollama를 사용한 자연어 분석"""
        try:
            # 데이터 요약 생성
            summary = self._create_data_summary(equipment_data)
            
            prompt = f"""
            당신은 제조업 예방정비 전문가입니다. 다음 설비 데이터를 분석하고 질문에 답변해주세요.
            
            설비 데이터 요약:
            {summary}
            
            질문: {query}
            
            답변 시 다음 형식을 사용해주세요:
            - 현재 상태 분석
            - 위험 요소 식별
            - 권고사항
            - 예상 정비 일정
            """
            
            response = self.ollama_client.generate(
                model=self.model_name,
                prompt=prompt
            )
            
            return response['response']
            
        except Exception as e:
            return f"분석 중 오류가 발생했습니다: {str(e)}"
    
    def _create_data_summary(self, data):
        """데이터 요약 생성"""
        summary = []
        for equipment in data['equipment_id'].unique():
            eq_data = data[data['equipment_id'] == equipment].tail(24)  # 최근 24시간
            
            avg_temp = eq_data['temperature'].mean()
            avg_vibration = eq_data['vibration'].mean()
            max_risk = eq_data['failure_risk'].max()
            current_status = eq_data['status'].iloc[-1]
            
            summary.append(f"""
            설비 {equipment}:
            - 평균 온도: {avg_temp:.1f}°C
            - 평균 진동: {avg_vibration:.2f}g
            - 최대 위험도: {max_risk:.2f}
            - 현재 상태: {current_status}
            """)
        
        return "\n".join(summary)

def main():
    st.set_page_config(
        page_title="예방정비 AI 대시보드",
        layout="wide",
        initial_sidebar_state="expanded"
    )
    
    # 대시보드 인스턴스 생성
    if 'dashboard' not in st.session_state:
        st.session_state.dashboard = PredictiveMaintenanceDashboard()
        st.session_state.data = st.session_state.dashboard.generate_sample_data()
    
    dashboard = st.session_state.dashboard
    data = st.session_state.data
    
    # 사이드바 설정
    st.sidebar.title("🔧 예방정비 제어판")
    
    # 설비 선택
    equipment_list = data['equipment_id'].unique().tolist()
    selected_equipment = st.sidebar.selectbox("설비 선택", ["전체"] + equipment_list)
    
    # 시간 범위 선택
    time_range = st.sidebar.selectbox(
        "시간 범위",
        ["최근 24시간", "최근 7일", "최근 30일"]
    )
    
    # 데이터 필터링
    if selected_equipment != "전체":
        filtered_data = data[data['equipment_id'] == selected_equipment]
    else:
        filtered_data = data
    
    # 메인 대시보드
    st.title("제조업 예방정비 AI 대시보드")
    st.markdown("---")
    
    # KPI 메트릭
    col1, col2, col3, col4 = st.columns(4)
    
    with col1:
        critical_count = len(filtered_data[filtered_data['status'] == 'CRITICAL'])
        st.metric(
            label="위험 설비",
            value=critical_count,
            delta=-1 if critical_count < 5 else 1
        )
    
    with col2:
        avg_risk = filtered_data['failure_risk'].mean()
        st.metric(
            label="평균 위험도",
            value=f"{avg_risk:.2f}",
            delta=f"{avg_risk - 0.3:.2f}"
        )
    
    with col3:
        online_equipment = len(filtered_data['equipment_id'].unique())
        st.metric(
            label="가동 설비",
            value=online_equipment,
            delta=0
        )
    
    with col4:
        efficiency = (1 - avg_risk) * 100
        st.metric(
            label="⚡ 설비 효율성",
            value=f"{efficiency:.1f}%",
            delta=f"{efficiency - 75:.1f}%"
        )
    
    # 차트 섹션
    st.markdown("##실시간 모니터링")
    
    tab1, tab2, tab3 = st.tabs(["시계열 분석", "설비 현황", "위험도 분석"])
    
    with tab1:
        # 시계열 차트
        fig_time = px.line(
            filtered_data.tail(100),
            x='timestamp',
            y='temperature',
            color='equipment_id',
            title="설비별 온도 변화 추이"
        )
        st.plotly_chart(fig_time, use_container_width=True)
        
        # 진동 데이터 차트
        fig_vibration = px.scatter(
            filtered_data.tail(100),
            x='timestamp',
            y='vibration',
            color='status',
            size='failure_risk',
            title="진동 센서 데이터 및 위험도"
        )
        st.plotly_chart(fig_vibration, use_container_width=True)
    
    with tab2:
        col1, col2 = st.columns(2)
        
        with col1:
            # 설비 상태 분포
            status_counts = filtered_data.groupby(['equipment_id', 'status']).size().reset_index(name='count')
            fig_status = px.bar(
                status_counts,
                x='equipment_id',
                y='count',
                color='status',
                title="설비별 상태 분포"
            )
            st.plotly_chart(fig_status, use_container_width=True)
        
        with col2:
            # 위험도 히트맵
            recent_data = filtered_data.tail(72)  # 최근 72시간
            pivot_data = recent_data.pivot_table(
                values='failure_risk',
                index='equipment_id',
                columns=recent_data['timestamp'].dt.hour,
                aggfunc='mean'
            )
            
            fig_heatmap = px.imshow(
                pivot_data,
                title="시간대별 설비 위험도 히트맵",
                color_continuous_scale="RdYlGn_r"
            )
            st.plotly_chart(fig_heatmap, use_container_width=True)
    
    with tab3:
        # 위험도 분포
        fig_risk_dist = px.histogram(
            filtered_data,
            x='failure_risk',
            nbins=20,
            title="고장 위험도 분포"
        )
        st.plotly_chart(fig_risk_dist, use_container_width=True)
        
        # 상관관계 분석
        corr_data = filtered_data[['temperature', 'vibration', 'pressure', 'rpm', 'failure_risk']].corr()
        fig_corr = px.imshow(
            corr_data,
            title="센서 데이터 상관관계",
            color_continuous_scale="RdBu"
        )
        st.plotly_chart(fig_corr, use_container_width=True)
    
    # AI 분석 섹션
    st.markdown("## 🤖 AI 분석 및 질의응답")
    
    col1, col2 = st.columns([2, 1])
    
    with col1:
        user_query = st.text_area(
            "설비 상태에 대해 질문해보세요:",
            placeholder="예: PRESS_001 설비의 현재 상태는 어떤가요? 정비가 필요한 설비는 무엇인가요?",
            height=100
        )
        
        if st.button("AI 분석 실행", type="primary"):
            if user_query:
                with st.spinner("AI가 분석 중입니다..."):
                    analysis_result = dashboard.analyze_with_ollama(filtered_data, user_query)
                    st.markdown("### AI 분석 결과")
                    st.markdown(analysis_result)
            else:
                st.warning("질문을 입력해주세요.")
    
    with col2:
        st.markdown("### 추천 질문")
        sample_questions = [
            "어떤 설비가 가장 위험한가요?",
            "언제 정비를 해야 하나요?",
            "설비 효율성을 높이려면?",
            "비정상적인 패턴이 있나요?"
        ]
        
        for question in sample_questions:
            if st.button(question, key=f"q_{question}"):
                with st.spinner("AI가 분석 중입니다..."):
                    analysis_result = dashboard.analyze_with_ollama(filtered_data, question)
                    st.markdown("### AI 분석 결과")
                    st.markdown(analysis_result)
    
    # 데이터 테이블
    with st.expander("📋 상세 데이터 보기"):
        st.dataframe(
            filtered_data.tail(100)[['timestamp', 'equipment_id', 'temperature', 
                                   'vibration', 'failure_risk', 'status']],
            use_container_width=True
        )

if __name__ == "__main__":
    main()

Hugging Face Spaces에 배포하기

개발한 애플리케이션을 Hugging Face Spaces에 배포하면 전 세계 어디서나 접근할 수 있는 웹 애플리케이션이 됩니다.

배포 과정은 GitHub과 유사하며, Git을 사용해 코드를 업로드하고 자동으로 빌드됩니다. Spaces 생성 시에는 적절한 Python 버전과 하드웨어 사양을 선택해야 하며, GPU가 필요한 모델의 경우 유료 플랜을 선택할 수 있습니다. 제조업 환경에서는 보안이 중요하므로, Private Spaces 옵션을 활용해 접근 권한을 제한할 수 있습니다. 또한 Environment Variables를 사용해 API 키나 데이터베이스 연결 정보 등의 민감한 정보를 안전하게 관리할 수 있습니다. 배포 후에는 지속적인 모니터링과 업데이트가 필요하며, 사용자 피드백을 수집해 애플리케이션을 개선해야 합니다.

# Hugging Face Spaces 배포를 위한 파일 구조
manufacturing_ai_app/
├── app.py                 # 메인 애플리케이션 파일
├── requirements.txt       # 필요한 패키지 목록
├── README.md             # 애플리케이션 설명
├── .gitignore           # Git 제외 파일 목록
├── config.yaml          # 설정 파일
└── assets/              # 정적 파일 (이미지, CSS 등)
    ├── logo.png
    └── sample_images/

# requirements.txt 내용 예시
gradio==4.0.0
streamlit==1.28.0
transformers==4.35.0
torch==2.1.0
plotly==5.17.0
pandas==2.1.0
numpy==1.24.0
Pillow==10.0.0
ollama==0.1.0

# README.md 템플릿
---
title: 제조업 AI 품질검사 시스템
emoji: <something>
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 4.0.0
app_file: app.py
pinned: false
license: apache-2.0
---

# 제조업 AI 품질검사 시스템

이 애플리케이션은 제조업 환경에서 AI를 활용한 품질검사를 수행합니다.

## 주요 기능
- 실시간 이미지 기반 품질 검사
- 결함 유형 자동 분류
- 품질 점수 및 권장사항 제공

## 사용 방법
1. 제품 이미지를 업로드하세요
2. AI 분석 결과를 확인하세요
3. 권장 조치사항을 따라 대응하세요

7. API 및 프로그래매틱 활용법

Hugging Face Inference API 활용

Hugging Face Inference API는 사전 훈련된 모델들을 클라우드에서 즉시 사용할 수 있게 해주는 서비스입니다.

제조업 환경에서는 로컬 리소스가 제한적인 경우가 많으므로, API를 통해 강력한 AI 모델을 활용하는 것이 매우 효율적입니다. 특히 이미지 분류, 텍스트 분석, 자연어 생성 등의 태스크를 수행할 때 별도의 모델 설치나 GPU 없이도 높은 성능을 얻을 수 있습니다.

API 사용 시에는 적절한 에러 핸들링과 재시도 로직을 구현해야 하며, 제조업의 민감한 데이터를 다룰 때는 데이터 보안 정책을 준수해야 합니다. 또한 API 호출량에 따른 비용을 고려하여 효율적인 사용 전략을 수립하는 것이 중요합니다.

다음은 제조업 품질 검사를 위한 API 활용 예시입니다.

제조업 품질 검사를 위한 API 활용 코드 예시 >

import requests
import json
import base64
import time
from typing import Dict, List, Optional
import logging

class HuggingFaceAPIClient:
    def __init__(self, api_token: str):
        self.api_token = api_token
        self.base_url = "https://api-inference.huggingface.co/models"
        self.headers = {
            "Authorization": f"Bearer {api_token}",
            "Content-Type": "application/json"
        }
        self.logger = self._setup_logger()
    
    def _setup_logger(self):
        """로깅 설정"""
        logger = logging.getLogger("HuggingFaceAPI")
        logger.setLevel(logging.INFO)
        handler = logging.StreamHandler()
        formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
        handler.setFormatter(formatter)
        logger.addHandler(handler)
        return logger
    
    def classify_image(self, image_path: str, model_name: str = "microsoft/resnet-50") -> Dict:
        """이미지 분류 API 호출"""
        try:
            # 이미지를 base64로 인코딩
            with open(image_path, "rb") as image_file:
                image_data = base64.b64encode(image_file.read()).decode()
            
            url = f"{self.base_url}/{model_name}"
            payload = {"inputs": image_data}
            
            response = self._make_request(url, payload)
            return self._process_classification_response(response)
            
        except Exception as e:
            self.logger.error(f"이미지 분류 오류: {str(e)}")
            return {"error": str(e)}
    
    def analyze_text(self, text: str, model_name: str = "bert-base-uncased") -> Dict:
        """텍스트 분석 API 호출"""
        try:
            url = f"{self.base_url}/{model_name}"
            payload = {"inputs": text}
            
            response = self._make_request(url, payload)
            return response
            
        except Exception as e:
            self.logger.error(f"텍스트 분석 오류: {str(e)}")
            return {"error": str(e)}
    
    def generate_text(self, prompt: str, model_name: str = "gpt2") -> Dict:
        """텍스트 생성 API 호출"""
        try:
            url = f"{self.base_url}/{model_name}"
            payload = {
                "inputs": prompt,
                "parameters": {
                    "max_length": 200,
                    "temperature": 0.7,
                    "do_sample": True
                }
            }
            
            response = self._make_request(url, payload)
            return response
            
        except Exception as e:
            self.logger.error(f"텍스트 생성 오류: {str(e)}")
            return {"error": str(e)}
    
    def _make_request(self, url: str, payload: Dict, max_retries: int = 3) -> Dict:
        """API 요청 실행 (재시도 로직 포함)"""
        for attempt in range(max_retries):
            try:
                response = requests.post(url, headers=self.headers, json=payload, timeout=30)
                
                if response.status_code == 200:
                    return response.json()
                elif response.status_code == 503:
                    # 모델 로딩 중인 경우 대기
                    self.logger.info(f"모델 로딩 중... 20초 후 재시도 (시도 {attempt + 1}/{max_retries})")
                    time.sleep(20)
                    continue
                else:
                    self.logger.error(f"API 오류: {response.status_code} - {response.text}")
                    return {"error": f"API 오류: {response.status_code}"}
                    
            except requests.exceptions.Timeout:
                self.logger.warning(f"요청 시간 초과 (시도 {attempt + 1}/{max_retries})")
                if attempt == max_retries - 1:
                    return {"error": "요청 시간 초과"}
                time.sleep(5)
            except Exception as e:
                self.logger.error(f"요청 오류: {str(e)}")
                return {"error": str(e)}
        
        return {"error": "최대 재시도 횟수 초과"}
    
    def _process_classification_response(self, response: List[Dict]) -> Dict:
        """분류 결과 후처리"""
        if isinstance(response, list) and len(response) > 0:
            # 신뢰도 순으로 정렬
            sorted_results = sorted(response, key=lambda x: x['score'], reverse=True)
            
            # 제조업 맥락으로 해석
            top_result = sorted_results[0]
            confidence = top_result['score']
            
            # 품질 판정 로직 (예시)
            is_defective = confidence < 0.8  # 낮은 신뢰도는 이상으로 판단
            
            return {
                "prediction": top_result['label'],
                "confidence": confidence,
                "is_defective": is_defective,
                "all_predictions": sorted_results[:5],  # 상위 5개 결과
                "quality_score": confidence if not is_defective else 1 - confidence
            }
        
        return {"error": "잘못된 응답 형식"}

class ManufacturingAISystem:
    """제조업 AI 시스템 통합 클래스"""
    
    def __init__(self, hf_token: str):
        self.hf_client = HuggingFaceAPIClient(hf_token)
        self.quality_threshold = 0.85
        self.defect_history = []
    
    def inspect_product_batch(self, image_paths: List[str]) -> Dict:
        """제품 배치 검사"""
        results = {
            "total_products": len(image_paths),
            "passed": 0,
            "failed": 0,
            "details": [],
            "batch_quality_score": 0.0
        }
        
        total_score = 0.0
        
        for i, image_path in enumerate(image_paths):
            print(f"검사 중: {i+1}/{len(image_paths)} - {image_path}")
            
            # 이미지 분류 수행
            classification_result = self.hf_client.classify_image(image_path)
            
            if "error" not in classification_result:
                is_passed = classification_result["quality_score"] >= self.quality_threshold
                
                if is_passed:
                    results["passed"] += 1
                else:
                    results["failed"] += 1
                    self.defect_history.append({
                        "image": image_path,
                        "timestamp": time.time(),
                        "defect_type": classification_result["prediction"],
                        "confidence": classification_result["confidence"]
                    })
                
                total_score += classification_result["quality_score"]
                
                results["details"].append({
                    "image": image_path,
                    "result": "PASS" if is_passed else "FAIL",
                    "quality_score": classification_result["quality_score"],
                    "prediction": classification_result["prediction"],
                    "confidence": classification_result["confidence"]
                })
            else:
                results["details"].append({
                    "image": image_path,
                    "result": "ERROR",
                    "error": classification_result["error"]
                })
        
        # 배치 전체 품질 점수 계산
        if results["total_products"] > 0:
            results["batch_quality_score"] = total_score / results["total_products"]
            results["pass_rate"] = results["passed"] / results["total_products"] * 100
        
        return results
    
    def analyze_maintenance_report(self, report_text: str) -> Dict:
        """정비 보고서 자동 분석"""
        # 텍스트 감정 분석 (문제 심각도 파악)
        sentiment_result = self.hf_client.analyze_text(
            report_text, 
            "cardiffnlp/twitter-roberta-base-sentiment-latest"
        )
        
        # 텍스트 요약 생성
        summary_result = self.hf_client.generate_text(
            f"다음 정비 보고서를 요약해주세요: {report_text}",
            "facebook/bart-large-cnn"
        )
        
        return {
            "original_text": report_text,
            "sentiment_analysis": sentiment_result,
            "summary": summary_result,
            "urgency_level": self._calculate_urgency(sentiment_result),
            "timestamp": time.time()
        }
    
    def _calculate_urgency(self, sentiment_result: Dict) -> str:
        """보고서 긴급도 계산"""
        if isinstance(sentiment_result, list) and len(sentiment_result) > 0:
            # NEGATIVE 점수가 높으면 긴급
            for item in sentiment_result:
                if item.get('label') == 'NEGATIVE' and item.get('score', 0) > 0.7:
                    return "HIGH"
                elif item.get('label') == 'NEGATIVE' and item.get('score', 0) > 0.4:
                    return "MEDIUM"
            return "LOW"
        return "UNKNOWN"

# 사용 예시
if __name__ == "__main__":
    # API 토큰 설정 (환경변수에서 읽어오는 것을 권장)
    HF_TOKEN = "your_huggingface_token_here"
    
    # 시스템 초기화
    manufacturing_ai = ManufacturingAISystem(HF_TOKEN)
    
    # 제품 배치 검사 예시
    sample_images = [
        "product_001.jpg",
        "product_002.jpg", 
        "product_003.jpg"
    ]
    
    batch_result = manufacturing_ai.inspect_product_batch(sample_images)
    print("배치 검사 결과:")
    print(json.dumps(batch_result, indent=2, ensure_ascii=False))
    
    # 정비 보고서 분석 예시
    maintenance_report = """
    설비명: 프레스 기계 #3
    점검일: 2024-08-13
    발견사항: 
    - 유압 시스템에서 미세한 오일 누수 확인
    - 진동 수치가 평소보다 10% 증가
    - 소음 레벨이 정상 범위 상한선 근처
    
    조치사항:
    - 오일 누수 부위 밀봉 교체 필요
    - 진동 원인 정밀 진단 권장
    - 다음 주까지 재점검 예정
    """
    
    report_analysis = manufacturing_ai.analyze_maintenance_report(maintenance_report)
    print("\n정비 보고서 분석 결과:")
    print(json.dumps(report_analysis, indent=2, ensure_ascii=False))

Ollama API 통합

Ollama API를 활용하면 로컬 환경에서 대형 언어 모델을 안전하고 효율적으로 운영할 수 있습니다.

제조업 환경에서는 데이터 보안이 매우 중요하므로, 클라우드로 데이터를 전송하지 않고 내부 네트워크에서 AI 모델을 활용할 수 있는 Ollama의 장점이 특히 부각됩니다. API를 통해 자연어 질의응답, 문서 요약, 데이터 분석 인사이트 생성 등의 기능을 구현할 수 있으며, 이를 기존 제조 시스템과 통합하여 지능형 관리 시스템을 구축할 수 있습니다.

Ollama API는 REST 방식으로 동작하므로 다양한 프로그래밍 언어에서 쉽게 연동할 수 있으며, 비동기 처리를 통해 여러 요청을 동시에 처리할 수 있어 대규모 제조 환경에서도 효율적으로 활용할 수 있습니다.

다음은 Ollama API를 활용한 제조업 특화 AI 서비스 구현 예시입니다.

Ollama API를 활용한 제조업 특화 AI서비스 구현 예시 >

import asyncio
import aiohttp
import json
from typing import Dict, List, Optional, AsyncGenerator
from dataclasses import dataclass
from datetime import datetime
import logging

@dataclass
class ManufacturingAnalysisRequest:
    """제조업 분석 요청 데이터 클래스"""
    request_id: str
    request_type: str  # 'quality_analysis', 'maintenance_prediction', 'supply_optimization'
    data: Dict
    priority: int = 1  # 1(높음) ~ 5(낮음)
    timestamp: datetime = None
    
    def __post_init__(self):
        if self.timestamp is None:
            self.timestamp = datetime.now()

class OllamaManufacturingAI:
    """Ollama 기반 제조업 AI 서비스"""
    
    def __init__(self, ollama_host: str = "localhost", ollama_port: int = 11434):
        self.base_url = f"http://{ollama_host}:{ollama_port}"
        self.default_model = "llama2:7b"
        self.session = None
        self.logger = self._setup_logger()
        
        # 제조업 특화 프롬프트 템플릿
        self.prompt_templates = {
            "quality_analysis": """
당신은 제조업 품질 관리 전문가입니다. 다음 품질 데이터를 분석하고 개선 방안을 제시해주세요.

데이터: {data}

다음 형식으로 답변해주세요:
1. 현재 품질 상태 분석
2. 주요 문제점 식별
3. 개선 권고사항
4. 예상 효과

답변은 현장 관리자가 이해하기 쉽게 작성해주세요.
""",
            
            "maintenance_prediction": """
당신은 설비 예방정비 전문가입니다. 다음 설비 데이터를 분석하여 정비 일정을 제안해주세요.

설비 데이터: {data}

분석 내용:
1. 설비 현재 상태 평가
2. 고장 위험도 분석
3. 권장 정비 일정
4. 정비 우선순위
5. 예상 정비 비용

실용적이고 구체적인 조치사항을 제시해주세요.
""",
            
            "supply_optimization": """
당신은 공급망 최적화 전문가입니다. 다음 공급망 데이터를 분석하여 최적화 방안을 제시해주세요.

공급망 데이터: {data}

분석 결과:
1. 현재 공급망 효율성 평가
2. 병목 구간 식별
3. 재고 최적화 방안
4. 비용 절감 기회
5. 리스크 관리 방안

제조 현장에서 즉시 적용 가능한 방안을 중심으로 제안해주세요.
"""
        }
    
    def _setup_logger(self):
        """로깅 설정"""
        logger = logging.getLogger("OllamaManufacturingAI")
        logger.setLevel(logging.INFO)
        if not logger.handlers:
            handler = logging.StreamHandler()
            formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
            handler.setFormatter(formatter)
            logger.addHandler(handler)
        return logger
    
    async def __aenter__(self):
        """비동기 컨텍스트 매니저 진입"""
        self.session = aiohttp.ClientSession()
        return self
    
    async def __aexit__(self, exc_type, exc_val, exc_tb):
        """비동기 컨텍스트 매니저 종료"""
        if self.session:
            await self.session.close()
    
    async def generate_analysis(self, request: ManufacturingAnalysisRequest) -> Dict:
        """제조업 분석 생성"""
        try:
            # 요청 타입에 따른 프롬프트 선택
            template = self.prompt_templates.get(request.request_type)
            if not template:
                raise ValueError(f"지원하지 않는 요청 타입: {request.request_type}")
            
            # 프롬프트 생성
            prompt = template.format(data=json.dumps(request.data, ensure_ascii=False, indent=2))
            
            # Ollama API 호출
            response = await self._call_ollama_api(prompt, request.request_id)
            
            return {
                "request_id": request.request_id,
                "request_type": request.request_type,
                "analysis": response,
                "timestamp": datetime.now().isoformat(),
                "status": "success"
            }
            
        except Exception as e:
            self.logger.error(f"분석 생성 오류 (요청 ID: {request.request_id}): {str(e)}")
            return {
                "request_id": request.request_id,
                "request_type": request.request_type,
                "error": str(e),
                "timestamp": datetime.now().isoformat(),
                "status": "error"
            }
    
    async def _call_ollama_api(self, prompt: str, request_id: str) -> str:
        """Ollama API 호출"""
        url = f"{self.base_url}/api/generate"
        payload = {
            "model": self.default_model,
            "prompt": prompt,
            "stream": False,
            "options": {
                "temperature": 0.1,  # 제조업에서는 일관성이 중요
                "top_p": 0.9,
                "max_tokens": 1000
            }
        }
        
        try:
            async with self.session.post(url, json=payload, timeout=60) as response:
                if response.status == 200:
                    result = await response.json()
                    return result.get("response", "응답을 받을 수 없습니다.")
                else:
                    error_text = await response.text()
                    raise Exception(f"Ollama API 오류: {response.status} - {error_text}")
                    
        except asyncio.TimeoutError:
            raise Exception("API 요청 시간 초과")
        except Exception as e:
            raise Exception(f"API 호출 실패: {str(e)}")
    
    async def batch_analysis(self, requests: List[ManufacturingAnalysisRequest]) -> List[Dict]:
        """배치 분석 처리"""
        self.logger.info(f"배치 분석 시작: {len(requests)}개 요청")
        
        # 우선순위별로 정렬
        sorted_requests = sorted(requests, key=lambda x: x.priority)
        
        # 동시 처리 (최대 3개씩)
        semaphore = asyncio.Semaphore(3)
        
        async def process_request(req):
            async with semaphore:
                return await self.generate_analysis(req)
        
        # 모든 요청 동시 처리
        tasks = [process_request(req) for req in sorted_requests]
        results = await asyncio.gather(*tasks, return_exceptions=True)
        
        # 예외 처리
        processed_results = []
        for i, result in enumerate(results):
            if isinstance(result, Exception):
                processed_results.append({
                    "request_id": sorted_requests[i].request_id,
                    "error": str(result),
                    "status": "error"
                })
            else:
                processed_results.append(result)
        
        self.logger.info(f"배치 분석 완료: {len(processed_results)}개 결과")
        return processed_results
    
    async def stream_analysis(self, request: ManufacturingAnalysisRequest) -> AsyncGenerator[str, None]:
        """스트리밍 분석 (실시간 결과 반환)"""
        template = self.prompt_templates.get(request.request_type)
        if not template:
            yield f"오류: 지원하지 않는 요청 타입 - {request.request_type}"
            return
        
        prompt = template.format(data=json.dumps(request.data, ensure_ascii=False, indent=2))
        
        url = f"{self.base_url}/api/generate"
        payload = {
            "model": self.default_model,
            "prompt": prompt,
            "stream": True
        }
        
        try:
            async with self.session.post(url, json=payload) as response:
                if response.status == 200:
                    async for line in response.content:
                        if line:
                            try:
                                data = json.loads(line.decode('utf-8'))
                                if 'response' in data:
                                    yield data['response']
                                if data.get('done'):
                                    break
                            except json.JSONDecodeError:
                                continue
                else:
                    yield f"오류: API 호출 실패 - {response.status}"
        except Exception as e:
            yield f"오류: {str(e)}"

class ManufacturingAIOrchestrator:
    """제조업 AI 오케스트레이터"""
    
    def __init__(self, ollama_host: str = "localhost"):
        self.ollama_ai = OllamaManufacturingAI(ollama_host)
        self.request_queue = asyncio.Queue()
        self.results_cache = {}
        self.is_running = False
    
    async def start_processing(self):
        """요청 처리 시작"""
        self.is_running = True
        await self._process_queue()
    
    async def stop_processing(self):
        """요청 처리 중지"""
        self.is_running = False
    
    async def submit_request(self, request: ManufacturingAnalysisRequest) -> str:
        """분석 요청 제출"""
        await self.request_queue.put(request)
        return request.request_id
    
    async def get_result(self, request_id: str) -> Optional[Dict]:
        """결과 조회"""
        return self.results_cache.get(request_id)
    
    async def _process_queue(self):
        """요청 큐 처리"""
        async with self.ollama_ai:
            while self.is_running:
                try:
                    # 큐에서 요청 가져오기 (타임아웃 1초)
                    request = await asyncio.wait_for(
                        self.request_queue.get(), 
                        timeout=1.0
                    )
                    
                    # 분석 수행
                    result = await self.ollama_ai.generate_analysis(request)
                    
                    # 결과 캐시에 저장
                    self.results_cache[request.request_id] = result
                    
                    # 큐 작업 완료 표시
                    self.request_queue.task_done()
                    
                except asyncio.TimeoutError:
                    # 큐가 비어있으면 계속 대기
                    continue
                except Exception as e:
                    logging.error(f"요청 처리 오류: {str(e)}")

# 사용 예시
async def main():
    """메인 함수 예시"""
    
    # AI 오케스트레이터 생성
    orchestrator = ManufacturingAIOrchestrator()
    
    # 예시 요청 생성
    quality_request = ManufacturingAnalysisRequest(
        request_id="QA_001",
        request_type="quality_analysis",
        data={
            "product_line": "A라인",
            "defect_rate": 0.03,
            "inspection_results": [
                {"product_id": "P001", "result": "PASS", "score": 0.95},
                {"product_id": "P002", "result": "FAIL", "score": 0.72},
                {"product_id": "P003", "result": "PASS", "score": 0.89}
            ],
            "common_defects": ["표면 스크래치", "색상 불균일"]
        },
        priority=1
    )
    
    maintenance_request = ManufacturingAnalysisRequest(
        request_id="MT_001",
        request_type="maintenance_prediction",
        data={
            "equipment_id": "PRESS_001",
            "temperature": 85.5,
            "vibration": 2.8,
            "runtime_hours": 1250,
            "last_maintenance": "2024-07-15",
            "maintenance_history": [
                {"date": "2024-07-15", "type": "정기점검", "issues": "없음"},
                {"date": "2024-06-01", "type": "부품교체", "issues": "벨트 교체"}
            ]
        },
        priority=2
    )
    
    # 요청 제출
    quality_id = await orchestrator.submit_request(quality_request)
    maintenance_id = await orchestrator.submit_request(maintenance_request)
    
    print(f"품질 분석 요청 제출: {quality_id}")
    print(f"정비 예측 요청 제출: {maintenance_id}")
    
    # 처리 시작 (백그라운드에서 실행)
    processing_task = asyncio.create_task(orchestrator.start_processing())
    
    # 결과 대기 및 출력
    while True:
        quality_result = await orchestrator.get_result(quality_id)
        maintenance_result = await orchestrator.get_result(maintenance_id)
        
        if quality_result:
            print("\n=== 품질 분석 결과 ===")
            print(quality_result.get("analysis", "분석 실패"))
        
        if maintenance_result:
            print("\n=== 정비 예측 결과 ===")
            print(maintenance_result.get("analysis", "분석 실패"))
        
        if quality_result and maintenance_result:
            break
        
        await asyncio.sleep(2)  # 2초마다 결과 확인
    
    # 처리 중지
    await orchestrator.stop_processing()
    processing_task.cancel()

# 실행
if __name__ == "__main__":
    asyncio.run(main())

배치 처리 및 자동화

제조업 환경에서는 대량의 데이터를 정기적으로 처리해야 하는 경우가 많습니다.

일일 품질 보고서 생성, 주간 설비 상태 분석, 월간 공급망 최적화 등의 작업을 자동화하면 인력 효율성을 크게 향상시킬 수 있습니다. Python의 스케줄링 라이브러리와 함께 Hugging Face와 Ollama를 활용하면 강력한 배치 처리 시스템을 구축할 수 있습니다.

특히 APScheduler를 사용하면 크론 표현식으로 복잡한 스케줄을 정의할 수 있으며, 오류 발생 시 재시도 로직이나 알림 기능도 구현할 수 있습니다. 배치 처리 시에는 메모리 관리, 로그 기록, 프로그레스 모니터링, 오류 처리 등을 종합적으로 고려해야 하며, 처리 결과를 데이터베이스나 파일 시스템에 안전하게 저장하는 메커니즘도 필요합니다.

모니터링 및 로깅

제조업 AI 시스템의 안정적인 운영을 위해서는 체계적인 모니터링과 로깅 시스템이 필수적입니다.

시스템 성능, 모델 정확도, 데이터 품질, 오류 발생률 등을 실시간으로 추적하고 분석할 수 있어야 합니다. 특히 제조 현장에서는 시스템 다운타임이 생산성에 직접적인 영향을 미치므로, 문제를 조기에 감지하고 대응할 수 있는 모니터링 체계가 중요합니다.

Python의 logging 모듈과 함께 Prometheus, Grafana 같은 모니터링 도구를 연동하면 종합적인 관제 시스템을 구축할 수 있습니다. 또한 이상 상황 발생 시 자동으로 알림을 발송하고, 로그 데이터를 분석해 시스템 개선 방향을 도출할 수 있는 기능도 구현해야 합니다.

다음은 제조업 AI 시스템을 위한 종합 모니터링 및 로깅 시스템 구현 예시입니다.

제조업 AI시스템을 위한 종합 모니터링 및 로깅 시스템 구현 예시 >

import logging
import json
import time
import psutil
import threading
from datetime import datetime, timedelta
from typing import Dict, List, Optional, Any
from dataclasses import dataclass, asdict
from collections import defaultdict, deque
import sqlite3
import asyncio
from prometheus_client import Counter, Histogram, Gauge, start_http_server
import smtplib
from email.mime.text import MimeText
import requests

@dataclass
class SystemMetrics:
    """시스템 메트릭 데이터 클래스"""
    timestamp: datetime
    cpu_usage: float
    memory_usage: float
    disk_usage: float
    gpu_usage: Optional[float] = None
    gpu_memory: Optional[float] = None
    
@dataclass
class AIModelMetrics:
    """AI 모델 메트릭 데이터 클래스"""
    timestamp: datetime
    model_name: str
    request_count: int
    avg_response_time: float
    error_rate: float
    accuracy_score: Optional[float] = None

@dataclass
class Alert:
    """알람 데이터 클래스"""
    alert_id: str
    timestamp: datetime
    severity: str  # 'LOW', 'MEDIUM', 'HIGH', 'CRITICAL'
    category: str  # 'SYSTEM', 'MODEL', 'DATA', 'BUSINESS'
    message: str
    details: Dict[str, Any]
    resolved: bool = False

class ManufacturingAIMonitor:
    """제조업 AI 시스템 모니터링"""
    
    def __init__(self, config: Dict):
        self.config = config
        self.logger = self._setup_logger()
        self.db_path = config.get('monitoring', {}).get('db_path', 'monitoring.db')
        
        # Prometheus 메트릭 정의
        self.request_counter = Counter('ai_requests_total', 'Total AI requests', ['model', 'status'])
        self.response_time = Histogram('ai_response_time_seconds', 'AI response time', ['model'])
        self.system_cpu = Gauge('system_cpu_usage', 'CPU usage percentage')
        self.system_memory = Gauge('system_memory_usage', 'Memory usage percentage')
        self.model_accuracy = Gauge('model_accuracy_score', 'Model accuracy', ['model'])
        
        # 메트릭 저장소
        self.system_metrics_buffer = deque(maxlen=1000)
        self.model_metrics_buffer = defaultdict(lambda: deque(maxlen=1000))
        self.alert_queue = deque(maxlen=100)
        
        # 모니터링 상태
        self.monitoring_active = False
        self.alert_thresholds = config.get('alert_thresholds', self._default_thresholds())
        
        # 데이터베이스 초기화
        self._init_monitoring_db()
        
        # Prometheus 서버 시작
        prometheus_port = config.get('monitoring', {}).get('prometheus_port', 8000)
        start_http_server(prometheus_port)
        self.logger.info(f"Prometheus 메트릭 서버 시작: 포트 {prometheus_port}")
    
    def _setup_logger(self):
        """로깅 설정"""
        logger = logging.getLogger("ManufacturingAIMonitor")
        logger.setLevel(logging.INFO)
        
        # 파일 핸들러 (일별 로그 파일)
        log_file = f"ai_monitor_{datetime.now().strftime('%Y%m%d')}.log"
        file_handler = logging.FileHandler(log_file)
        file_formatter = logging.Formatter(
            '%(asctime)s - %(name)s - %(levelname)s - %(funcName)s:%(lineno)d - %(message)s'
        )
        file_handler.setFormatter(file_formatter)
        logger.addHandler(file_handler)
        
        # 콘솔 핸들러
        console_handler = logging.StreamHandler()
        console_formatter = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')
        console_handler.setFormatter(console_formatter)
        logger.addHandler(console_handler)
        
        return logger
    
    def _default_thresholds(self) -> Dict:
        """기본 알람 임계값"""
        return {
            'cpu_usage': {'warning': 80, 'critical': 95},
            'memory_usage': {'warning': 85, 'critical': 95},
            'disk_usage': {'warning': 85, 'critical': 95},
            'response_time': {'warning': 5.0, 'critical': 10.0},
            'error_rate': {'warning': 0.05, 'critical': 0.1},
            'accuracy_drop': {'warning': 0.05, 'critical': 0.1}
        }
    
    def _init_monitoring_db(self):
        """모니터링 데이터베이스 초기화"""
        with sqlite3.connect(self.db_path) as conn:
            cursor = conn.cursor()
            
            # 시스템 메트릭 테이블
            cursor.execute('''
                CREATE TABLE IF NOT EXISTS system_metrics (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    timestamp TIMESTAMP,
                    cpu_usage REAL,
                    memory_usage REAL,
                    disk_usage REAL,
                    gpu_usage REAL,
                    gpu_memory REAL
                )
            ''')
            
            # 모델 메트릭 테이블
            cursor.execute('''
                CREATE TABLE IF NOT EXISTS model_metrics (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    timestamp TIMESTAMP,
                    model_name TEXT,
                    request_count INTEGER,
                    avg_response_time REAL,
                    error_rate REAL,
                    accuracy_score REAL
                )
            ''')
            
            # 알람 테이블
            cursor.execute('''
                CREATE TABLE IF NOT EXISTS alerts (
                    id INTEGER PRIMARY KEY AUTOINCREMENT,
                    alert_id TEXT UNIQUE,
                    timestamp TIMESTAMP,
                    severity TEXT,
                    category TEXT,
                    message TEXT,
                    details TEXT,
                    resolved BOOLEAN DEFAULT 0,
                    resolved_at TIMESTAMP
                )
            ''')
            
            conn.commit()
    
    def start_monitoring(self):
        """모니터링 시작"""
        self.monitoring_active = True
        self.logger.info("AI 시스템 모니터링 시작")
        
        # 시스템 메트릭 수집 스레드
        system_thread = threading.Thread(target=self._collect_system_metrics, daemon=True)
        system_thread.start()
        
        # 알람 처리 스레드
        alert_thread = threading.Thread(target=self._process_alerts, daemon=True)
        alert_thread.start()
        
        # 데이터베이스 저장 스레드
        db_thread = threading.Thread(target=self._save_metrics_to_db, daemon=True)
        db_thread.start()
    
    def stop_monitoring(self):
        """모니터링 중지"""
        self.monitoring_active = False
        self.logger.info("AI 시스템 모니터링 중지")
    
    def _collect_system_metrics(self):
        """시스템 메트릭 수집"""
        while self.monitoring_active:
            try:
                # CPU 사용률
                cpu_usage = psutil.cpu_percent(interval=1)
                
                # 메모리 사용률
                memory = psutil.virtual_memory()
                memory_usage = memory.percent
                
                # 디스크 사용률
                disk = psutil.disk_usage('/')
                disk_usage = disk.percent
                
                # GPU 사용률 (nvidia-ml-py 필요)
                gpu_usage = None
                gpu_memory = None
                try:
                    import pynvml
                    pynvml.nvmlInit()
                    handle = pynvml.nvmlDeviceGetHandleByIndex(0)
                    gpu_info = pynvml.nvmlDeviceGetUtilizationRates(handle)
                    memory_info = pynvml.nvmlDeviceGetMemoryInfo(handle)
                    
                    gpu_usage = gpu_info.gpu
                    gpu_memory = memory_info.used / memory_info.total * 100
                except:
                    pass  # GPU 정보를 가져올 수 없는 경우
                
                # 메트릭 객체 생성
                metrics = SystemMetrics(
                    timestamp=datetime.now(),
                    cpu_usage=cpu_usage,
                    memory_usage=memory_usage,
                    disk_usage=disk_usage,
                    gpu_usage=gpu_usage,
                    gpu_memory=gpu_memory
                )
                
                # 버퍼에 저장
                self.system_metrics_buffer.append(metrics)
                
                # Prometheus 메트릭 업데이트
                self.system_cpu.set(cpu_usage)
                self.system_memory.set(memory_usage)
                
                # 임계값 확인 및 알람 생성
                self._check_system_thresholds(metrics)
                
            except Exception as e:
                self.logger.error(f"시스템 메트릭 수집 오류: {str(e)}")
            
            time.sleep(30)  # 30초마다 수집
    
    def record_ai_request(self, model_name: str, response_time: float, success: bool, accuracy: Optional[float] = None):
        """AI 요청 메트릭 기록"""
        try:
            # Prometheus 메트릭 업데이트
            status = 'success' if success else 'error'
            self.request_counter.labels(model=model_name, status=status).inc()
            self.response_time.labels(model=model_name).observe(response_time)
            
            if accuracy is not None:
                self.model_accuracy.labels(model=model_name).set(accuracy)
            
            # 모델별 메트릭 집계 (1분 단위)
            current_minute = datetime.now().replace(second=0, microsecond=0)
            model_buffer = self.model_metrics_buffer[model_name]
            
            # 현재 분의 메트릭이 있는지 확인
            if model_buffer and model_buffer[-1].timestamp.replace(second=0, microsecond=0) == current_minute:
                # 기존 메트릭 업데이트
                last_metric = model_buffer[-1]
                last_metric.request_count += 1
                
                # 평균 응답 시간 재계산
                total_time = last_metric.avg_response_time * (last_metric.request_count - 1) + response_time
                last_metric.avg_response_time = total_time / last_metric.request_count
                
                # 에러율 재계산
                if not success:
                    error_count = last_metric.error_rate * (last_metric.request_count - 1) + 1
                    last_metric.error_rate = error_count / last_metric.request_count
                else:
                    error_count = last_metric.error_rate * (last_metric.request_count - 1)
                    last_metric.error_rate = error_count / last_metric.request_count
                
                if accuracy is not None:
                    last_metric.accuracy_score = accuracy
            else:
                # 새로운 메트릭 생성
                new_metric = AIModelMetrics(
                    timestamp=current_minute,
                    model_name=model_name,
                    request_count=1,
                    avg_response_time=response_time,
                    error_rate=0.0 if success else 1.0,
                    accuracy_score=accuracy
                )
                model_buffer.append(new_metric)
            
            # 모델 성능 임계값 확인
            if model_buffer:
                self._check_model_thresholds(model_buffer[-1])
                
        except Exception as e:
            self.logger.error(f"AI 요청 메트릭 기록 오류: {str(e)}")
    
    def _check_system_thresholds(self, metrics: SystemMetrics):
        """시스템 임계값 확인"""
        thresholds = self.alert_thresholds
        
        # CPU 사용률 확인
        if metrics.cpu_usage > thresholds['cpu_usage']['critical']:
            self._create_alert('CRITICAL', 'SYSTEM', 
                            f"CPU 사용률 위험: {metrics.cpu_usage:.1f}%",
                            {'cpu_usage': metrics.cpu_usage})
        elif metrics.cpu_usage > thresholds['cpu_usage']['warning']:
            self._create_alert('MEDIUM', 'SYSTEM',
                            f"CPU 사용률 경고: {metrics.cpu_usage:.1f}%",
                            {'cpu_usage': metrics.cpu_usage})
        
        # 메모리 사용률 확인
        if metrics.memory_usage > thresholds['memory_usage']['critical']:
            self._create_alert('CRITICAL', 'SYSTEM',
                            f"메모리 사용률 위험: {metrics.memory_usage:.1f}%",
                            {'memory_usage': metrics.memory_usage})
        elif metrics.memory_usage > thresholds['memory_usage']['warning']:
            self._create_alert('MEDIUM', 'SYSTEM',
                            f"메모리 사용률 경고: {metrics.memory_usage:.1f}%",
                            {'memory_usage': metrics.memory_usage})
        
        # 디스크 사용률 확인
        if metrics.disk_usage > thresholds['disk_usage']['critical']:
            self._create_alert('CRITICAL', 'SYSTEM',
                            f"디스크 사용률 위험: {metrics.disk_usage:.1f}%",
                            {'disk_usage': metrics.disk_usage})
    
    def _check_model_thresholds(self, metrics: AIModelMetrics):
        """모델 성능 임계값 확인"""
        thresholds = self.alert_thresholds
        
        # 응답 시간 확인
        if metrics.avg_response_time > thresholds['response_time']['critical']:
            self._create_alert('HIGH', 'MODEL',
                            f"모델 응답 시간 지연: {metrics.model_name} - {metrics.avg_response_time:.2f}초",
                            {'model': metrics.model_name, 'response_time': metrics.avg_response_time})
        
        # 에러율 확인
        if metrics.error_rate > thresholds['error_rate']['critical']:
            self._create_alert('HIGH', 'MODEL',
                            f"모델 에러율 증가: {metrics.model_name} - {metrics.error_rate:.2%}",
                            {'model': metrics.model_name, 'error_rate': metrics.error_rate})
    
    def _create_alert(self, severity: str, category: str, message: str, details: Dict):
        """알람 생성"""
        alert_id = f"{category}_{severity}_{int(time.time())}"
        
        alert = Alert(
            alert_id=alert_id,
            timestamp=datetime.now(),
            severity=severity,
            category=category,
            message=message,
            details=details
        )
        
        self.alert_queue.append(alert)
        self.logger.warning(f"알람 생성: [{severity}] {message}")
    
    def _process_alerts(self):
        """알람 처리"""
        while self.monitoring_active:
            try:
                if self.alert_queue:
                    alert = self.alert_queue.popleft()
                    
                    # 데이터베이스에 저장
                    self._save_alert_to_db(alert)
                    
                    # 심각도에 따른 알림 발송
                    if alert.severity in ['HIGH', 'CRITICAL']:
                        self._send_alert_notification(alert)
                    
            except Exception as e:
                self.logger.error(f"알람 처리 오류: {str(e)}")
            
            time.sleep(5)
    
    def _save_metrics_to_db(self):
        """메트릭을 데이터베이스에 저장"""
        while self.monitoring_active:
            try:
                with sqlite3.connect(self.db_path) as conn:
                    cursor = conn.cursor()
                    
                    # 시스템 메트릭 저장
                    while self.system_metrics_buffer:
                        metrics = self.system_metrics_buffer.popleft()
                        cursor.execute('''
                            INSERT INTO system_metrics 
                            (timestamp, cpu_usage, memory_usage, disk_usage, gpu_usage, gpu_memory)
                            VALUES (?, ?, ?, ?, ?, ?)
                        ''', (
                            metrics.timestamp,
                            metrics.cpu_usage,
                            metrics.memory_usage,
                            metrics.disk_usage,
                            metrics.gpu_usage,
                            metrics.gpu_memory
                        ))
                    
                    # 모델 메트릭 저장
                    for model_name, buffer in self.model_metrics_buffer.items():
                        while buffer:
                            metrics = buffer.popleft()
                            cursor.execute('''
                                INSERT INTO model_metrics
                                (timestamp, model_name, request_count, avg_response_time, error_rate, accuracy_score)
                                VALUES (?, ?, ?, ?, ?, ?)
                            ''', (
                                metrics.timestamp,
                                metrics.model_name,
                                metrics.request_count,
                                metrics.avg_response_time,
                                metrics.error_rate,
                                metrics.accuracy_score
                            ))
                    
                    conn.commit()
                    
            except Exception as e:
                self.logger.error(f"메트릭 저장 오류: {str(e)}")
            
            time.sleep(60)  # 1분마다 저장
    
    def _save_alert_to_db(self, alert: Alert):
        """알람을 데이터베이스에 저장"""
        try:
            with sqlite3.connect(self.db_path) as conn:
                cursor = conn.cursor()
                cursor.execute('''
                    INSERT OR REPLACE INTO alerts
                    (alert_id, timestamp, severity, category, message, details, resolved)
                    VALUES (?, ?, ?, ?, ?, ?, ?)
                ''', (
                    alert.alert_id,
                    alert.timestamp,
                    alert.severity,
                    alert.category,
                    alert.message,
                    json.dumps(alert.details),
                    alert.resolved
                ))
                conn.commit()
        except Exception as e:
            self.logger.error(f"알람 저장 오류: {str(e)}")
    
    def _send_alert_notification(self, alert: Alert):
        """알람 알림 발송"""
        try:
            notification_config = self.config.get('notifications', {})
            
            # 이메일 알림
            if notification_config.get('email', {}).get('enabled', False):
                self._send_email_alert(alert, notification_config['email'])
            
            # Slack 알림
            if notification_config.get('slack', {}).get('enabled', False):
                self._send_slack_alert(alert, notification_config['slack'])
            
            # Webhook 알림
            if notification_config.get('webhook', {}).get('enabled', False):
                self._send_webhook_alert(alert, notification_config['webhook'])
                
        except Exception as e:
            self.logger.error(f"알림 발송 오류: {str(e)}")
    
    def _send_slack_alert(self, alert: Alert, slack_config: Dict):
        """Slack 알림 발송"""
        try:
            webhook_url = slack_config.get('webhook_url')
            if not webhook_url:
                return
            
            color_map = {
                'LOW': 'good',
                'MEDIUM': 'warning', 
                'HIGH': 'danger',
                'CRITICAL': 'danger'
            }
            
            payload = {
                "attachments": [{
                    "color": color_map.get(alert.severity, 'warning'),
                    "title": f"{alert.severity} 알람",
                    "text": alert.message,
                    "fields": [
                        {"title": "카테고리", "value": alert.category, "short": True},
                        {"title": "시간", "value": alert.timestamp.strftime('%Y-%m-%d %H:%M:%S'), "short": True}
                    ],
                    "footer": "제조업 AI 모니터링 시스템"
                }]
            }
            
            response = requests.post(webhook_url, json=payload, timeout=10)
            if response.status_code == 200:
                self.logger.info(f"Slack 알림 발송 성공: {alert.alert_id}")
            else:
                self.logger.error(f"Slack 알림 발송 실패: {response.status_code}")
                
        except Exception as e:
            self.logger.error(f"Slack 알림 발송 오류: {str(e)}")
    
    def get_system_status(self) -> Dict:
        """시스템 상태 조회"""
        try:
            # 최근 시스템 메트릭 가져오기
            latest_system = self.system_metrics_buffer[-1] if self.system_metrics_buffer else None
            
            # 활성 알람 수 계산
            active_alerts = len([a for a in self.alert_queue if not a.resolved])
            
            # 모델별 상태
            model_status = {}
            for model_name, buffer in self.model_metrics_buffer.items():
                if buffer:
                    latest = buffer[-1]
                    model_status[model_name] = {
                        'last_updated': latest.timestamp.isoformat(),
                        'request_count': latest.request_count,
                        'avg_response_time': latest.avg_response_time,
                        'error_rate': latest.error_rate,
                        'accuracy_score': latest.accuracy_score
                    }
            
            return {
                'system': {
                    'cpu_usage': latest_system.cpu_usage if latest_system else None,
                    'memory_usage': latest_system.memory_usage if latest_system else None,
                    'disk_usage': latest_system.disk_usage if latest_system else None,
                    'last_updated': latest_system.timestamp.isoformat() if latest_system else None
                },
                'models': model_status,
                'alerts': {
                    'active_count': active_alerts,
                    'total_count': len(self.alert_queue)
                },
                'monitoring_active': self.monitoring_active
            }
            
        except Exception as e:
            self.logger.error(f"시스템 상태 조회 오류: {str(e)}")
            return {'error': str(e)}

# 사용 예시
config = {
    'monitoring': {
        'db_path': 'monitoring.db',
        'prometheus_port': 8000
    },
    'alert_thresholds': {
        'cpu_usage': {'warning': 80, 'critical': 95},
        'memory_usage': {'warning': 85, 'critical': 95},
        'response_time': {'warning': 5.0, 'critical': 10.0},
        'error_rate': {'warning': 0.05, 'critical': 0.1}
    },
    'notifications': {
        'slack': {
            'enabled': True,
            'webhook_url': 'https://hooks.slack.com/services/YOUR/SLACK/WEBHOOK'
        },
        'email': {
            'enabled': False,
            'smtp_server': 'smtp.company.com'
        }
    }
}

# 모니터링 시스템 시작
if __name__ == "__main__":
    monitor = ManufacturingAIMonitor(config)
    monitor.start_monitoring()
    
    try:
        # 예시 AI 요청 시뮬레이션
        import random
        while True:
            # 가상의 AI 요청 기록
            model_name = random.choice(['quality_classifier', 'maintenance_predictor', 'supply_optimizer'])
            response_time = random.uniform(0.5, 3.0)
            success = random.random() > 0.05  # 5% 에러율
            accuracy = random.uniform(0.85, 0.98) if success else None
            
            monitor.record_ai_request(model_name, response_time, success, accuracy)
            
            # 시스템 상태 출력 (10초마다)
            if int(time.time()) % 10 == 0:
                status = monitor.get_system_status()
                print(f"\n=== 시스템 상태 ({datetime.now()}) ===")
                print(json.dumps(status, indent=2, ensure_ascii=False))
            
            time.sleep(1)
            
    except KeyboardInterrupt:
        print("\n모니터링 시스템 종료 중...")
        monitor.stop_monitoring()
        print("모니터링 시스템이 정상적으로 종료되었습니다.")

마무리

이 가이드를 통해 제조업 특화 AI 솔루션 개발을 위한 Hugging Face와 Ollama 활용 방법을 종합적으로 살펴보았습니다.

제조업에서 AI 기술의 도입은 단순한 자동화를 넘어서 지능적인 의사결정 지원과 예측적 관리를 가능하게 합니다. Hugging Face의 풍부한 모델 생태계와 Ollama의 효율적인 로컬 실행 환경을 결합하면 보안과 성능을 동시에 확보한 AI 솔루션을 구축할 수 있습니다. 특히 데이터 보안이 중요한 제조업 환경에서는 온프레미스 기반의 AI 시스템이 많은 장점을 제공하며, 이러한 요구사항을 충족하는 최적의 조합이라고 할 수 있습니다.

앞으로도 AI 기술은 계속 발전할 것이며, 제조업에서의 활용 범위도 더욱 확대될 것입니다. 이 가이드에서 제시한 기본 원리와 방법론을 바탕으로 각자의 제조 환경에 맞는 맞춤형 AI 솔루션을 개발하고, 지속적인 학습과 개선을 통해 더욱 발전된 시스템을 구축해 나가시기 바랍니다. 제조업의 디지털 트랜스포메이션 여정에서 이 가이드가 실질적인 도움이 되기를 희망합니다.

부록 A : 참고 자료 및 유용한 링크

공식 문서 및 가이드

Hugging Face 관련 자료

Hugging Face 공식 문서 - 가장 최신의 기능과 사용법
Transformers 라이브러리 문서 - 모델 사용 및 커스터마이징
Datasets 라이브러리 문서 - 데이터 처리 및 관리
Accelerate 문서 - 분산 학습 및 최적화
Hugging Face Hub API - 프로그래매틱 접근 방법

Ollama 관련 자료

Ollama 공식 웹사이트 - 설치 및 기본 사용법
Ollama GitHub 저장소 - 소스코드 및 이슈 트래킹
Ollama 모델 라이브러리 - 사용 가능한 모델 목록
Ollama API 문서 - REST API 활용 방법

제조업 AI 관련 자료

Industry 4.0 가이드 - 스마트 제조업 표준
IIoT (Industrial IoT) 베스트 프랙티스 - 산업용 IoT 구현 방법
제조업 디지털 트랜스포메이션 가이드 - 전략 및 사례 연구

추가 도구 및 라이브러리

데이터 처리 및 분석

Pandas - 데이터 분석 및 조작을 위한 파이썬 라이브러리
NumPy - 수치 계산을 위한 파이썬 라이브러리
Scikit-learn - 머신러닝 알고리즘을 위한 파이썬 라이브러리
Plotly - 인터랙티브 시각화를 위한 플로터를 생성하는 파이썬 라이브러리
Apache Kafka - 실시간 데이터 스트리밍등의 빅데이터를 수집, 전달, 처리하는 라이브러리

모니터링 및 로깅

Prometheus - 시스템 모니터링
Grafana - 메트릭 시각화
ELK Stack - 로그 분석
Jaeger - 분산 트레이싱

배포 및 운영

Docker - 컨테이너화
Kubernetes - 컨테이너 오케스트레이션
FastAPI - API 서버 구축
Redis - 인메모리 데이터베이스

학습 리소스

온라인 강의

Hugging Face Course - 무료 NLP 코스
Deep Learning Specialization (Coursera) - 딥러닝 기초
Machine Learning for Production (MLOps) - 운영 중심 ML

도서

"Hands-On Machine Learning" by Aurélien Géron - 실용적 ML 가이드
"Building Machine Learning Powered Applications" by Emmanuel Ameisen - ML 제품 개발
"Designing Data-Intensive Applications" by Martin Kleppmann - 대규모 시스템 설계

커뮤니티 및 포럼

Hugging Face 포럼 - 기술 질문 및 토론
Stack Overflow - 구체적 문제 해결
Reddit r/MachineLearning - 최신 연구 동향
LinkedIn 제조업 AI 그룹 - 업계 네트워킹

부록 B : 자주 묻는 질문 (FAQ)

설치 및 설정 관련

Q: Hugging Face 모델을 다운로드할 때 속도가 너무 느려요.

A: 다음 방법들을 시도해보세요.

안정적인 인터넷 연결 확인
Hugging Face 토큰 설정으로 다운로드 제한 해제
캐시 디렉토리를 SSD가 있는 위치로 변경
HF_HUB_CACHE 환경변수로 캐시 경로 최적화

Q: Ollama 설치 후 모델을 실행할 수 없어요.

A: 일반적인 해결 방법을 확인해 보세요.

ollama serve 명령으로 서버가 실행 중인지 확인
포트 11434가 다른 프로세스에 의해 사용되고 있지 않은지 확인
충분한 시스템 메모리(최소 8GB 권장) 확보
방화벽에서 포트 11434 허용

Q: GPU를 사용하고 싶은데 CUDA 오류가 발생해요.

A: CUDA 개발 환경에서 아래의 사항을 점검해 보세요.

NVIDIA 드라이버 최신 버전 설치
CUDA Toolkit과 PyTorch 버전 호환성 확인
nvidia-smi 명령으로 GPU 상태 확인
충분한 GPU 메모리 확보 (최소 4GB 권장)

성능 및 최적화 관련

Q: 모델 추론 속도가 너무 느려요.

A: 성능 향상 방법을 고민해보세요.

양자화된 모델 사용 (INT8, INT4)
배치 크기 최적화
GPU 가속 활용
모델 프루닝 적용
TensorRT나 ONNX 런타임 활용

Q: 메모리 부족 오류가 자주 발생해요.

A: 메모리 관리 팁을 활용해 보세요.

배치 크기 줄이기
그래디언트 체크포인팅 사용
모델 병렬화 적용
스와핑 메모리 증설
메모리 효율적인 옵티마이저 사용

Q: 여러 모델을 동시에 사용하고 싶어요.

A: 멀티모델 운영 전략을 수립해서 모델을 사용해 보세요.

모델 서빙 프레임워크 활용 (TensorFlow Serving, TorchServe)
로드 밸런서로 트래픽 분산
모델 캐싱 시스템 구축
컨테이너 기반 격리 환경 구성

제조업 특화 질문

Q: 제조 데이터의 보안을 어떻게 보장하나요?

A: 제조 데이터를 안전하게 할 수 있는 보안 강화 방안은 아래와 같은 것들이 있어요. 기업의 환경에 맞게 고려해보세요.

온프레미스 환경에서 Ollama 활용
데이터 암호화 (전송 중, 저장 시)
접근 권한 관리 시스템 구축
네트워크 분리 및 방화벽 설정
정기적인 보안 감사 수행

Q: 실시간 처리가 필요한데 어떻게 구현하나요?

A: 실시간 시스템 구축 방법에서는 아래의 사항을 고려해야 해요.

스트리밍 데이터 파이프라인 (Apache Kafka, Apache Flink)
엣지 컴퓨팅 환경에서 경량 모델 배포
비동기 처리 및 큐 시스템 활용
캐싱 전략으로 응답 시간 단축

Q: 기존 MES/ERP 시스템과 어떻게 통합하나요?

A: 기업 업무포탈시스템을 통하여 시스템 통합 접근법을 사용해보세요. 물론 사용자별 접근권한을 통해 내부로 부터의 안전을 지키는것도 중요해요.

REST API를 통한 loosely coupled 연동
메시지 큐를 활용한 비동기 통신
데이터베이스 직접 연동 (ETL 프로세스)
미들웨어를 통한 프로토콜 변환
마이크로서비스 아키텍처 적용

문제 해결 관련

Q: 모델 정확도가 기대보다 낮아요.

A: 모델의 정확도를 개선할 수 있는 방법은 좀 더 큰 모델을 사용하는 방법과, 데이터 품질 및 학습이 지속적으로 이루어져야 해요.

도메인 특화 데이터로 파인튜닝
데이터 품질 개선 (노이즈 제거, 라벨링 검증)
앙상블 방법 적용
하이퍼파라미터 튜닝
데이터 증강 기법 적용

Q: 모델이 새로운 데이터에서 성능이 떨어져요.

A: 새로운 형식의 데이터가 나타나는 모델 드리프트에서는 변화하는 데이터에 대응하는 모델 학습이 지속적으로 이루어져야 해요.

지속적인 모델 모니터링 구축
A/B 테스트를 통한 성능 비교
정기적인 모델 재학습 스케줄링
온라인 학습 시스템 도입
성능 임계값 알람 설정

Q: 프로덕션 환경에서 시스템이 불안정해요.

A: 개발환경과 프로덕션 환경은 동일할 수가 없죠. 개발환경은 정해진 틀과 데이터에서 동작되지만, 프로덕션 환경은 예측하지 못한 다양한 이벤트들이 발행하기 때문에 초기의 테스트 환경을 철저히 구축하는 것과, 이벤트 발생시 단순 처리가 아니라 예외처리와 같은 기능으로 포함하는 것을 고려해야 해요.

철저한 테스트 환경 구축
단계적 배포 (카나리, 블루-그린)
로그 모니터링 및 알람 시스템
자동 장애 복구 메커니즘
백업 및 롤백 계획 수립

라이선스 및 규정 관련

Q: 상업적 사용 시 라이선스 문제는 없나요?

A: Hugging Face에서는 무료 모델과 상업적 모델이 구분되어 있으므로, 라이선스를 자세히 확인하고 다운받으시면 문제 없어요.

Hugging Face 모델별 라이선스 개별 확인
Apache 2.0, MIT 등 상업적 사용 허용 라이선스 선호
제3자 데이터셋 사용 시 별도 확인
법무팀과 라이선스 검토 진행
오픈소스 컴플라이언스 도구 활용

Q: 제조업 규정 준수는 어떻게 하나요?

A: 제조업 규정 준수는 일반적인 제조업에서의 안정규정, 보안규정 등을 준수하는 가이드라인을 항상 참조해주세요.

ISO 27001 (정보보안관리) 준수
GDPR, 개인정보보호법 준수
산업별 특화 규정 (FDA, CE 마킹 등) 확인
감사 추적 가능한 로깅 시스템 구축
정기적인 컴플라이언스 점검

저작자표시 비영리 변경금지 (새창열림)

'AI 코딩' 카테고리의 다른 글

초보 개발자를 위한 GPT-5 코딩 활용 가이드 (4)	2025.08.22
제조업 로컬AI에서 Gemma 모델을 추천하지 않는 이유 - 제조업 특화 관점 (13)	2025.08.14
[로컬AI] 중소 제조기업의 로컬AI를 위한 하드웨어 구축 가이드 (13)	2025.08.02
[로컬AI] Ollama모델의 Q4 양자화 모델 설치 및 실행 (8)	2025.07.31
[로컬AI] AI모델 Q4 양자화의 의미와 원리 이해하기 (4)	2025.07.30

Hugging Face 플랫폼 완벽 가이드 - AI모델 공유의 허브

Hugging Face는 전 세계 AI 개발자들이 모델, 데이터셋, 애플리케이션을 공유하고 협업할 수 있는 오픈소스 플랫폼입니다.

[ 차례 ]

1. Hugging Face 플랫폼 이해하기

Hugging Face란?

핵심 구성 요소

제조업에서의 활용 가능성

2. 계정 생성 및 기본 설정

Hugging Face 계정 생성

프로필 설정 및 보안

Access Token 생성 및 관리

3. Hugging Face 라이브러리 설치 및 환경 구축

Python 환경 준비

Hugging Face 라이브러리 설치

Ollama 설치 및 설정

환경 설정 파일 구성

4. 모델 검색 및 다운로드 마스터하기

Hugging Face Hub에서 모델 검색하기

모델 크기별 선택 가이드

로컬 다운로드 및 캐싱

Ollama와 Hugging Face 모델 연동

5. 데이터셋 활용의 모든 것

제조업 관련 데이터셋 찾기

5.2 커스텀 데이터셋 생성 및 업로드

데이터 전처리 및 변환

데이터 품질 검증 및 시각화

6. Spaces를 통한 모델 테스트 및 배포

Hugging Face Spaces 소개

Gradio를 활용한 제조업 AI 데모 애플리케이션

Streamlit 기반 예방정비 대시보드

Hugging Face Spaces에 배포하기

7. API 및 프로그래매틱 활용법

Hugging Face Inference API 활용

Ollama API 통합

배치 처리 및 자동화

모니터링 및 로깅

마무리

부록 A : 참고 자료 및 유용한 링크

공식 문서 및 가이드

추가 도구 및 라이브러리

학습 리소스

부록 B : 자주 묻는 질문 (FAQ)

설치 및 설정 관련

성능 및 최적화 관련

제조업 특화 질문

문제 해결 관련

라이선스 및 규정 관련

'AI 코딩' 카테고리의 다른 글

관련글

티스토리툴바