WbMango의 파이썬

"초보자를 위한 파이썬 강의부터 실무 팁까지! 실력 향상에 도움이 되는 실전 콘텐츠 제공."

  • 2025. 3. 20.

    by. wbmango

    목차

      Streamlit과 PyCaret을 활용한 간단한 머신러닝 앱 개발하기

       

      1. 파이썬 머신러닝 모델을 웹 애플리케이션으로 배포하는 이유

      머신러닝 모델을 개발하는 것만큼 중요한 것이 바로 배포(Deployment) 과정입니다. 많은 데이터 과학자와 머신러닝 엔지니어들은 모델을 만들고 평가하는 데 집중하지만, 실제 서비스 환경에서 사용하기 위해서는 모델을 웹 애플리케이션으로 변환하여 쉽게 접근할 수 있도록 배포하는 것이 필수적입니다. 머신러닝 모델이 연구 환경에서만 사용된다면, 그 가치는 제한적이지만, 비즈니스 환경에서 실제 데이터와 연동하여 실시간으로 예측을 수행할 수 있다면, 모델의 활용도는 극대화됩니다.

      전통적인 머신러닝 워크플로우는 모델을 학습시키고 평가한 후 CSV 파일로 결과를 저장하거나, 간단한 보고서를 생성하는 형태가 많았습니다. 그러나 이렇게 하면 모델의 결과를 실시간으로 활용하기 어렵고, 비전문가들이 접근하기 어려운 단점이 있습니다. 반면, 웹 애플리케이션을 통해 머신러닝 모델을 배포하면 사용자가 직접 데이터를 입력하고 예측 결과를 실시간으로 확인할 수 있어 활용도가 높아집니다. 이는 금융, 의료, 소매, 제조업 등 다양한 산업에서 AI를 효과적으로 적용할 수 있는 핵심적인 방법입니다.

      예를 들어, 의료 분야에서는 환자의 건강 데이터를 입력하면 질병 발생 가능성을 예측하는 머신러닝 모델을 웹 애플리케이션 형태로 배포하여 의사와 환자가 쉽게 사용할 수 있도록 할 수 있습니다. 금융 분야에서는 대출 신청자의 데이터를 입력하면 신용 점수를 예측하는 모델을 배포하여, 대출 승인 여부를 실시간으로 판단할 수도 있습니다. 이처럼, 머신러닝 모델을 웹 애플리케이션으로 배포하면 AI 기반 서비스의 접근성을 높이고, 비즈니스 가치를 극대화할 수 있습니다.

      그러나 많은 데이터 과학자들은 웹 개발 경험이 부족하여 머신러닝 모델을 배포하는 데 어려움을 겪습니다. 이러한 문제를 해결하기 위해 Streamlit이 등장했습니다. Streamlit은 파이썬 코드만으로 손쉽게 웹 애플리케이션을 개발할 수 있도록 지원하는 오픈소스 프레임워크로, 프론트엔드 및 백엔드 개발 지식이 없어도 몇 줄의 코드만으로 직관적인 대시보드를 만들 수 있습니다. 또한, Streamlit은 PyCaret과 같은 AutoML 라이브러리와 결합하여 머신러닝 모델을 더욱 쉽게 학습시키고 배포할 수 있는 강력한 도구입니다.

      이 글에서는 Streamlit과 PyCaret을 활용하여 간단한 머신러닝 앱을 개발하는 방법을 단계별로 소개하겠습니다. PyCaret은 머신러닝 모델의 자동화 및 최적화를 돕는 파이썬 라이브러리로, 간단한 코드만으로 강력한 머신러닝 모델을 구축할 수 있도록 도와줍니다. 본 실습을 통해, 머신러닝 모델을 웹 애플리케이션으로 배포하는 과정과 실무에서 적용하는 방법을 익혀보겠습니다.


      2. 파이썬 Streamlit과 PyCaret의 특징 및 활용

      📍 1. 파이썬 기반 Streamlit의 주요 특징

      Streamlit파이썬 데이터 과학 및 머신러닝 모델을 웹 애플리케이션 형태로 손쉽게 배포할 수 있도록 설계된 프레임워크입니다. 파이썬 개발자와 데이터 과학자를 위한 직관적인 구조 덕분에 빠르게 대시보드를 만들고 시각화 결과를 공유할 수 있습니다.

      • 빠른 개발 속도: 몇 줄의 파이썬 코드만으로 강력한 대시보드를 구축할 수 있음
      • 인터랙티브 한 위젯 제공: 슬라이더, 체크박스, 드롭다운 등 다양한 파이썬 기반 UI 요소 활용 가능
      • 자동 리로딩 기능: 코드 변경 시 웹 페이지가 자동으로 업데이트됨
      • Pandas 및 Matplotlib과의 높은 호환성: 데이터 분석 및 시각화 도구와 손쉽게 연동 가능
      • 클라우드 배포 지원: Streamlit Cloud, AWS, Google Cloud 등 다양한 환경에서 배포 가능

      Streamlit은 파이썬 중심의 프로젝트에서 웹 인터페이스를 만들고자 할 때 매우 유용한 도구이며, 머신러닝 결과를 빠르게 공유하는 데 효과적입니다.

       

      📍 2. 파이썬 AutoML 라이브러리 PyCaret의 주요 특징

      PyCaret파이썬 기반 자동화 머신러닝(AutoML) 라이브러리로, 모델 선택, 하이퍼파라미터 튜닝, 성능 평가, 배포 등을 최소한의 코드로 수행할 수 있게 도와줍니다. 파이썬 초보자도 손쉽게 머신러닝 워크플로우를 구성할 수 있다는 점에서 많은 인기를 끌고 있습니다.

      PyCaret이 제공하는 주요 기능은 다음과 같습니다.

      • 자동 모델 선택 및 비교: 파이썬 코드 한 줄로 다양한 알고리즘을 테스트하고 최적 모델을 선택
      • 데이터 전처리 자동화: 결측치 처리, 이상치 제거, 스케일링 등의 작업을 자동 수행
      • 모델 성능 평가: 다양한 머신러닝 모델을 비교하여 정확도, 정밀도, F1-Score 등의 성능 평가 제공
      • 배포 기능 제공: 학습된 모델을 Streamlit, Flask, FastAPI 등 다른 파이썬 프레임워크와 쉽게 연동 가능

       

      3. 파이썬 Streamlit과 PyCaret을 활용한 머신러닝 앱 개발 실습

      이제 Streamlit과 PyCaret을 활용하여 간단한 머신러닝 앱을 개발하는 과정을 실습해 보겠습니다.

       

      📍 1단계: 파이썬 라이브러리 설치 및 환경 설정

      먼저 필요한 파이썬 라이브러리를 설치합니다.

      pip install streamlit pycaret pandas numpy matplotlib

      설치가 완료되면 Streamlit이 정상적으로 실행되는지 확인합니다.

      streamlit hello

      이 명령어를 실행하면 기본적인 Streamlit의 기능을 소개하는 데모 웹앱이 브라우저에서 자동으로 실행됩니다.

       

      📍 2단계: 파이썬 데이터셋 준비 및 PyCaret 모델 학습

      이제 PyCaret을 활용하여 간단한 머신러닝 모델을 학습시켜 보겠습니다.

      import pandas as pd
      from pycaret.classification import setup, compare_models, save_model
      
      # 데이터 로드
      df = pd.read_csv("https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv")
      
      # PyCaret 설정
      clf = setup(df, target=8, silent=True, session_id=123)
      
      # 최적 모델 선택
      best_model = compare_models()
      
      # 모델 저장
      save_model(best_model, 'best_model')

      위 파이썬 코드를 실행하면 PyCaret이 자동으로 여러 개의 머신러닝 알고리즘을 비교하고 최적의 모델을 선택합니다.

       

      📍 3단계: 파이썬 Streamlit을 활용한 웹앱 개발

      이제 학습된 모델을 Streamlit을 활용하여 웹 애플리케이션 형태로 배포합니다.

      import streamlit as st
      from pycaret.classification import load_model, predict_model
      
      # 모델 로드
      model = load_model('best_model')
      
      # Streamlit 앱 인터페이스
      st.title("🔍 머신러닝 기반 당뇨병 예측 앱")
      st.write("이 앱은 PyCaret을 사용하여 당뇨병 여부를 예측합니다.")
      
      # 사용자 입력
      pregnancies = st.number_input("임신 횟수", 0, 15)
      glucose = st.number_input("혈당 수치", 50, 200)
      bp = st.number_input("혈압", 50, 130)
      insulin = st.number_input("인슐린 수치", 0, 300)
      bmi = st.number_input("체질량지수(BMI)", 10.0, 50.0)
      
      # 예측 실행
      if st.button("예측하기"):
          input_data = pd.DataFrame([[pregnancies, glucose, bp, insulin, bmi]], columns=['Pregnancies', 'Glucose', 'BloodPressure', 'Insulin', 'BMI'])
          prediction = predict_model(model, data=input_data)
          result = prediction['Label'][0]
      
          if result == 1:
              st.error("🚨 당뇨병 가능성이 높습니다.")
          else:
              st.success("✅ 당뇨병 가능성이 낮습니다.")

      이제 streamlit run app.py 명령어를 실행하면, 사용자가 직접 데이터를 입력하고, 파이썬 머신러닝 모델이 실시간으로 예측을 수행하는 웹 애플리케이션이 실행됩니다.


      4. 파이썬 기반 머신러닝 앱의 실무 활용 방법

      머신러닝을 파이썬 기반 웹 애플리케이션으로 배포하면 다양한 산업 분야에서 실시간 데이터 분석 및 예측 서비스를 운영 환경에 적용할 수 있습니다. 특히 Streamlit과 PyCaret 같은 파이썬 라이브러리를 활용하면, 복잡한 머신러닝 모델을 손쉽게 웹 앱 형태로 구현하여 실무에 접목할 수 있습니다.

      파이썬 머신러닝 모델을 실무에 적용하는 대표적인 사례는 다음과 같습니다:

      • 헬스케어: 당뇨병, 심장병 등 질병 예측 모델 구축
      • 금융 분야: 신용 평가 및 사기 탐지 시스템
      • 소매업: 고객 행동 예측 및 개인화 추천 시스템
      • 스마트 팩토리: 공장 내 불량품 예측 및 자동 품질 검사

      이러한 파이썬 머신러닝 애플리케이션은 단순히 예측 모델을 만드는 것에서 그치지 않고, 사용자가 실제로 활용할 수 있는 형태로 배포함으로써 실무에서의 활용도를 극대화할 수 있습니다.
      또한, Streamlit과 PyCaret으로 구현한 프로젝트는 포트폴리오로도 매우 강력한 경쟁력이 되어, 데이터 분석가나 머신러닝 엔지니어 취업 시에도 큰 도움이 됩니다.