audio_summarizer / README.md
Jeongsoo1975
feat: Hugging Face Spaces 배포 준비
d0b3084
|
raw
history blame
2.45 kB
metadata
title: 2 대화 화자 분리기 (AI)
emoji: 💬
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.44.0
app_file: app.py
pinned: false
license: mit
short_description: Gemini 2.0 Flash AI를 사용한 텍스트 화자 분리  맞춤법 교정

💬 2인 대화 화자 분리기 (AI)

Gemini 2.0 Flash AI를 사용한 한국어 2인 대화 텍스트 화자 분리 및 맞춤법 교정 서비스

🚀 주요 기능

  • 🎯 정확한 화자 분리: Google Gemini 2.0 Flash를 활용한 고정밀 화자 구분
  • ✏️ 맞춤법 교정: AI 기반 한국어 맞춤법 및 오타 교정
  • 📊 결과 비교: 원본, 화자 분리, 교정본 단계별 비교 가능
  • 👥 개별 화자 추출: 각 화자의 발언만 따로 추출하여 분석 가능
  • 🌐 웹 인터페이스: 사용하기 쉬운 Gradio 기반 웹 UI

📖 사용법

  1. 텍스트 입력: 2인 대화 텍스트를 입력창에 붙여넣기
  2. 처리 시작: '🚀 처리 시작' 버튼 클릭
  3. 결과 확인: 탭별로 다음 결과 확인:
    • 📝 원본 텍스트
    • 👥 화자 분리 (원본)
    • ✏️ 화자 분리 (교정)
    • 👤 화자1 대화
    • 👤 화자2 대화

⚙️ 기술 스택

  • AI 모델: Google Gemini 2.0 Flash
  • 웹 프레임워크: Gradio
  • 언어: Python
  • 최적화: 한국어 2인 대화

🎯 사용 예시

입력 텍스트

안녕하세요, 오늘 회의에 참석해주셔서 감사합니다. 네, 안녕하세요. 준비된 자료가 있나요? 네, 프레젠테이션 자료를 준비했습니다. 그럼 시작해볼까요?

출력 결과

[화자1] 안녕하세요, 오늘 회의에 참석해주셔서 감사합니다.
[화자2] 네, 안녕하세요. 준비된 자료가 있나요?
[화자1] 네, 프레젠테이션 자료를 준비했습니다. 그럼 시작해볼까요?

⚠️ 주의사항

  • 처리 시간은 텍스트 길이에 따라 30초~2분 소요
  • Google AI API 사용량 제한 있음
  • 2인 대화에 최적화됨
  • 대화 맥락이 명확할수록 정확도 향상

🔧 환경 설정

필요한 API 키

  • GOOGLE_API_KEY: Google AI (Gemini) API 키

의존성

python-dotenv
google-generativeai
gradio

📝 License

MIT License

🤝 Contributing

이슈나 개선사항이 있으시면 언제든 말씀해주세요!


Made with ❤️ using Google Gemini 2.0 Flash