xython (win32com + python)

음성인식 : 개요 및 설치

작성자

sjpark

작성일

2025-06-07 15:43

조회

165

음성인식 : 개요 및 설치

음성인식을 위해서, 우리는 먼저 설치할 것과 왜 그것을 설치하는지에 대해서 알아 볼것입니다. 여기서는

whisper라는 open AI에서 공개한프로그램을 사용할 것 입니다

가장 기본으로 알아야 할 것은

-
마이크로 음성이 전기신호로 변환됩니다

-
전기신호를 0과 1의 디지털로 변경을 합니다

-
변경한 디지털신호를 일정 크기로 잘라서 분석한다

-
음성을 분석해서 텍스트로 만든다

설치방법 : pip install openai-whisper

음성이 들어오면, 그것을 해석하는데 사용되는 음성분석기가 있다고 하고, 그것을 모델이라는

이름으로 부른다면, 그 모델은 7가지가 존재 합니다. 단, 이름은 계속해서 추가나 변경이 되고있습니다

있을 때 다운로드하는 방법은 아래와같이 사용하면, 없을때는 자동으로 다운로드 됩니다

현재는 아래의 7가지가 존재하며, 가끔 large-v3는 large-v3-turbo라고 불리기도 합니다. 그리고 필요한 모델이

model = whisper.load_model(whisper_model_name)

사용가능한 음성화일 형태

.wav, .mp3, .m4a, .webm, .ogg, .flac 등

가장 간단한 사용방법을 보여드리면, 만약 음성화일이 audio.mp3로 저장이 되어있을 경우, 아래와같이 사용하시면 됩니다

import whisper

model = whisper.load_model("turbo")

result = model.transcribe("audio.mp3")

print(result["text"])

xy_list : 어떻게 기본 list에서 새로운 자료형을 만드나- 006	25.06.08
음성인식 : 개요 및 설치	25.06.07
자동화는 어떻게 해야 하나?	25.06.07
pynal(기준) : 공휴일에 대한 자료	25.05.22
쫄면맛집- 일반정보	25.04.26
안드로이드 핸드폰으로 메시지 보내기	25.04.24
xy_excel(기초) : 2개의 엑셀화일에서 한쪽으로 모든 시트 복사해서 옮기기	25.04.15
xy_excel(기초) - 틀고정	25.04.12
util - 화면에 좌표로 빨간색 사각형 그리기	25.04.01
xy_outlook(기초) - 폴더에 대한 것들	25.03.29

xython - 패키지의 전체적인 용어 정의 (2025-03-16 update)	25.03.16
xython- 어떤 것이며, 어느 부분에 좋은가	24.08.21
xy_excel이란 무엇인가 (python + win32com + excel)	24.08.17
pcell의 기본 사용법	24.08.17
xython의 역사	23.06.18